লেমন স্লাইস, একটি ডিজিটাল অবতার তৈরির স্টার্ট‑আপ, সম্প্রতি ইয়েলো ক্যাপিটাল (YC) ও ম্যাট্রিক্স পার্টনার্স থেকে মোট ১০.৫ মিলিয়ন ডলার তহবিল সংগ্রহ করেছে। এই তহবিলের মূল উদ্দেশ্য হল ভিডিও‑ভিত্তিক AI অবতার প্রযুক্তি উন্নয়ন ও বাজারে দ্রুত প্রবেশ। কোম্পানির নতুন মডেল Lemon Slice‑2 একক ছবির মাধ্যমে সম্পূর্ণ অবতার তৈরি করতে সক্ষম, যা বিভিন্ন অ্যাপ্লিকেশনে ব্যবহার করা যাবে।
Lemon Slice‑2 একটি ২০ বিলিয়ন প্যারামিটারের ডিফিউশন মডেল, যা একক GPU-তে ২০ ফ্রেম প্রতি সেকেন্ড গতিতে লাইভ‑স্ট্রিম ভিডিও তৈরি করতে পারে। মডেলটি টেক্সট‑ভিত্তিক জ্ঞানভান্ডারের উপরে কাজ করে, ফলে অবতারটি গ্রাহক সেবা, হোমওয়ার্ক সহায়তা বা মানসিক স্বাস্থ্যের পরামর্শদাতা ইত্যাদি বিভিন্ন ভূমিকা পালন করতে পারে।
প্রযুক্তিটি API ও এমবেডেবল উইজেটের মাধ্যমে সরবরাহ করা হবে, যা কোনো ওয়েবসাইটে এক লাইনের কোড যোগ করলেই সংযুক্ত করা যায়। ব্যবহারকারী অবতার তৈরি হওয়ার পর পটভূমি, স্টাইল ও চেহারা যেকোনো সময় পরিবর্তন করতে পারবে, ফলে কাস্টমাইজেশন সহজে সম্ভব হবে।
মানবসদৃশ অবতার ছাড়াও লেমন স্লাইস অমানবিক চরিত্রের সৃষ্টিতেও মনোযোগ দিচ্ছে, যাতে বিভিন্ন শিল্পের চাহিদা পূরণ করা যায়। এই অবতারগুলোর কণ্ঠস্বর ElevenLabs-এর টেক্সট‑টু‑স্পিচ প্রযুক্তি ব্যবহার করে তৈরি করা হয়, যা প্রাকৃতিক ও স্পষ্ট শোনায়।
কোম্পানিটি ২০২৪ সালে লিনা কোলুচি, সিডনি প্রিমাস এবং অ্যান্ড্রু ওয়িটজের নেতৃত্বে প্রতিষ্ঠিত হয়। প্রতিষ্ঠাতারা উল্লেখ করেন যে, বর্তমান বাজারে বিদ্যমান অবতার সমাধানগুলো প্রায়ই অস্বস্তিকর ও কঠোর দেখায়, যা ব্যবহারকারীর অভিজ্ঞতাকে ক্ষতিগ্রস্ত করে।
লেমন স্লাইসের দৃষ্টিভঙ্গি হল ভিডিওকে ইন্টারেক্টিভ স্তরে নিয়ে যাওয়া, যাতে চ্যাটবটের মতোই রিয়েল‑টাইমে ব্যবহারকারী সঙ্গে সংলাপ করা যায়। এই লক্ষ্য অর্জনের জন্য তারা ভিডিও মডেলের সম্ভাবনা আগে থেকেই অনুসন্ধান করে আসছে।
মডেলটির ২০ বিলিয়ন প্যারামিটার বিশাল ডেটাসেট থেকে শিখে, শোরগোলপূর্ণ ইনপুটকে পরিষ্কার আউটপুটে রূপান্তরিত করে। ফলে একক ছবি থেকে উচ্চমানের, গতিশীল অবতার তৈরি করা সম্ভব হয়, যা পূর্বের স্থির ছবি‑ভিত্তিক সমাধানের তুলনায় উল্লেখযোগ্য পার্থক্য সৃষ্টি করে।
প্রযুক্তির স্কেলেবিলিটি বাড়াতে একক GPU-তে কাজ করার ক্ষমতা গুরুত্বপূর্ণ, কারণ এটি ছোট ব্যবসা ও স্টার্ট‑আপের জন্য খরচ কমিয়ে দেয়। ২০ fps লাইভ‑স্ট্রিমিং ক্ষমতা রিয়েল‑টাইম ইন্টারঅ্যাকশনকে সমর্থন করে, যা গ্রাহক সেবা বা শিক্ষামূলক প্ল্যাটফর্মে তাত্ক্ষণিক প্রতিক্রিয়া প্রদান করতে সহায়ক।
API-র মাধ্যমে ডেভেলপাররা সহজেই অবতারকে নিজেদের অ্যাপ্লিকেশনে সংযুক্ত করতে পারে, এবং উইজেটের এক লাইনের কোড ইনস্টলেশন প্রক্রিয়াকে দ্রুত করে। এই পদ্ধতি প্রযুক্তি গ্রহণের বাধা কমিয়ে, দ্রুত পাইলট প্রকল্প চালু করার সুযোগ দেয়।
ভয়েস জেনারেশন ElevenLabs-এর অডিও মডেল ব্যবহার করে, যা বিভিন্ন ভাষা ও স্বরভঙ্গি সমর্থন করে। ফলে অবতারগুলো শুধুমাত্র দৃষ্টিগোচর নয়, শোনার দিক থেকেও বাস্তবসম্মত হয়, যা ব্যবহারকারীর বিশ্বাসযোগ্যতা বাড়ায়।
লেমন স্লাইসের তহবিল সংগ্রহের পরবর্তী ধাপ হল মডেলকে বাণিজ্যিক পর্যায়ে নিয়ে যাওয়া এবং বৃহত্তর কর্পোরেট গ্রাহকদের কাছে সেবা প্রদান করা। তহবিলের অংশটি গবেষণা ও উন্নয়ন, ক্লাউড অবকাঠামো এবং মার্কেটিংয়ে ব্যয় করা হবে।
সারসংক্ষেপে, লেমন স্লাইসের ১০.৫ মিলিয়ন ডলার তহবিল এবং ২০ বিলিয়ন প্যারামিটারের Lemon Slice‑2 মডেল ভিডিও‑ভিত্তিক AI অবতার তৈরির নতুন মানদণ্ড স্থাপন করতে চায়। API ও উইজেটের সহজ সংযোজন, কাস্টমাইজযোগ্য ডিজাইন এবং ElevenLabs-এর ভয়েস টেকনোলজি একত্রে ব্যবসা ও শিক্ষার ক্ষেত্রে রূপান্তরমূলক সম্ভাবনা তৈরি করবে।



