ElevenLabs-এর সহ-প্রতিষ্ঠাতা ও সিইও মাটি স্ট্যানিসজেভস্কি ওয়েব সামিট দোহা-তে উল্লেখ করেছেন যে কণ্ঠস্বর শীঘ্রই কৃত্রিম বুদ্ধিমত্তার প্রধান ব্যবহারিক মাধ্যম হয়ে উঠবে। তিনি জানিয়েছেন যে মডেলগুলো এখন শুধুমাত্র টেক্সট নয়, স্ক্রিন নয়, বরং কণ্ঠের মাধ্যমে মানুষের সঙ্গে যোগাযোগ করবে। এই ঘোষণার সঙ্গে কোম্পানি এই সপ্তাহে $500 মিলিয়ন তহবিল সংগ্রহ করে $11 বিলিয়ন মূল্যায়ন পেয়েছে।
স্ট্যানিসজেভস্কি ব্যাখ্যা করেছেন যে ElevenLabs-এর কণ্ঠ মডেলগুলো এখন মানবীয় আবেগ ও স্বরভঙ্গি অনুকরণে সক্ষম। এই মডেলগুলোকে বৃহৎ ভাষা মডেলের যুক্তি ক্ষমতার সঙ্গে যুক্ত করা হয়েছে, ফলে কণ্ঠের মাধ্যমে জটিল প্রশ্নের উত্তর দেওয়া সম্ভব হচ্ছে। তিনি উল্লেখ করেন, এই সংমিশ্রণ ব্যবহারকারীর অভিজ্ঞতাকে সম্পূর্ণ নতুন স্তরে নিয়ে যাবে।
ভয়েস ইন্টারফেসের বিস্তার মানে স্ক্রিনে ট্যাপ করা কমে যাবে এবং ফোনগুলো আবার পকেটে ফিরে আসবে, মানুষ বাস্তব জগতে বেশি সময় কাটাবে। কণ্ঠের মাধ্যমে প্রযুক্তি নিয়ন্ত্রণের ধারণা ভবিষ্যতে দৈনন্দিন জীবনের স্বাভাবিক অংশ হয়ে উঠবে। স্ট্যানিসজেভস্কি এই দৃষ্টিভঙ্গি ElevenLabs-এর দীর্ঘমেয়াদী কৌশলের মূল ভিত্তি হিসেবে উল্লেখ করেছেন।
$500 মিলিয়ন তহবিল সংগ্রহের পেছনে প্রধান বিনিয়োগকারী হিসেবে আইকনিক ক্যাপিটালের সেথ পিয়ারেপন্টের অংশগ্রহণ রয়েছে। এই রাউন্ডের পর কোম্পানির মূল্যায়ন $11 বিলিয়ন পৌঁছেছে, যা ভয়েস এআই-তে বাজারের উচ্চ প্রত্যাশা নির্দেশ করে। তহবিলটি গবেষণা, পণ্য উন্নয়ন এবং বৈশ্বিক বাজারে প্রসারিত করার জন্য ব্যবহার করা হবে।
ElevenLabs-এর সঙ্গে একই দৃষ্টিভঙ্গি শেয়ার করা বড় প্রযুক্তি কোম্পানিগুলোর মধ্যে রয়েছে ওপেনএআই এবং গুগল। উভয় সংস্থা তাদের পরবর্তী প্রজন্মের মডেলে কণ্ঠকে কেন্দ্রীয় উপাদান হিসেবে অন্তর্ভুক্ত করার পরিকল্পনা প্রকাশ করেছে। এই প্রবণতা দেখায় যে কণ্ঠস্বর কেবল একটি অতিরিক্ত ফিচার নয়, বরং কৃত্রিম বুদ্ধিমত্তার মূল স্তম্ভে পরিণত হচ্ছে।
অ্যাপলও কণ্ঠ-সংশ্লিষ্ট প্রযুক্তিতে বিনিয়োগ বাড়াচ্ছে, যদিও তা গোপনীয়ভাবে চলছে। Q.ai-এর মতো অধিগ্রহণের মাধ্যমে কোম্পানি সর্বদা সক্রিয় কণ্ঠ সেবা তৈরির ভিত্তি গড়ে তুলছে। এই কৌশল অ্যাপলকে ভবিষ্যতে কণ্ঠ-নিয়ন্ত্রিত ডিভাইসের বাজারে প্রতিযোগিতামূলক অবস্থানে রাখতে লক্ষ্য করে।
কণ্ঠস্বরের ব্যবহার এখন স্মার্টওয়াচ, গাড়ি এবং অন্যান্য পরিধানযোগ্য ডিভাইসে দ্রুত বিস্তৃত হচ্ছে। স্ক্রিনের পরিবর্তে কথোপকথনের মাধ্যমে কমান্ড দেওয়া ব্যবহারকারীর অভিজ্ঞতাকে সহজ ও দ্রুত করে তুলছে। ফলে ট্যাপ-ভিত্তিক ইনপুটের গুরুত্ব ক্রমান্বয়ে হ্রাস পাচ্ছে।
আইকনিক ক্যাপিটালের জেনারেল পার্টনার সেথ পিয়ারেপন্টও এই প্রবণতা সমর্থন করে বলেছেন, কী-বোর্ডের মতো ঐতিহ্যবাহী ইনপুট পদ্ধতি ধীরে ধীরে পুরনো হয়ে যাচ্ছে। যদিও গেমিং ও বিনোদনের ক্ষেত্রে স্ক্রিনের ভূমিকা এখনও গুরুত্বপূর্ণ, তবে কণ্ঠের মাধ্যমে নিয়ন্ত্রণ ভবিষ্যতের প্রধান পদ্ধতি হবে। তিনি আরও উল্লেখ করেন, এআই সিস্টেমগুলো আরও স্বয়ংক্রিয় হয়ে যাবে, যেখানে মডেলগুলো ব্যবহারকারীর পূর্বের প্রসঙ্গ ও স্মৃতি ব্যবহার করে কম নির্দেশে কাজ সম্পন্ন করবে।
স্ট্যানিসজেভস্কি ভবিষ্যতে কণ্ঠ সিস্টেমের স্মৃতি ও প্রসঙ্গ সংরক্ষণ ক্ষমতা বাড়বে বলে পূর্বাভাস দিয়েছেন। ব্যবহারকারী একবার কোনো কাজের জন্য নির্দেশ দিলে, পরবর্তী সময়ে সিস্টেমটি সেই তথ্য ব্যবহার করে স্বয়ংক্রিয়ভাবে সাড়া দেবে। এই ধরনের এজেন্টিক পরিবর্তন কণ্ঠ ইন্টারফেসকে আরও স্বাভাবিক ও কার্যকর করে তুলবে।
ডেভেলপার ও স্টার্টআপগুলো এখন কণ্ঠ-চালিত অ্যাপ্লিকেশন তৈরিতে নতুন সুযোগ পেয়েছে। ElevenLabs-এর উন্নত মডেলগুলো API হিসেবে উপলব্ধ, যা বিভিন্ন সেক্টরে কণ্ঠ ইন্টারফেস সংযোজনকে সহজ করে। ফলে স্বাস্থ্য, শিক্ষা এবং গ্রাহক সেবার মতো ক্ষেত্রগুলোতে কণ্ঠের মাধ্যমে পরিষেবা প্রদান দ্রুত বাস্তবায়িত হবে।



