সিলিকন ভ্যালি কোম্পানিগুলো স্ক্রিনের বদলে অডিওকে প্রধান ইন্টারফেস হিসেবে গ্রহণের পথে অগ্রসর। OpenAI গত দুই মাসে ইঞ্জিনিয়ারিং, প্রোডাক্ট ও গবেষণা দলগুলোকে একত্র করে অডিও মডেলগুলো সম্পূর্ণ পুনর্গঠন করেছে। এই কাজের লক্ষ্য এক বছর পরে বাজারে আসা অডিও‑প্রথম ব্যক্তিগত ডিভাইসের প্রস্তুতি নেওয়া।
OpenAI‑এর এই পুনর্গঠন মানে একই সময়ে একাধিক টিম একসাথে কাজ করে মডেলের গুণগত মান ও রিয়েল‑টাইম পারফরম্যান্স বাড়ানো। কোম্পানি জানিয়েছে যে নতুন অডিও মডেলটি ২০২৬ সালের শুরুর দিকে প্রকাশের পরিকল্পনা রয়েছে, যা কথোপকথন ভিত্তিক অ্যাপ্লিকেশনকে আরও স্বাভাবিক করে তুলবে।
প্রযুক্তি শিল্পে স্ক্রিনের ব্যবহার ধীরে ধীরে পটভূমিতে সরে যাচ্ছে, আর অডিওকে নতুন যোগাযোগের মাধ্যম হিসেবে দেখা হচ্ছে। যুক্তরাষ্ট্রের প্রায় এক তৃতীয়াংশ বাড়িতে স্মার্ট স্পিকার ইতিমধ্যে স্থায়ী হয়ে আছে, যা ভয়েস অ্যাসিস্ট্যান্টকে দৈনন্দিন জীবনের অংশ করে তুলেছে।
মেটা সম্প্রতি রে‑ব্যান স্মার্ট গ্লাসে পাঁচটি মাইক্রোফোনের অ্যারে যুক্ত করে একটি ফিচার চালু করেছে। এই ফিচার শোরগোলপূর্ণ পরিবেশে কথোপকথনকে দিকনির্দেশিতভাবে শোনার সুযোগ দেয়, ফলে ব্যবহারকারী মুখের দিকে তাকিয়ে না থেকেও পরিষ্কার শোনাতে পারে।
গুগল জুন মাসে “Audio Overviews” নামে একটি পরীক্ষামূলক ফিচার চালু করেছে। এই ফিচার অনুসন্ধানের ফলাফলকে কথোপকথনমূলক সারাংশে রূপান্তরিত করে, যাতে ব্যবহারকারী টেক্সটের বদলে শোনার মাধ্যমে দ্রুত তথ্য পেতে পারে।
টেসলা তার গাড়িতে Grok সহ বিভিন্ন বৃহৎ ভাষা মডেল (LLM) সংযুক্ত করছে। ফলে গাড়ির ভয়েস অ্যাসিস্ট্যান্ট ন্যাভিগেশন, তাপমাত্রা নিয়ন্ত্রণ এবং অন্যান্য ফিচারকে স্বাভাবিক কথোপকথনের মাধ্যমে পরিচালনা করতে পারবে।
স্টার্টআপ ক্ষেত্রেও অডিও‑কেন্দ্রিক পণ্যগুলোর সংখ্যা বাড়ছে। Humane AI Pin নামের স্ক্রিনবিহীন পরিধানযোগ্য ডিভাইসটি শত শত মিলিয়ন ডলার বিনিয়োগের পর বাজারে প্রবেশের চ্যালেঞ্জের মুখোমুখি হয়েছে, যা শিল্পে ঝুঁকি ও সম্ভাবনা উভয়ই তুলে ধরেছে।
Friend AI নামের একটি নেকলেস পেনড্যান্ট ব্যবহারকারীর দৈনন্দিন জীবন রেকর্ড করে এবং সঙ্গীর মতো সাড়া দেয়। যদিও এটি ব্যক্তিগত সহায়তা প্রদান করে, তবে গোপনীয়তা ও ডেটা নিরাপত্তা নিয়ে উদ্বেগও বাড়িয়ে তুলেছে।
স্যান্ডবার এবং পেবল প্রতিষ্ঠাতা এরিক মিগিকোস্কি নেতৃত্বাধীন আরেকটি স্টার্টআপ ২০২৬ সালে AI রিং বাজারে আনার পরিকল্পনা করেছে। এই রিংগুলো আঙুলের মাধ্যমে সরাসরি কথোপকথন সম্ভব করবে, ফলে হাতের মাধ্যমে কমান্ড দেওয়া সহজ হবে।
ডিভাইসের আকার যাই হোক না কেন, সব ক্ষেত্রেই অডিওকে প্রধান ইন্টারফেস হিসেবে গড়ে তোলার দৃষ্টিভঙ্গি একরূপ। বাড়ি, গাড়ি, এমনকি মুখের ওপরের গ্লাসও এখন অডিও যোগাযোগের প্ল্যাটফর্মে রূপান্তরিত হচ্ছে।
OpenAI‑এর নতুন অডিও মডেল ২০২৬ সালের শুরুর দিকে প্রকাশিত হবে বলে জানা গেছে। এই মডেলটি ভয়েস রিকগনিশন, রিয়েল‑টাইম ট্রান্সক্রিপশন এবং কথোপকথন জেনারেশন ক্ষেত্রে বর্তমান প্রযুক্তির সীমা অতিক্রম করার লক্ষ্য রাখে।
অডিও‑প্রথম পণ্যগুলোর ক্রমবর্ধমান উপস্থিতি ভবিষ্যতে ব্যবহারকারীর অভিজ্ঞতাকে রূপান্তরিত করবে বলে বিশ্লেষকরা অনুমান করছেন। স্ক্রিনের পরিবর্তে কণ্ঠের মাধ্যমে তথ্য গ্রহণ ও নিয়ন্ত্রণের প্রবণতা দৈনন্দিন কাজকে সহজতর করবে, এবং নতুন ব্যবসায়িক মডেল গড়ে তুলতে সহায়তা করবে।



