18 C
Dhaka
Friday, January 30, 2026
Google search engine
Homeপ্রযুক্তিOpenAI ও অন্যান্য প্রযুক্তি জায়ান্টের অডিও এআইতে বৃহৎ বিনিয়োগ

OpenAI ও অন্যান্য প্রযুক্তি জায়ান্টের অডিও এআইতে বৃহৎ বিনিয়োগ

সিলিকন ভ্যালি কোম্পানিগুলো স্ক্রিনের বদলে অডিওকে প্রধান ইন্টারফেস হিসেবে গ্রহণের পথে অগ্রসর। OpenAI গত দুই মাসে ইঞ্জিনিয়ারিং, প্রোডাক্ট ও গবেষণা দলগুলোকে একত্র করে অডিও মডেলগুলো সম্পূর্ণ পুনর্গঠন করেছে। এই কাজের লক্ষ্য এক বছর পরে বাজারে আসা অডিও‑প্রথম ব্যক্তিগত ডিভাইসের প্রস্তুতি নেওয়া।

OpenAI‑এর এই পুনর্গঠন মানে একই সময়ে একাধিক টিম একসাথে কাজ করে মডেলের গুণগত মান ও রিয়েল‑টাইম পারফরম্যান্স বাড়ানো। কোম্পানি জানিয়েছে যে নতুন অডিও মডেলটি ২০২৬ সালের শুরুর দিকে প্রকাশের পরিকল্পনা রয়েছে, যা কথোপকথন ভিত্তিক অ্যাপ্লিকেশনকে আরও স্বাভাবিক করে তুলবে।

প্রযুক্তি শিল্পে স্ক্রিনের ব্যবহার ধীরে ধীরে পটভূমিতে সরে যাচ্ছে, আর অডিওকে নতুন যোগাযোগের মাধ্যম হিসেবে দেখা হচ্ছে। যুক্তরাষ্ট্রের প্রায় এক তৃতীয়াংশ বাড়িতে স্মার্ট স্পিকার ইতিমধ্যে স্থায়ী হয়ে আছে, যা ভয়েস অ্যাসিস্ট্যান্টকে দৈনন্দিন জীবনের অংশ করে তুলেছে।

মেটা সম্প্রতি রে‑ব্যান স্মার্ট গ্লাসে পাঁচটি মাইক্রোফোনের অ্যারে যুক্ত করে একটি ফিচার চালু করেছে। এই ফিচার শোরগোলপূর্ণ পরিবেশে কথোপকথনকে দিকনির্দেশিতভাবে শোনার সুযোগ দেয়, ফলে ব্যবহারকারী মুখের দিকে তাকিয়ে না থেকেও পরিষ্কার শোনাতে পারে।

গুগল জুন মাসে “Audio Overviews” নামে একটি পরীক্ষামূলক ফিচার চালু করেছে। এই ফিচার অনুসন্ধানের ফলাফলকে কথোপকথনমূলক সারাংশে রূপান্তরিত করে, যাতে ব্যবহারকারী টেক্সটের বদলে শোনার মাধ্যমে দ্রুত তথ্য পেতে পারে।

টেসলা তার গাড়িতে Grok সহ বিভিন্ন বৃহৎ ভাষা মডেল (LLM) সংযুক্ত করছে। ফলে গাড়ির ভয়েস অ্যাসিস্ট্যান্ট ন্যাভিগেশন, তাপমাত্রা নিয়ন্ত্রণ এবং অন্যান্য ফিচারকে স্বাভাবিক কথোপকথনের মাধ্যমে পরিচালনা করতে পারবে।

স্টার্টআপ ক্ষেত্রেও অডিও‑কেন্দ্রিক পণ্যগুলোর সংখ্যা বাড়ছে। Humane AI Pin নামের স্ক্রিনবিহীন পরিধানযোগ্য ডিভাইসটি শত শত মিলিয়ন ডলার বিনিয়োগের পর বাজারে প্রবেশের চ্যালেঞ্জের মুখোমুখি হয়েছে, যা শিল্পে ঝুঁকি ও সম্ভাবনা উভয়ই তুলে ধরেছে।

Friend AI নামের একটি নেকলেস পেনড্যান্ট ব্যবহারকারীর দৈনন্দিন জীবন রেকর্ড করে এবং সঙ্গীর মতো সাড়া দেয়। যদিও এটি ব্যক্তিগত সহায়তা প্রদান করে, তবে গোপনীয়তা ও ডেটা নিরাপত্তা নিয়ে উদ্বেগও বাড়িয়ে তুলেছে।

স্যান্ডবার এবং পেবল প্রতিষ্ঠাতা এরিক মিগিকোস্কি নেতৃত্বাধীন আরেকটি স্টার্টআপ ২০২৬ সালে AI রিং বাজারে আনার পরিকল্পনা করেছে। এই রিংগুলো আঙুলের মাধ্যমে সরাসরি কথোপকথন সম্ভব করবে, ফলে হাতের মাধ্যমে কমান্ড দেওয়া সহজ হবে।

ডিভাইসের আকার যাই হোক না কেন, সব ক্ষেত্রেই অডিওকে প্রধান ইন্টারফেস হিসেবে গড়ে তোলার দৃষ্টিভঙ্গি একরূপ। বাড়ি, গাড়ি, এমনকি মুখের ওপরের গ্লাসও এখন অডিও যোগাযোগের প্ল্যাটফর্মে রূপান্তরিত হচ্ছে।

OpenAI‑এর নতুন অডিও মডেল ২০২৬ সালের শুরুর দিকে প্রকাশিত হবে বলে জানা গেছে। এই মডেলটি ভয়েস রিকগনিশন, রিয়েল‑টাইম ট্রান্সক্রিপশন এবং কথোপকথন জেনারেশন ক্ষেত্রে বর্তমান প্রযুক্তির সীমা অতিক্রম করার লক্ষ্য রাখে।

অডিও‑প্রথম পণ্যগুলোর ক্রমবর্ধমান উপস্থিতি ভবিষ্যতে ব্যবহারকারীর অভিজ্ঞতাকে রূপান্তরিত করবে বলে বিশ্লেষকরা অনুমান করছেন। স্ক্রিনের পরিবর্তে কণ্ঠের মাধ্যমে তথ্য গ্রহণ ও নিয়ন্ত্রণের প্রবণতা দৈনন্দিন কাজকে সহজতর করবে, এবং নতুন ব্যবসায়িক মডেল গড়ে তুলতে সহায়তা করবে।

৬৫/১০০ ১টি সোর্স থেকে যাচাইকৃত।
আমরা ছাড়াও প্রকাশ করেছে: TechCrunch
প্রযুক্তি প্রতিবেদক
প্রযুক্তি প্রতিবেদক
AI-powered প্রযুক্তি content writer managed by NewsForge
RELATED ARTICLES

LEAVE A REPLY

Please enter your comment!
Please enter your name here

- Advertisment -
Google search engine

Most Popular

Recent Comments