এন্টারপ্রাইজ AI প্রতিষ্ঠান Cohere, ভারতীয় AI সামিটের সময় নতুন একটি বহুভাষিক মডেল সিরিজ প্রকাশ করেছে। “Tiny Aya” নামে পরিচিত এই মডেলগুলো ওপেন‑ওজন, অর্থাৎ তাদের কোড সর্বজনীনভাবে উপলব্ধ এবং যে কেউ পরিবর্তন ও ব্যবহার করতে পারবে।
মডেলগুলো ৭০টিরও বেশি ভাষা সমর্থন করে এবং ল্যাপটপের মতো সাধারণ ডিভাইসে ইন্টারনেট সংযোগ ছাড়াই চালানো যায়। এই বৈশিষ্ট্য বিশেষ করে এমন দেশে গুরুত্বপূর্ণ, যেখানে নেটওয়ার্ক অবকাঠামো সীমিত।
Cohere-এর গবেষণা শাখা Cohere Labs এই মডেলগুলোকে প্রকাশ করেছে। বেস মডেলের আকার ৩.৩৫ বিলিয়ন প্যারামিটারের, যা এর জটিলতা ও ক্ষমতা নির্দেশ করে। মডেলটি দক্ষিণ এশিয়ার ভাষা, যেমন বাংলা, হিন্দি, পাঞ্জাবি, উর্দু, গুজরাটি, তামিল, তেলুগু ও মারাঠি, সমর্থন করে।
বিস্তৃত ভাষা সমর্থনের পাশাপাশি, কোম্পানি TinyAya‑Global নামের একটি সংস্করণও প্রকাশ করেছে, যা ব্যবহারকারীর নির্দেশনা অনুসরণে আরও দক্ষ। এই সংস্করণটি এমন অ্যাপ্লিকেশনের জন্য উপযোগী, যেগুলোকে একাধিক ভাষা একসাথে পরিচালনা করতে হয়।
প্রাদেশিক চাহিদা মেটাতে মডেল পরিবারে তিনটি বিশেষ সংস্করণ যুক্ত করা হয়েছে। TinyAya‑Earth আফ্রিকান ভাষার জন্য, TinyAya‑Fire দক্ষিণ এশিয়ার ভাষার জন্য, এবং TinyAya‑Water এশিয়া‑প্যাসিফিক, পশ্চিম এশিয়া ও ইউরোপের ভাষার জন্য তৈরি করা হয়েছে।
Cohere-এর বিবৃতি অনুযায়ী, প্রতিটি মডেলকে নির্দিষ্ট ভাষা ও সংস্কৃতির সঙ্গে গভীরভাবে যুক্ত করা হয়েছে, যাতে ব্যবহারকারীর কাছে আরও স্বাভাবিক ও নির্ভরযোগ্য অভিজ্ঞতা প্রদান করা যায়। একই সঙ্গে সব মডেলই বহুভাষিক কাভারেজ বজায় রাখে, ফলে গবেষক ও ডেভেলপাররা সহজে এগুলোকে অভিযোজিত ও উন্নত করতে পারবেন।
প্রশিক্ষণ প্রক্রিয়ায় একক ক্লাস্টার ব্যবহার করা হয়েছে, যেখানে ৬৪টি Nvidia H100 GPU একসাথে কাজ করেছে। তুলনামূলকভাবে সীমিত কম্পিউটিং রিসোর্সের মাধ্যমে এই মডেলগুলো তৈরি করা হয়েছে, যা গবেষণা ও ডেভেলপমেন্টের খরচ কমাতে সহায়তা করে।
ডেভেলপারদের জন্য একটি বড় সুবিধা হল মডেলগুলো সরাসরি ডিভাইসে চালানো যায়। ফলে অফলাইন অনুবাদ, টেক্সট বিশ্লেষণ ও অন্যান্য ভাষা-নির্ভর সেবা ইন্টারনেটের ওপর নির্ভর না করে সরবরাহ করা সম্ভব।
Cohere উল্লেখ করেছে, মডেলের অন্তর্নিহিত সফটওয়্যারটি ডিভাইস-অনুপ্রাণিত ব্যবহারের জন্য বিশেষভাবে ডিজাইন করা হয়েছে, যা অধিকাংশ সমমানের মডেলের তুলনায় কম গণনা ক্ষমতা প্রয়োজন। এই দিকটি বিশেষত মোবাইল ও এজ কম্পিউটিং পরিবেশে কার্যকর।
বহুভাষিকতা ও ভাষা বৈচিত্র্য সমৃদ্ধ দেশ যেমন ভারত, যেখানে বহুজনের মাতৃভাষা অনলাইন সেবার সীমাবদ্ধতা থেকে বঞ্চিত, সেখানে এই অফলাইন সক্ষমতা নতুন অ্যাপ্লিকেশন ও সেবার দরজা খুলে দেবে।
Cohere-এর এই উদ্যোগ গবেষক, স্টার্টআপ ও বড় প্রতিষ্ঠানকে স্থানীয় ভাষায় ভিত্তিক পণ্য দ্রুত তৈরি করতে সহায়তা করবে, ফলে ডিজিটাল অন্তর্ভুক্তি বাড়বে এবং ভাষা-সংক্রান্ত ডিজিটাল বিভাজন কমবে।
মডেলগুলো ওপেন‑ওজন হওয়ায়, যেকোনো ডেভেলপার কোড ডাউনলোড করে নিজের প্রয়োজন অনুযায়ী পরিবর্তন করতে পারবে। এটি কাস্টমাইজেশন ও সম্প্রদায়ভিত্তিক উন্নয়নের সুযোগ বাড়ায়, যা ভবিষ্যতে আরও সমৃদ্ধ ভাষা মডেল ইকোসিস্টেম গড়ে তুলতে সহায়ক হবে।



