দিল্লিতে অনুষ্ঠিত ইন্ডিয়া এআই ইম্প্যাক্ট সামিটে মঙ্গলবার ভারতীয় এআই স্টার্ট‑আপ সারভাম তার সর্বশেষ বড় ভাষা মডেল (LLM) সিরিজের উদ্বোধন করেছে। ৩০ বিলিয়ন এবং ১০৫ বিলিয়ন প্যারামিটারের দুটি মডেল, পাশাপাশি টেক্সট‑টু‑স্পিচ, স্পিচ‑টু‑টেক্সট এবং ডকুমেন্ট বিশ্লেষণের জন্য ভিশন মডেল প্রকাশের মাধ্যমে কোম্পানি ছোট, দক্ষ ও ওপেন‑সোর্স এআই সমাধানের বাজারে স্থান তৈরি করার লক্ষ্য প্রকাশ করেছে।
সারভামের নতুন মডেলগুলো পূর্বের ২ বিলিয়ন প্যারামিটারের সারভাম‑১ মডেল থেকে উল্লেখযোগ্যভাবে উন্নত। ৩০বিলিয়ন ও ১০৫বিলিয়ন প্যারামিটারের মডেলগুলো মিক্সচার‑অফ‑এক্সপার্টস (Mixture‑of‑Experts) আর্কিটেকচার ব্যবহার করে, যেখানে এক সময়ে মোট প্যারামিটারের কেবল একটি অংশ সক্রিয় থাকে। এই পদ্ধতি গণনা খরচ কমিয়ে দেয় এবং একই সঙ্গে উচ্চ পারফরম্যান্স বজায় রাখে।
প্রতিটি মডেলের টোকেন প্রসঙ্গের সীমা ভিন্ন। ৩০বিলিয়ন মডেল ৩২,০০০ টোকেন পর্যন্ত প্রসঙ্গ সমর্থন করে, যা রিয়েল‑টাইম কথোপকথনের জন্য উপযোগী। অন্যদিকে ১০৫বিলিয়ন মডেল ১,২৮,০০০ টোকেন পর্যন্ত প্রসঙ্গ পরিচালনা করতে পারে, ফলে জটিল বহু‑ধাপ যুক্তি প্রয়োজনীয় কাজগুলোতে কার্যকরী।
সারভাম উল্লেখ করেছে যে এই মডেলগুলো কোনো বিদ্যমান ওপেন‑সোর্স সিস্টেমের উপর ফাইন‑টিউন করা হয়নি; বরং শূন্য থেকে প্রশিক্ষণ নেওয়া হয়েছে। ৩০বিলিয়ন মডেল প্রায় ১৬ ট্রিলিয়ন টোকেনের টেক্সট ডেটা দিয়ে প্রি‑ট্রেইন করা হয়েছে, আর ১০৫বিলিয়ন মডেল বহু ভারতীয় ভাষা অন্তর্ভুক্ত ট্রিলিয়ন টোকেনের ডেটাসেটের ওপর প্রশিক্ষিত। এই ব্যাপক প্রশিক্ষণ মডেলকে স্থানীয় ভাষা ও ব্যবহারিক পরিস্থিতিতে কার্যকর করে তুলবে।
প্রশিক্ষণের জন্য প্রয়োজনীয় কম্পিউটিং রিসোর্স ভারত সরকারের চালু করা ইন্ডিয়া এআই মিশন থেকে সরবরাহ করা হয়েছে। ডেটা সেন্টার অপারেটর ইয়োটা অবকাঠামো প্রদান করেছে, আর নভিডিয়া প্রযুক্তিগত সহায়তা দিয়েছে। এই সহযোগিতা দেশীয় এআই ইকোসিস্টেমের স্বনির্ভরতা বাড়াতে সরকারের উদ্যোগের সাথে সামঞ্জস্যপূর্ণ।
সারভামের নেতৃত্ব দল মডেল স্কেলিংকে ধীরে ধীরে এগিয়ে নেওয়ার পরিকল্পনা প্রকাশ করেছে, যেখানে কাঁচা প্যারামিটারের সংখ্যা বাড়ানোর চেয়ে বাস্তবিক প্রয়োগে গুরুত্ব দেওয়া হবে। তারা জোর দিয়েছেন, স্কেলিং প্রক্রিয়ায় সতর্কতা অবলম্বন করা এবং ব্যবহারিক চাহিদা অনুযায়ী মডেলকে অপ্টিমাইজ করা গুরুত্বপূর্ণ।
নতুন মডেলগুলো রিয়েল‑টাইম অ্যাপ্লিকেশন, যেমন ভয়েস‑বেসড সহকারী এবং ভারতীয় ভাষায় চ্যাটবটের জন্য ডিজাইন করা হয়েছে। বৃহৎ প্রসঙ্গ উইন্ডো এবং মিক্সচার‑অফ‑এক্সপার্টস আর্কিটেকচার একসাথে ব্যবহার করে, এই সিস্টেমগুলো কম্পিউটেশনাল ব্যয় কমিয়ে দ্রুত প্রতিক্রিয়া প্রদান করতে সক্ষম।
সারভামের এই উদ্যোগ ভারতীয় এআই বাজারে স্থানীয় সমাধানের চাহিদা পূরণে একটি গুরুত্বপূর্ণ পদক্ষেপ হিসেবে দেখা হচ্ছে। দেশীয় ভাষা ও সংস্কৃতির সাথে সামঞ্জস্যপূর্ণ মডেল তৈরি করে, কোম্পানি আন্তর্জাতিক দিগন্তে বড় কোম্পানিগুলোর সঙ্গে প্রতিযোগিতা করার পাশাপাশি স্থানীয় স্টার্ট‑আপ ও ডেভেলপারদের জন্য নতুন সুযোগ তৈরি করতে চায়।
এই মডেলগুলোর প্রকাশের ফলে ভারতীয় ভাষা প্রক্রিয়াকরণে গবেষণা ও উন্নয়নের গতি ত্বরান্বিত হওয়ার সম্ভাবনা রয়েছে। ভবিষ্যতে শিক্ষা, স্বাস্থ্য, সরকারি সেবা এবং গ্রামীণ এলাকায় ডিজিটাল অন্তর্ভুক্তি বাড়াতে এই ধরনের প্রযুক্তি গুরুত্বপূর্ণ ভূমিকা রাখতে পারে।
সারভাম এখন থেকে এই মডেলগুলোকে বিভিন্ন শিল্পে বাস্তবায়নের জন্য পার্টনারশিপ ও ডেভেলপার প্রোগ্রাম চালু করার পরিকল্পনা করেছে, যাতে স্থানীয় ব্যবসা ও সেবা প্রদানকারীরা সহজে এই প্রযুক্তি গ্রহণ করতে পারে। এভাবে দেশীয় এআই ইকোসিস্টেমের বিকাশে নতুন দিগন্ত উন্মোচিত হবে বলে আশা করা হচ্ছে।



