সান ফ্রান্সিসকো ভিত্তিক স্টার্ট‑আপ গাইড ল্যাবস সোমবার একটি নতুন বড় ভাষা মডেল উন্মুক্ত করেছে, যার নাম স্টিয়ারলিং‑8B। এই মডেলটি ৮ বিলিয়ন প্যারামিটার নিয়ে গঠিত এবং সম্পূর্ণ ওপেন‑সোর্স হিসেবে প্রকাশিত হয়েছে। গাইড ল্যাবসের সিইও জুলিয়াস আদেবায়ো এবং চিফ সায়েন্স অফিসার আয়া আবদেলসালাম ইসমাইলের নেতৃত্বে এই প্রকল্পটি চালু হয়েছে, যার লক্ষ্য হল জটিল নিউরাল নেটওয়ার্কের সিদ্ধান্তের পেছনের কারণগুলো স্পষ্টভাবে প্রকাশ করা।
কৃত্রিম বুদ্ধিমত্তার ক্ষেত্রে ব্যাখ্যাযোগ্যতা দীর্ঘদিনের চ্যালেঞ্জ হিসেবে রয়ে গেছে; মডেলগুলো কখনও কখনও অপ্রত্যাশিত ফলাফল, অতিরিক্ত স্নেহপূর্ণ উত্তর বা সম্পূর্ণ ভুল তথ্য উৎপন্ন করে। এমন পরিস্থিতিতে ব্যবহারকারী ও ডেভেলপারদের জন্য মডেলের আচরণ বোঝা কঠিন হয়ে পড়ে। গাইড ল্যাবস এই সমস্যার সমাধান হিসেবে একটি নতুন আর্কিটেকচার প্রস্তাব করেছে, যেখানে মডেল উৎপাদিত প্রতিটি টোকেনের উৎস স্পষ্টভাবে চিহ্নিত করা যায়।
স্টিয়ারলিং‑8B-তে একটি বিশেষ “কনসেপ্ট লেয়ার” যুক্ত করা হয়েছে, যা প্রশিক্ষণ ডেটাকে পূর্বনির্ধারিত ক্যাটেগরিতে ভাগ করে। এই লেয়ারটি মডেলকে নির্দিষ্ট ধারণা—যেমন লিঙ্গ, হাস্যরস বা ঐতিহাসিক তথ্য—এর সাথে সরাসরি সংযুক্ত করে, ফলে টোকেনের উৎপত্তি ট্রেস করা সহজ হয়। যদিও এই পদ্ধতির জন্য প্রশিক্ষণের আগে ডেটা অ্যানোটেশন বাড়াতে হয়, গাইড ল্যাবস অন্যান্য এআই মডেলকে সহায়ক হিসেবে ব্যবহার করে অ্যানোটেশন প্রক্রিয়াকে স্বয়ংক্রিয় করেছে।
মডেলের আর্কিটেকচারটি এমনভাবে নকশা করা হয়েছে যে ব্যবহারকারী নির্দিষ্ট ধারণা সক্রিয় বা নিষ্ক্রিয় করতে পারে। উদাহরণস্বরূপ, যদি মডেলে লিঙ্গ সম্পর্কিত এক ট্রিলিয়ন সম্ভাব্য এনকোডিং থাকে, তবে এই লেয়ারটি সেই সব এনকোডিংকে আলাদা করে চিহ্নিত করে, ফলে প্রয়োজনমতো সেগুলোকে চালু বা বন্ধ করা যায়। আদেবায়ো এই পদ্ধতিকে “হলি গ্রেল” প্রশ্নের সমাধান হিসেবে উল্লেখ করেছেন, যদিও বর্তমান মডেলে এটি এখনও সূক্ষ্ম সমন্বয়ের প্রয়োজন।
আদেবায়োর গবেষণা ক্যারিয়ারটি এমআইটি-তে পিএইচডি করার সময় শুরু হয়। ২০২০ সালে তিনি একটি প্রভাবশালী পেপার প্রকাশ করেন, যেখানে বিদ্যমান ব্যাখ্যাযোগ্যতা পদ্ধতিগুলোর অস্থিতিশীলতা তুলে ধরা হয়। সেই গবেষণার ফলস্বরূপ তিনি এবং তার দল একটি নতুন নির্মাণ পদ্ধতি তৈরি করেন, যেখানে মডেলকে শূন্য থেকে এমনভাবে গড়ে তোলা হয় যে ব্যাখ্যা করা সহজ হয়, না যে পরে নিউরাল নেটওয়ার্কের ভেতরে বিশ্লেষণ করতে হয়।
স্টিয়ারলিং‑8B-র প্রধান বৈশিষ্ট্য হল টোকেন-টু-ডেটা ট্রেসেবিলিটি। মডেল যখন কোনো তথ্য প্রদান করে, তখন ব্যবহারকারী সরাসরি দেখতে পারে কোন প্রশিক্ষণ ডেটা সেই তথ্যের ভিত্তি। এটি বিশেষ করে তথ্য যাচাই, কপিরাইট চেক এবং মডেলের পক্ষপাত বিশ্লেষণে গুরুত্বপূর্ণ ভূমিকা রাখে। এছাড়া, মডেলটি হাস্যরসের সূক্ষ্মতা বা লিঙ্গ সংবেদনশীলতা কীভাবে গঠন করে তা বোঝার জন্যও ব্যবহার করা যাবে।
এই ধরনের ব্যাখ্যাযোগ্যতা কেবল গবেষকদের নয়, এন্টারপ্রাইজ গ্রাহকদের জন্যও মূল্যবান। সংবেদনশীল ডেটা নিয়ে কাজ করা প্রতিষ্ঠানগুলো মডেলের আউটপুটে অনিচ্ছাকৃত পক্ষপাত বা গোপনীয়তা লঙ্ঘন ঘটলে তা দ্রুত শনাক্ত করতে পারবে। একই সঙ্গে, ডেভেলপাররা মডেলের নির্দিষ্ট আচরণকে নিয়ন্ত্রণের জন্য কনসেপ্ট লেয়ারকে টগল করতে পারবে, ফলে প্রোডাক্টের নিরাপত্তা ও নৈতিকতা বাড়বে।
গাইড ল্যাবসের এই উদ্যোগটি শিল্পে নতুন মানদণ্ড স্থাপন করতে পারে। বর্তমানে বেশিরভাগ বড় ভাষা মডেলকে ব্ল্যাক বক্স হিসেবে বিবেচনা করা হয়; স্টিয়ারলিং‑8B এমন একটি মডেল যা শূন্য থেকে ব্যাখ্যাযোগ্যতা অন্তর্ভুক্ত করে তৈরি করা হয়েছে। যদি এই পদ্ধতি সফল হয়, তবে ভবিষ্যতে আরও বেশি এআই সিস্টেমে একই ধরনের কনসেপ্ট লেয়ার যুক্ত করা সম্ভব হবে, যা ব্যবহারকারীর আস্থা বাড়াবে এবং নিয়ন্ত্রক চাহিদা পূরণে সহায়তা করবে।
গাইড ল্যাবসের প্রকাশিত কোডটি গিটহাবের মাধ্যমে সকলের জন্য উন্মুক্ত, ফলে গবেষক ও ডেভেলপাররা নিজে মডেলটি ডাউনলোড, পরীক্ষা এবং উন্নত করতে পারবে। কোম্পানি উল্লেখ করেছে যে এই প্রোটোটাইপটি তাদের বৃহত্তম প্রমাণিক ধারণা, এবং ভবিষ্যতে আরও বড় স্কেলের মডেলেও একই আর্কিটেকচার প্রয়োগের পরিকল্পনা রয়েছে।
সারসংক্ষেপে, স্টিয়ারলিং‑8B কেবল একটি বড় ভাষা মডেল নয়; এটি এআই ব্যাখ্যাযোগ্যতার ক্ষেত্রে একটি নতুন দৃষ্টিকোণ উপস্থাপন করে। ডেটা ট্রেসিং, কনসেপ্ট নিয়ন্ত্রণ এবং স্বচ্ছতা এই মডেলের মূল বৈশিষ্ট্য, যা ভবিষ্যতে এআই সিস্টেমের নৈতিক ও প্রযুক্তিগত মানদণ্ডকে পুনর্গঠন করতে পারে। গাইড ল্যাবসের এই পদক্ষেপটি এআই গবেষণা ও শিল্পে নতুন আলো জ্বালানোর সম্ভাবনা রাখে।



