20.8 C
Dhaka
Tuesday, February 24, 2026
Google search engine
Homeপ্রযুক্তিগাইড ল্যাবসের স্টিয়ারলিং‑8B: ব্যাখ্যাযোগ্য ৮ বিলিয়ন প্যারামিটারের নতুন ভাষা মডেল

গাইড ল্যাবসের স্টিয়ারলিং‑8B: ব্যাখ্যাযোগ্য ৮ বিলিয়ন প্যারামিটারের নতুন ভাষা মডেল

সান ফ্রান্সিসকো ভিত্তিক স্টার্ট‑আপ গাইড ল্যাবস সোমবার একটি নতুন বড় ভাষা মডেল উন্মুক্ত করেছে, যার নাম স্টিয়ারলিং‑8B। এই মডেলটি ৮ বিলিয়ন প্যারামিটার নিয়ে গঠিত এবং সম্পূর্ণ ওপেন‑সোর্স হিসেবে প্রকাশিত হয়েছে। গাইড ল্যাবসের সিইও জুলিয়াস আদেবায়ো এবং চিফ সায়েন্স অফিসার আয়া আবদেলসালাম ইসমাইলের নেতৃত্বে এই প্রকল্পটি চালু হয়েছে, যার লক্ষ্য হল জটিল নিউরাল নেটওয়ার্কের সিদ্ধান্তের পেছনের কারণগুলো স্পষ্টভাবে প্রকাশ করা।

কৃত্রিম বুদ্ধিমত্তার ক্ষেত্রে ব্যাখ্যাযোগ্যতা দীর্ঘদিনের চ্যালেঞ্জ হিসেবে রয়ে গেছে; মডেলগুলো কখনও কখনও অপ্রত্যাশিত ফলাফল, অতিরিক্ত স্নেহপূর্ণ উত্তর বা সম্পূর্ণ ভুল তথ্য উৎপন্ন করে। এমন পরিস্থিতিতে ব্যবহারকারী ও ডেভেলপারদের জন্য মডেলের আচরণ বোঝা কঠিন হয়ে পড়ে। গাইড ল্যাবস এই সমস্যার সমাধান হিসেবে একটি নতুন আর্কিটেকচার প্রস্তাব করেছে, যেখানে মডেল উৎপাদিত প্রতিটি টোকেনের উৎস স্পষ্টভাবে চিহ্নিত করা যায়।

স্টিয়ারলিং‑8B-তে একটি বিশেষ “কনসেপ্ট লেয়ার” যুক্ত করা হয়েছে, যা প্রশিক্ষণ ডেটাকে পূর্বনির্ধারিত ক্যাটেগরিতে ভাগ করে। এই লেয়ারটি মডেলকে নির্দিষ্ট ধারণা—যেমন লিঙ্গ, হাস্যরস বা ঐতিহাসিক তথ্য—এর সাথে সরাসরি সংযুক্ত করে, ফলে টোকেনের উৎপত্তি ট্রেস করা সহজ হয়। যদিও এই পদ্ধতির জন্য প্রশিক্ষণের আগে ডেটা অ্যানোটেশন বাড়াতে হয়, গাইড ল্যাবস অন্যান্য এআই মডেলকে সহায়ক হিসেবে ব্যবহার করে অ্যানোটেশন প্রক্রিয়াকে স্বয়ংক্রিয় করেছে।

মডেলের আর্কিটেকচারটি এমনভাবে নকশা করা হয়েছে যে ব্যবহারকারী নির্দিষ্ট ধারণা সক্রিয় বা নিষ্ক্রিয় করতে পারে। উদাহরণস্বরূপ, যদি মডেলে লিঙ্গ সম্পর্কিত এক ট্রিলিয়ন সম্ভাব্য এনকোডিং থাকে, তবে এই লেয়ারটি সেই সব এনকোডিংকে আলাদা করে চিহ্নিত করে, ফলে প্রয়োজনমতো সেগুলোকে চালু বা বন্ধ করা যায়। আদেবায়ো এই পদ্ধতিকে “হলি গ্রেল” প্রশ্নের সমাধান হিসেবে উল্লেখ করেছেন, যদিও বর্তমান মডেলে এটি এখনও সূক্ষ্ম সমন্বয়ের প্রয়োজন।

আদেবায়োর গবেষণা ক্যারিয়ারটি এমআইটি-তে পিএইচডি করার সময় শুরু হয়। ২০২০ সালে তিনি একটি প্রভাবশালী পেপার প্রকাশ করেন, যেখানে বিদ্যমান ব্যাখ্যাযোগ্যতা পদ্ধতিগুলোর অস্থিতিশীলতা তুলে ধরা হয়। সেই গবেষণার ফলস্বরূপ তিনি এবং তার দল একটি নতুন নির্মাণ পদ্ধতি তৈরি করেন, যেখানে মডেলকে শূন্য থেকে এমনভাবে গড়ে তোলা হয় যে ব্যাখ্যা করা সহজ হয়, না যে পরে নিউরাল নেটওয়ার্কের ভেতরে বিশ্লেষণ করতে হয়।

স্টিয়ারলিং‑8B-র প্রধান বৈশিষ্ট্য হল টোকেন-টু-ডেটা ট্রেসেবিলিটি। মডেল যখন কোনো তথ্য প্রদান করে, তখন ব্যবহারকারী সরাসরি দেখতে পারে কোন প্রশিক্ষণ ডেটা সেই তথ্যের ভিত্তি। এটি বিশেষ করে তথ্য যাচাই, কপিরাইট চেক এবং মডেলের পক্ষপাত বিশ্লেষণে গুরুত্বপূর্ণ ভূমিকা রাখে। এছাড়া, মডেলটি হাস্যরসের সূক্ষ্মতা বা লিঙ্গ সংবেদনশীলতা কীভাবে গঠন করে তা বোঝার জন্যও ব্যবহার করা যাবে।

এই ধরনের ব্যাখ্যাযোগ্যতা কেবল গবেষকদের নয়, এন্টারপ্রাইজ গ্রাহকদের জন্যও মূল্যবান। সংবেদনশীল ডেটা নিয়ে কাজ করা প্রতিষ্ঠানগুলো মডেলের আউটপুটে অনিচ্ছাকৃত পক্ষপাত বা গোপনীয়তা লঙ্ঘন ঘটলে তা দ্রুত শনাক্ত করতে পারবে। একই সঙ্গে, ডেভেলপাররা মডেলের নির্দিষ্ট আচরণকে নিয়ন্ত্রণের জন্য কনসেপ্ট লেয়ারকে টগল করতে পারবে, ফলে প্রোডাক্টের নিরাপত্তা ও নৈতিকতা বাড়বে।

গাইড ল্যাবসের এই উদ্যোগটি শিল্পে নতুন মানদণ্ড স্থাপন করতে পারে। বর্তমানে বেশিরভাগ বড় ভাষা মডেলকে ব্ল্যাক বক্স হিসেবে বিবেচনা করা হয়; স্টিয়ারলিং‑8B এমন একটি মডেল যা শূন্য থেকে ব্যাখ্যাযোগ্যতা অন্তর্ভুক্ত করে তৈরি করা হয়েছে। যদি এই পদ্ধতি সফল হয়, তবে ভবিষ্যতে আরও বেশি এআই সিস্টেমে একই ধরনের কনসেপ্ট লেয়ার যুক্ত করা সম্ভব হবে, যা ব্যবহারকারীর আস্থা বাড়াবে এবং নিয়ন্ত্রক চাহিদা পূরণে সহায়তা করবে।

গাইড ল্যাবসের প্রকাশিত কোডটি গিটহাবের মাধ্যমে সকলের জন্য উন্মুক্ত, ফলে গবেষক ও ডেভেলপাররা নিজে মডেলটি ডাউনলোড, পরীক্ষা এবং উন্নত করতে পারবে। কোম্পানি উল্লেখ করেছে যে এই প্রোটোটাইপটি তাদের বৃহত্তম প্রমাণিক ধারণা, এবং ভবিষ্যতে আরও বড় স্কেলের মডেলেও একই আর্কিটেকচার প্রয়োগের পরিকল্পনা রয়েছে।

সারসংক্ষেপে, স্টিয়ারলিং‑8B কেবল একটি বড় ভাষা মডেল নয়; এটি এআই ব্যাখ্যাযোগ্যতার ক্ষেত্রে একটি নতুন দৃষ্টিকোণ উপস্থাপন করে। ডেটা ট্রেসিং, কনসেপ্ট নিয়ন্ত্রণ এবং স্বচ্ছতা এই মডেলের মূল বৈশিষ্ট্য, যা ভবিষ্যতে এআই সিস্টেমের নৈতিক ও প্রযুক্তিগত মানদণ্ডকে পুনর্গঠন করতে পারে। গাইড ল্যাবসের এই পদক্ষেপটি এআই গবেষণা ও শিল্পে নতুন আলো জ্বালানোর সম্ভাবনা রাখে।

৬৫/১০০ ১টি সোর্স থেকে যাচাইকৃত।
আমরা ছাড়াও প্রকাশ করেছে: TechCrunch
প্রযুক্তি প্রতিবেদক
প্রযুক্তি প্রতিবেদক
AI-powered প্রযুক্তি content writer managed by NewsForge
RELATED ARTICLES

LEAVE A REPLY

Please enter your comment!
Please enter your name here

- Advertisment -
Google search engine

Most Popular

Recent Comments