এক্সআইএআই (Xai) এর সর্বশেষ ভাষা মডেল গ্রোক (Grok) ভিডিও গেম “বালডারস গেট” সংক্রান্ত প্রশ্নের উত্তর দিতে সক্ষমতা প্রদর্শন করেছে। এই ফলাফলটি প্রকাশের আগে কয়েক দিন মডেল রিলিজে বিলম্ব ঘটেছিল, কারণ এলন মাস্ক (Elon Musk) উত্তরগুলোর গুণগত মানে অসন্তোষ প্রকাশ করেন। ফলে, অন্যান্য প্রকল্পে কাজ করা শীর্ষস্থানীয় ইঞ্জিনিয়ারদের এই কাজের জন্য পুনঃনিয়োগ করা হয়।
কৃত্রিম বুদ্ধিমত্তা ক্ষেত্রের বিভিন্ন সংস্থা ভিন্ন ভিন্ন লক্ষ্য অনুসরণ করে। উদাহরণস্বরূপ, ওপেনএআই (Openai) প্রধানত শেষ ব্যবহারকারীর জন্য পণ্য তৈরি করে, আর অ্যানথ্রপিক (Anthropic) এন্টারপ্রাইজ গ্রাহকদের দিকে বেশি মনোযোগ দেয়। অন্যদিকে, এক্সআইএআই ভিডিও গেমের গাইডলাইন ও ওয়াকথ্রু তৈরিতে বিশেষ গুরুত্ব দিচ্ছে।
সম্প্রতি বিজনেস ইনসাইডার (Business Insider) একটি বিশদ প্রতিবেদন প্রকাশ করে, যেখানে এক্সআইএআই এবং স্পেসএক্স (SpaceX) এর অধিগ্রহণকৃত এই স্টার্টআপের অভ্যন্তরীণ কাজের পরিবেশের কিছু দিক তুলে ধরা হয়েছে। প্রতিবেদনে উল্লেখ করা হয়েছে, গত বছর একটি মডেল রিলিজের সময় গ্রোকের বালডারস গেট সংক্রান্ত উত্তরগুলো এলন মাস্কের প্রত্যাশা পূরণ না করার ফলে রিলিজ কয়েক দিন পিছিয়ে যায়।
এই ঘটনার পর, কোম্পানির উচ্চপদস্থ ইঞ্জিনিয়াররা অন্যান্য গবেষণা প্রকল্প থেকে বেরিয়ে এসে গ্রোকের গেম-সংক্রান্ত জ্ঞান উন্নত করার কাজ করেন। তারা গেমের মেকানিক্স, চরিত্রের ক্ষমতা ও কৌশলগত উপাদানগুলো বিশদভাবে বিশ্লেষণ করে মডেলের উত্তরকে আরও সঠিক ও ব্যবহারযোগ্য করার চেষ্টা করেন।
বালডারস গেটের প্রশ্নগুলো মূল্যায়নের জন্য একটি স্বতন্ত্র বেঞ্চমার্ক তৈরি করা হয়, যার নাম রাখা হয়েছে “BaldurBench”। এই বেঞ্চমার্কে পাঁচটি সাধারণ প্রশ্ন অন্তর্ভুক্ত করা হয়, যা গেমের মূল কাহিনী, চরিত্রের বিকাশ, যুদ্ধ পদ্ধতি এবং গেমের জটিলতা সম্পর্কে জিজ্ঞাসা করে।
পরীক্ষার অংশ হিসেবে গ্রোকের পাশাপাশি ওপেনএআই’র চ্যাটজিপিটি (ChatGPT), অ্যানথ্রপিকের ক্লড (Claude) এবং গুগলের জেমিনি (Gemini) মডেলগুলোকে একই প্রশ্নে পরীক্ষা করা হয়। সব মডেলের উত্তর পাবলিকভাবে প্রকাশ করা হয়েছে, যাতে পাঠকরা নিজে তুলনা করতে পারেন।
ফলাফল দেখায়, গ্রোকের উত্তরগুলো গেমের জ্ঞান ক্ষেত্রে যথেষ্ট সমৃদ্ধ। যদিও উত্তরগুলোতে গেমারদের ব্যবহৃত বিশেষ শব্দাবলি, যেমন “সেভ-স্কামিং” এবং “ডিপিএস” (DPS) রয়েছে, তবে তথ্যের যথার্থতা ও গভীরতা প্রশংসনীয়। গেমের কৌশলগত বিশ্লেষণ ও টেবিলের মাধ্যমে উপস্থাপনা গ্রোকের বিশেষ বৈশিষ্ট্য হিসেবে উল্লেখযোগ্য।
চ্যাটজিপিটি, ক্লড ও জেমিনির উত্তরগুলোও যথেষ্ট তথ্যপূর্ণ হলেও, গ্রোকের তুলনায় গেমের নির্দিষ্ট টার্ম ও টেবিল ফরম্যাটে কম ছিল। বিশেষ করে গেমের তত্ত্বগত বিশ্লেষণ (theorycraft) ক্ষেত্রে গ্রোকের উত্তরগুলো বেশি বিশদ ও গেমারদের জন্য উপযোগী বলে বিবেচিত হয়েছে।
এই পরীক্ষার মাধ্যমে স্পষ্ট হয়েছে, এক্সআইএআই গেম-সংক্রান্ত কন্টেন্টে বিশেষায়িত মডেল তৈরি করার দিকে মনোযোগ দিচ্ছে, যা গেমারদের জন্য দ্রুত ও নির্ভুল গাইডলাইন সরবরাহ করতে পারে। ভবিষ্যতে এ ধরনের মডেল গেমের কাস্টমার সাপোর্ট, স্ট্রিমারদের সহায়তা এবং গেম ডেভেলপারদের টেস্টিং প্রক্রিয়ায় ব্যবহার হতে পারে।
সারসংক্ষেপে, গ্রোকের বালডারস গেট প্রশ্নে প্রদর্শিত পারফরম্যান্স এক্সআইএআই’র গেম-ফোকাসড কৌশলের সফলতা নির্দেশ করে। যদিও মডেল রিলিজে বিলম্বের কারণ হিসেবে এলন মাস্কের উচ্চ মানদণ্ড উল্লেখ করা হয়েছে, তবু শেষ পর্যন্ত গেমের জ্ঞান ক্ষেত্রে গ্রোকের উত্তরগুলো ব্যবহারকারীদের জন্য মূল্যবান সম্পদ হিসেবে বিবেচিত হচ্ছে।



