গত মাসে Mercor নামের একটি স্টার্ট‑আপ AI এজেন্টের পেশাগত কাজের পারফরম্যান্স মাপার নতুন বেঞ্চমার্ক প্রকাশ করেছিল। এই বেঞ্চমার্কে আইনগত বিশ্লেষণ ও কর্পোরেট রিভিউয়ের মতো জটিল কাজগুলোকে টেস্ট কেস হিসেবে ব্যবহার করা হয়। ফলাফল দেখায় যে, এখনো অধিকাংশ গবেষণা ল্যাবের এজেন্টগুলো ২৫%‑এর নিচে স্কোর করেছে, ফলে আইনজীবীরা স্বল্পমেয়াদে AI দ্বারা প্রতিস্থাপিত হওয়া থেকে নিরাপদ বলে ধারণা করা হয়েছিল।
বেঞ্চমার্কের প্রথম সংস্করণে সব প্রধান ল্যাবের স্কোরই দু’অঙ্কের নিচে সীমাবদ্ধ ছিল, যা পেশাদার স্তরে AI‑এর সক্ষমতা সীমিত থাকার ইঙ্গিত দিত। তবু, প্রযুক্তি দ্রুত অগ্রসর হওয়ায় এই ফলাফলগুলো কয়েক সপ্তাহের মধ্যে বদলে যেতে পারে, এটাই Mercor‑এর মূল পর্যবেক্ষণ।
এই সপ্তাহে Opus 4.6 নামের নতুন মডেল প্রকাশের সঙ্গে সঙ্গে লিডারবোর্ডে উল্লেখযোগ্য পরিবর্তন দেখা যায়। অ্যানথ্রপিকের সর্বশেষ মডেল একবারের প্রচেষ্টায় প্রায় ৩০% স্কোর অর্জন করেছে, আর একই সমস্যার ওপর কয়েকবার পুনরায় চেষ্টা করার সুযোগ দিলে গড়ে ৪৫% পর্যন্ত পৌঁছেছে। এই সংখ্যা পূর্বের সর্বোচ্চ ২৫%‑এর তুলনায় স্পষ্টভাবে উচ্চতর, যা AI‑এর ভিত্তিমডেল উন্নয়নে গতি বজায় আছে বলে নির্দেশ করে।
অ্যানথ্রপিকের আপডেটেড মডেলে নতুন এজেন্টিক ফিচার যুক্ত করা হয়েছে, যার মধ্যে “এজেন্ট স্বার্ম” নামের একটি পদ্ধতি অন্তর্ভুক্ত। এই পদ্ধতি একাধিক এজেন্টকে সমন্বিতভাবে কাজ করতে সক্ষম করে, ফলে বহু‑ধাপের সমস্যার সমাধানে দক্ষতা বৃদ্ধি পায়। বিশেষ করে আইনগত বিশ্লেষণের মতো ধাপে ধাপে যুক্তি প্রয়োজন এমন কাজগুলোতে এই ফিচারটি পারফরম্যান্সে উল্লেখযোগ্য প্রভাব ফেলেছে।
বেঞ্চমার্কের ফলাফল দেখিয়ে দেয় যে, অ্যানথ্রপিকের মডেল একক প্রচেষ্টায় ১৮.৪% থেকে কয়েক মাসের মধ্যে ২৯.৮% পর্যন্ত উন্নতি করেছে। এই অগ্রগতি Mercor‑এর সিইও Brendan Foody‑কে বিশেষভাবে মুগ্ধ করেছে, যিনি এই পরিবর্তনকে “কয়েক মাসে ১০ শতাংশের বেশি বৃদ্ধি” হিসেবে উল্লেখ করেছেন। যদিও ৩০% স্কোর এখনও ১০০%‑এর অনেক দূরে, তবে এই দ্রুত উন্নতি AI‑এর ভবিষ্যৎ সম্ভাবনা সম্পর্কে নতুন দৃষ্টিভঙ্গি তৈরি করেছে।
আইনজীবী সম্প্রদায়ের জন্য এই ফলাফল দুটি দিক থেকে গুরুত্বপূর্ণ। প্রথমত, AI‑এর সক্ষমতা এখনো সীমিত, তাই স্বল্পমেয়াদে পেশা হারানোর ঝুঁকি কম। তবে, স্কোরের ধারাবাহিক উন্নতি দেখায় যে, ভবিষ্যতে AI‑কে সহায়ক টুল হিসেবে ব্যবহার করা আরও সাধারণ হয়ে উঠবে। ফলে আইনজীবীদের কাজের পদ্ধতিতে প্রযুক্তিগত দক্ষতা ও AI‑এর সঙ্গে সমন্বয় করার প্রয়োজন বাড়বে।
সামগ্রিকভাবে, অ্যানথ্রপিকের নতুন মডেল এবং Opus 4.6‑এর ফিচারগুলো AI‑এর ভিত্তিমডেল গবেষণায় নতুন মাইলফলক স্থাপন করেছে। বেঞ্চমার্কে দেখা দ্রুত উন্নতি নির্দেশ করে যে, পেশাগত কাজের স্বয়ংক্রিয়তা নিয়ে পূর্বের ধারণা পুনর্বিবেচনা করা প্রয়োজন। যদিও আইন পেশা তৎক্ষণাৎ বিপন্ন নয়, তবে AI‑এর অগ্রগতির গতি বিবেচনা করে ভবিষ্যতে দক্ষতা বৃদ্ধির জন্য প্রশিক্ষণ ও টুল গ্রহণে মনোযোগ দেওয়া জরুরি।
এই প্রবণতা দেখিয়ে দেয় যে, AI‑এর ক্ষমতা কয়েক সপ্তাহের মধ্যে উল্লেখযোগ্যভাবে পরিবর্তিত হতে পারে, এবং প্রযুক্তি উন্নয়নের গতি ধীর হচ্ছে না। তাই, পেশাদার ক্ষেত্রগুলোতে AI‑এর ভূমিকা কীভাবে গড়ে উঠবে তা পর্যবেক্ষণ করা এবং প্রয়োজনীয় অভিযোজন পরিকল্পনা করা এখনই সময়ের দাবি।



