অক্সফোর্ড বিশ্ববিদ্যালয় Reasoning with Machines ল্যাবের গবেষকরা ফেব্রুয়ারি ৯ তারিখে Nature Medicine‑এ প্রকাশিত গবেষণায় দেখিয়েছেন, কৃত্রিম বুদ্ধিমত্তা ভিত্তিক চ্যাটবটগুলো ল্যাব পরিবেশে উচ্চ নির্ণয় সঠিকতা দেখালেও বাস্তব ব্যবহারকারীর সঙ্গে কথোপকথনে ফলাফল উল্লেখযোগ্যভাবে কমে যায়।
নিয়ন্ত্রিত পরীক্ষায়, একই চ্যাটবটগুলোকে দশটি ভিন্ন চিকিৎসা পরিস্থিতি উপস্থাপন করা হলে, সঠিক রোগ নির্ণয়ের হার ৯৫ শতাংশে পৌঁছায় এবং সঠিক পদক্ষেপ (ডাক্তারকে কল করা বা জরুরি সেবা ব্যবহার করা) সুপারিশের হার ৫৬ শতাংশের বেশি ছিল।
কিন্তু যখন মানব ব্যবহারকারীরা একই পরিস্থিতি স্বাভাবিক কথোপকথনের মাধ্যমে চ্যাটবটের কাছে উপস্থাপন করেন, তখন রোগ নির্ণয়ের সঠিকতা ৩৫ শতাংশের নিচে নেমে আসে এবং উপযুক্ত পদক্ষেপ নির্ধারণের হার প্রায় ৪৪ শতাংশে সীমাবদ্ধ থাকে।
গবেষকরা ব্যাখ্যা করেন, AI‑এর চিকিৎসা জ্ঞান উপস্থিত থাকলেও ব্যবহারকারীর প্রশ্নের সূক্ষ্মতা ও প্রসঙ্গ সঠিকভাবে ধরতে না পারার ফলে ব্যবহারিক পরামর্শে ঘাটতি দেখা দেয়।
পরীক্ষার প্রথম ধাপে, গবেষক দল GPT‑4o, Command R+ এবং Llama 3 সহ বড় ভাষা মডেলগুলোকে দশটি রোগের বর্ণনা দিয়ে পরীক্ষা করেন এবং প্রতিটি মডেল কতটা সঠিকভাবে রোগ চিহ্নিত ও পরামর্শ দেয় তা রেকর্ড করেন।
এরপর প্রায় ১,৩০০ স্বেচ্ছাসেবীকে এলোমেলোভাবে চ্যাটবট ব্যবহার, গুগল অনুসন্ধান বা অন্যান্য পদ্ধতি বেছে নিতে দেওয়া হয়। অংশগ্রহণকারীদেরকে তাদের সিদ্ধান্তের কারণ ও রোগের ধারণা লিখতে বলা হয়।
চ্যাটবট ব্যবহার না করা বেশিরভাগ মানুষ তাদের উপসর্গ গুগল বা অনুরূপ সার্চ ইঞ্জিনে টাইপ করে তথ্য সংগ্রহ করেন। এই পদ্ধতিতে অংশগ্রহণকারীরা গড়ে ৪০ শতাংশের বেশি সঠিক নির্ণয় করতে পেরেছেন।
চ্যাটবট ব্যবহারকারী দলের ফলাফল ল্যাবের ফলাফলের চেয়ে কম ছিল; তাদের রোগ নির্ণয়ের হার গড়ে ৩৫ শতাংশ এবং সঠিক পদক্ষেপের সুপারিশের হার ৪৪ শতাংশের কাছাকাছি। গুগল ব্যবহারকারীদের তুলনায় এই পার্থক্য পরিসংখ্যানগতভাবে উল্লেখযোগ্য বলে গবেষকরা উল্লেখ করেন।
ফলাফল থেকে স্পষ্ট যে, বর্তমান AI চ্যাটবটগুলো রোগীর প্রশ্নের সূক্ষ্মতা বুঝে সঠিক চিকিৎসা নির্দেশনা দিতে এখনও সীমাবদ্ধ। ব্যবহারকারীরা সহজ অনুসন্ধান টুলের তুলনায় কম সঠিক তথ্য পেতে পারেন।
বিশেষজ্ঞরা পরামর্শ দেন, জরুরি বা গুরুত্বপূর্ণ স্বাস্থ্যের বিষয়ের জন্য AI চ্যাটবটের ওপর সম্পূর্ণভাবে নির্ভর না করে, প্রয়োজনীয় ক্ষেত্রে সরাসরি চিকিৎসকের সঙ্গে পরামর্শ করা উচিত। ভবিষ্যতে চ্যাটবটের ব্যবহারযোগ্যতা বাড়াতে ভাষা মডেলের প্রেক্ষাপট বিশ্লেষণ ও ব্যবহারকারী‑মুখী ইন্টারফেসের উন্নয়ন প্রয়োজন।



