
একটি নতুন গবেষণায় দেখা গেছে যে কৃত্রিম বুদ্ধিমত্তা (AI) এখনো ইতিহাসের জটিল প্রশ্নের সঠিক উত্তর দিতে তেমন সক্ষম নয়।যদিও AI বিভিন্ন ক্ষেত্রে অসাধারণ দক্ষতা দেখিয়েছে, যেমন like coding, generating a podcast, বা সাধারণ তথ্য প্রদান, ইতিহাসের মতো গভীর এবং সূক্ষ্ম বিষয়গুলোতে এটি তেমন কার্যকর ভূমিকা রাখতে পারেনি। ইতিহাসের ক্ষেত্রে সঠিক এবং নির্ভুল জ্ঞান প্রয়োজন হয়, যা বর্তমানের AI মডেলগুলো এখনো সম্পূর্ণভাবে অর্জন করতে পারেনি।এই গবেষণায় OpenAI-এর GPT-4, Meta-এর Llama, এবং Google-এর Gemini-এর মতো শীর্ষস্থানীয় বড় ভাষাগত মডেলগুলোকে পরীক্ষা করা হয়। পরীক্ষার জন্য Hist-LLM নামে একটি বিশেষ বেঞ্চমার্ক তৈরি করা হয়েছিল, যা Seshat Global History Databank-এর ডেটার ওপর ভিত্তি করে তৈরি। Seshat ডেটাবেসটি প্রাচীন ও আধুনিক যুগের বিশাল পরিমাণ ঐতিহাসিক তথ্য ধারণ করে। Hist-LLM মডেলগুলোর সঠিকতার পরীক্ষা করতে তাদের গভীর ইতিহাসভিত্তিক জটিল প্রশ্নের মুখোমুখি করা হয়।ফলাফল গবেষকদের জন্য হতাশাজনক ছিল। GPT-4 Turbo, যেটি সবচেয়ে ভালো পারফর্ম করেছে, সেটিও মাত্র ৪৬% সঠিক উত্তর দিতে পেরেছে। এটি মূলত অনুমানভিত্তিক উত্তর দেওয়ার সমান। এই সীমাবদ্ধতা গবেষণার মাধ্যমে স্পষ্ট হয়েছে যে, এমনকি সবচেয়ে উন্নত মডেলগুলোর মধ্যেও গভীর ইতিহাস বিষয়ে অভাব রয়ে গেছে। গবেষকরা আশা করেছিলেন যে এই অত্যাধুনিক প্রযুক্তি ইতিহাসের ক্ষেত্রে আরও ভালো ফলাফল দেখাবে, তবে তা বাস্তবায়িত হয়নি।গবেষণায় উঠে এসেছে যে AI সহজ এবং প্রচলিত তথ্যের ক্ষেত্রে ভালো ফলাফল দেখায়, তবে যখন প্রশ্নগুলো সুনির্দিষ্ট বা বিরল তথ্যের ওপর ভিত্তি করে তৈরি হয়, তখন মডেলগুলো প্রায়শই ভুল উত্তর দেয়। উদাহরণস্বরূপ, একটি প্রশ্নে GPT-4 Turbo কে জিজ্ঞাসা করা হয়েছিল, প্রাচীন মিশরে স্কেল আর্মার (বর্ম) ছিল কিনা। মডেলটি ভুলভাবে বলেছিল যে এটি ছিল, যদিও বাস্তবে স্কেল আর্মার মিশরে ১,৫০০ বছর পরে আসে। আরেকটি প্রশ্নে জিজ্ঞাসা করা হয়েছিল, প্রাচীন মিশরে পেশাদার স্থায়ী সেনাবাহিনী ছিল কিনা। সঠিক উত্তর ছিল ‘না’, কিন্তু মডেলটি ভুলভাবে বলেছিল যে সেনাবাহিনী ছিল।গবেষকরা ব্যাখ্যা করেছেন যে AI মডেলগুলোর প্রশিক্ষণের সময় প্রচলিত ডেটা প্রাধান্য পায়। মডেলটি যদি একটি তথ্য (যেমন A এবং B) বারবার পায়, কিন্তু একটি কম প্রচলিত তথ্য (যেমন C) কম পায়, তাহলে এটি C সম্পর্কে ভুল ব্যাখ্যা বা অনুমান করতে পারে। এই সীমাবদ্ধতার কারণেই বিরল বা জটিল তথ্যের ক্ষেত্রে মডেলগুলো বারবার ব্যর্থ হচ্ছে।আরেকটি বড় সীমাবদ্ধতা হলো অঞ্চলভিত্তিক তথ্যের অভাব। গবেষণায় দেখা গেছে যে সাব-সাহারান আফ্রিকার ইতিহাসের প্রশ্নে মডেলগুলো তুলনামূলকভাবে খারাপ পারফর্ম করেছে। এটি নির্দেশ করে যে মডেলগুলোর প্রশিক্ষণের সময় এই অঞ্চলের ডেটা যথেষ্ট অন্তর্ভুক্ত করা হয়নি, যা একটি বড় বৈষম্য তৈরি করেছে।যদিও গবেষণার ফলাফলগুলো AI-এর সীমাবদ্ধতা স্পষ্টভাবে তুলে ধরেছে, তবুও গবেষকরা AI-এর ভবিষ্যৎ ভূমিকা সম্পর্কে আশাবাদী। তাদের মতে, মডেলগুলো সঠিকভাবে প্রশিক্ষিত হলে এবং বিভিন্ন অঞ্চলের অন্তর্ভুক্তি বাড়ালে ইতিহাস গবেষণায় AI বড় ভূমিকা রাখতে পারে। গবেষকরা বর্তমানে Hist-LLM বেঞ্চমার্ক আরও উন্নত করার জন্য কাজ করছেন। এতে আরো বেশি আঞ্চলিক ডেটা যোগ করা হবে এবং প্রশ্নগুলোর জটিলতাও বৃদ্ধি করা হবে।এই গবেষণার মূল শিক্ষা হলো, বর্তমানে ইতিহাসের মতো জটিল এবং সূক্ষ্ম বিষয়ে মানুষের দক্ষতার বিকল্প এখনো AI হয়ে উঠতে পারেনি। তবে, সঠিকভাবে প্রশিক্ষণ এবং উন্নত ডেটাবেস ব্যবহার করা হলে AI ভবিষ্যতে গবেষকদের সহায়ক হাতিয়ার হয়ে উঠতে পারে, যা ইতিহাস চর্চায় নতুন দিগন্ত উন্মোচন করতে পারে।