
মঙ্গলবার, OpenAI নতুন টুলস ঘোষণা করেছে, যা ডেভেলপার এবং ব্যবসাগুলোর জন্য AI এজেন্ট তৈরি করতে সাহায্য করবে। AI এজেন্ট হলো এমন স্বয়ংক্রিয় সিস্টেম, যা স্বাধীনভাবে কাজ করতে সক্ষম। নতুন এই টুলসগুলো OpenAI এর Responses API-এর অংশ, যা ব্যবসাগুলোর জন্য কাস্টম AI এজেন্ট তৈরি করতে সহায়ক হবে, যেগুলো ওয়েব সার্চ করতে, কোম্পানির ফাইল স্ক্যান করতে এবং ওয়েবসাইট নেভিগেট করতে পারে — ঠিক যেমন OpenAI এর Operator প্রোডাক্ট। Responses API আসলে OpenAI এর পুরনো Assistants API-এর জায়গায় আসছে, যা ২০২৬ সালের প্রথমার্ধে বন্ধ করার পরিকল্পনা রয়েছে।AI এজেন্ট নিয়ে হাইপ (উত্তেজনা) গত কয়েক বছরে অনেক বেড়ে গেছে, যদিও প্রযুক্তি শিল্প AI এজেন্ট কী এবং কীভাবে সেগুলো কাজ করে তা স্পষ্ট করতে কষ্ট পাচ্ছে। এরই মধ্যে, চীনা স্টার্টআপ Butterfly Effect সম্প্রতি তাদের নতুন AI এজেন্ট প্ল্যাটফর্ম Manus নিয়ে ভাইরাল হয়েছে, তবে ব্যবহারকারীরা দ্রুত খুঁজে পেয়েছেন যে এটি অনেক প্রতিশ্রুতি পূরণ করতে পারেনি।অর্থাৎ, OpenAI এর জন্য AI এজেন্টগুলো সঠিকভাবে তৈরি করা গুরুত্বপূর্ণ।OpenAI এর API প্রোডাক্ট প্রধান Olivier Godement বলেছেন, “এজেন্টের ডেমো দেওয়া অনেক সহজ, কিন্তু এজেন্ট স্কেল করা অনেক কঠিন, এবং এটির ব্যবহারিক সুবিধা মানুষের কাছে পৌঁছানোও বেশ কঠিন।”এ বছরের শুরুতে, OpenAI তাদের ChatGPT এ দুটি AI এজেন্ট পরিচয় করিয়ে ছিল, একটির নাম Operator, যা আপনার পক্ষ থেকে ওয়েবসাইট নেভিগেট করে, এবং অন্যটি Deep Research, যা গবেষণার রিপোর্ট তৈরি করে। এই দুটি টুল কিছুটা ধারণা দিয়েছে যে AI এজেন্টের প্রযুক্তি কীভাবে কাজ করতে পারে, তবে “স্বায়ত্তশাসন” (autonomy) বিষয়ে কিছুটা কম ছিল।এখন, Responses API এর মাধ্যমে, OpenAI AI এজেন্ট তৈরির জন্য প্রয়োজনীয় উপাদানগুলি বিক্রি করতে চায়, যা ডেভেলপারদের নিজেদের Operator এবং Deep Research-এর মতো অ্যাপ্লিকেশন তৈরি করতে সাহায্য করবে। OpenAI আশা করছে, ডেভেলপাররা এমন কিছু অ্যাপ্লিকেশন তৈরি করতে পারবে, যেগুলো আরও স্বায়ত্তশাসিত (autonomous) হবে।Responses API ব্যবহার করে, ডেভেলপাররা OpenAI এর ChatGPT Search ওয়েব সার্চ টুলের নিচে থাকা AI মডেলগুলোর (যেগুলো এখন প্রিভিউ-এ রয়েছে) ব্যবহার করতে পারবে। এই মডেলগুলো ওয়েব ব্রাউজ করে প্রশ্নের উত্তর খুঁজে বের করবে এবং উত্স (sources) উল্লেখ করবে।OpenAI দাবি করছে, GPT-4o Search এবং GPT-4o Mini Search মডেলগুলো খুবই সঠিক এবং তথ্যপূর্ণ। কোম্পানির SimpleQA বেন্চমার্কে, যেখানে ছোট তথ্যভিত্তিক প্রশ্নের উত্তর দেওয়ার সক্ষমতা পরিমাপ করা হয়, GPT-4o Search ৯০% সঠিকতা পায়, এবং GPT-4o Mini Search পায় ৮৮%। তুলনামূলকভাবে, GPT-4.5 — যা OpenAI এর বড় মডেল, তা পায় ৬৩% সঠিকতা।Responses API-এ একটি ফাইল সার্চ ইউটিলিটি রয়েছে, যা কোম্পানির ডেটাবেসে ফাইলগুলো স্ক্যান করে দ্রুত তথ্য খুঁজে বের করতে সহায়ক। এছাড়া, ডেভেলপাররা CUA (Computer-Using Agent) মডেল ব্যবহার করতে পারবেন, যা Operator চালানোর জন্য ব্যবহার করা হয়। এই মডেলটি মাউস এবং কীবোর্ডের কাজগুলো তৈরি করে, ফলে ডেটা এন্ট্রি এবং অ্যাপসের কার্যক্রম অটোমেট করতে সাহায্য করে।এন্টারপ্রাইজগুলো তাদের নিজস্ব সিস্টেমে CUA মডেলটি চালাতে পারবে, যা এখন রিসার্চ প্রিভিউতে রয়েছে।এটা স্পষ্ট যে, Responses API সব প্রযুক্তিগত সমস্যার সমাধান করবে না। যদিও AI-powered সার্চ টুলস বেশি সঠিক, তবে AI হ্যালুসিনেশন বা ভুল তথ্য এখনও একটি সমস্যা। GPT-4o Search এখনও ১০% সঠিক প্রশ্নের ভুল উত্তর দেয়।তবে OpenAI বলেছে যে, এই টুলসগুলো এখনও প্রাথমিক পর্যায়ে রয়েছে এবং তারা এগুলোকে আরও উন্নত করতে কাজ করে যাচ্ছে।এছাড়া, OpenAI Agents SDK নামে একটি ওপেন-সোর্স টুলকিটও মুক্তি দিয়েছে, যা ডেভেলপারদেরকে তাদের মডেলগুলোর সঙ্গে অন্তর্নিহিত সিস্টেমে ইন্টিগ্রেট করতে, নিরাপত্তা ব্যবস্থা স্থাপন করতে এবং AI এজেন্টের কার্যকলাপ পর্যবেক্ষণ করতে সাহায্য করবে।OpenAI আশা করছে, তারা এই বছর AI এজেন্টের ডেমো এবং প্রোডাক্টগুলোর মধ্যে ব্যবধান কমাতে পারবে, এবং তাদের মতে, “এজেন্ট হলো AI এর সবচেয়ে প্রভাবশালী অ্যাপ্লিকেশন যা ঘটতে যাচ্ছে।” OpenAI এর CEO Sam Altman জানুয়ারিতে বলেছিলেন, ২০২৫ হবে AI এজেন্টের কাজের জায়গায় প্রবেশের বছর।এটি সত্যিই ২০২৫ সালে AI এজেন্টের “বর্ষ” হবে কিনা, তাও সময়ই বলবে, তবে OpenAI এর নতুন প্রকাশগুলি দেখাচ্ছে যে তারা এখন AI এজেন্টের আকর্ষণীয় ডেমো থেকে বাস্তব কার্যকর টুলসের দিকে ধাবিত হতে চায়।