
অ্যামাজন সোমবার তাদের নতুন জেনারেল-পারপাস AI এজেন্ট “নোভা অ্যাক্ট” প্রকাশ করেছে, যা ওয়েব ব্রাউজার নিয়ন্ত্রণ করে স্বাধীনভাবে কিছু সাধারণ কাজ করতে পারে। এই নতুন এজেন্ট মডেলের সাথে অ্যামাজন Nova Act SDK নামে একটি টুলকিটও রিলিজ করেছে, যার মাধ্যমে ডেভেলপাররা Nova Act ব্যবহার করে তাদের নিজস্ব AI এজেন্ট প্রোটোটাইপ বানাতে পারবেন। Nova Act তৈরি করেছে অ্যামাজনের সান ফ্রান্সিসকো-ভিত্তিক AGI ল্যাব, যা সম্প্রতি চালু হয়েছে। এই এজেন্টটি অ্যামাজনের আসন্ন Alexa+ আপগ্রেডের মূল ফিচারগুলোকেও শক্তি দেবে। Alexa+ হলো জেনারেটিভ AI-এর সাথে সংযুক্ত অ্যামাজনের জনপ্রিয় ভয়েস অ্যাসিসটেন্টের নতুন সংস্করণ। তবে, এখনই যে Nova Act পাওয়া যাচ্ছে, তা এখনও সম্পূর্ণ পরিপূর্ণ নয়। অ্যামাজন একে “রিসার্চ প্রিভিউ” বলছে। ডেভেলপাররা Nova Act টুলকিট অ্যাক্সেস করতে পারবেন nova.amazon.com ওয়েবসাইটে, যেখানে অ্যামাজনের অন্যান্য Nova ফাউন্ডেশন মডেলগুলিও প্রদর্শিত হচ্ছে। Nova Act হলো অ্যামাজনের প্রত্যুত্তর OpenAI’s Operator এবং Anthropic’s Computer Use এর মতো AI এজেন্ট প্রযুক্তির বিরুদ্ধে। বড় টেক কোম্পানিগুলি মনে করছে, ওয়েব ব্রাউজিং করতে সক্ষম AI এজেন্ট ব্যবহারকারীদের জন্য বর্তমান AI চ্যাটবটগুলিকে আরও বেশি উপযোগী করে তুলবে। অ্যামাজন হয়তো এই ধরনের এজেন্ট টেকনোলজি বানানোতে প্রথম নয়, কিন্তু Alexa+-এর মাধ্যমে তাদের পণ্য সম্ভবত সবচেয়ে বেশি মানুষের কাছে পৌঁছাবে। অ্যামাজন বলছে, Nova Act SDK ব্যবহার করে ডেভেলপাররা ব্যবহারকারীদের জন্য স্বয়ংক্রিয়ভাবে সাধারণ কাজ যেমন Sweetgreen থেকে স্যালাড অর্ডার করা বা ডিনারের রিজার্ভেশন করা করতে পারবেন। এই টুলকিটের সাহায্যে, AI এজেন্ট ওয়েবপেজ নেভিগেট করতে, ফর্ম পূরণ করতে বা ক্যালেন্ডার থেকে তারিখ বেছে নিতে সক্ষম হবে। অ্যামাজন দাবি করছে, তাদের অভ্যন্তরীণ টেস্টে Nova Act OpenAI এবং Anthropic-এর এজেন্টদের চেয়ে ভালো পারফর্ম করেছে। যেমন, ScreenSpot Web Text টেস্টে (যেখানে AI এজেন্ট স্ক্রিনের টেক্সটের সাথে কীভাবে ইন্টারঅ্যাক্ট করে তা মাপা হয়) Nova Act 94% স্কোর করেছে, যেখানে OpenAI-এর CUA পেয়েছে 88% এবং Anthropic-এর Claude 3.7 Sonnet পেয়েছে 90%। তবে, Nova Act-কে WebVoyager-এর মতো সাধারণ এজেন্ট টেস্টে পরীক্ষা করা হয়নি। Nova Act হলো অ্যামাজনের AGI ল্যাব থেকে বের হওয়া প্রথম পাবলিক প্রোডাক্ট। এই ল্যাবটি পরিচালনা করছেন প্রাক্তন OpenAI গবেষক David Luan এবং Pieter Abbeel। তারা এর আগে প্রত্যেকে নিজস্ব AI স্টার্টআপ (Adept ও Covariant) চালাতেন, কিন্তু গত বছর অ্যামাজন তাদের নিয়োগ দেয় AI এজেন্ট প্রজেক্ট এগিয়ে নেওয়ার জন্য। AGI ল্যাব থেকে স্যালাড অর্ডার করতে সক্ষম AI এজেন্ট বানানোটা কিছুটা অদ্ভুত শোনালেও, Luan-এর মতে, এজেন্ট প্রযুক্তিই হলো সুপারইন্টেলিজেন্ট AI সিস্টেমের দিকে প্রথম ধাপ। তার সংজ্ঞায়, AGI হলো এমন একটি AI সিস্টেম যা কম্পিউটারে একজন মানুষের মতো সব কাজ করতে পারে। Luan বলেন, Nova Act SDK তৈরি করা হয়েছে ছোট ও সহজ কাজগুলি নির্ভরযোগ্যভাবে স্বয়ংক্রিয় করতে এবং ডেভেলপারদেরকে এজেন্টের কাজে কখন মানুষের হস্তক্ষেপ প্রয়োজন তা ঠিক করতে সাহায্য করতে। তিনি আশা করেন, এটি ডেভেলপারদেরকে আরও নির্ভরযোগ্য এজেন্ট অ্যাপ্লিকেশন বানাতে সাহায্য করবে, যদিও তা সম্পূর্ণ স্বয়ংক্রিয় নাও হতে পারে। অ্যামাজন Nova Act-কে একটি প্রতিযোগিতাপূর্ণ মার্কেটে প্রকাশ করছে, কিন্তু এটি একটি অত্যন্ত গুরুত্বপূর্ণ প্রযুক্তি যা অ্যামাজনের জন্য অনেক কিছু নির্ধারণ করবে। Nova Act-এর প্রথম টেস্টগুলি দীর্ঘদিন ধরে বিলম্বিত Alexa+-এর কিছু ক্ষমতার ইঙ্গিত দিতে পারে, যা অ্যামাজনের AI প্রচেষ্টার জন্য একটি সাফল্য বা ব্যর্থতার মুহূর্ত হয়ে উঠতে পারে। OpenAI, Google এবং Anthropic-এর প্রথম দিকের AI এজেন্টগুলির প্রধান সমস্যা ছিল বিভিন্ন ডোমেইনে তাদের নির্ভরযোগ্যতা। TechCrunch-এর টেস্টে দেখা গেছে, এই সিস্টেমগুলি ধীরগতির, দীর্ঘ সময় স্বাধীনভাবে কাজ করতে সমস্যা হয় এবং এমন ভুল করে যা একজন মানুষ করবে না। অ্যামাজন এই সমস্যার সমাধান করতে পেরেছে কি না, অথবা তার এজেন্টরাও একই ত্রুটিতে ভুগছে কি না, তা আমরা শীঘ্রই জানতে পারব।