
চীনের AI ল্যাব DeepSeek এই সপ্তাহে প্রযুক্তি শিল্পের প্রধান মনোযোগ আকর্ষণ করছে, তবে এর প্রধান দেশীয় প্রতিদ্বন্দ্বী আলিবাবা বসে নেই। আলিবাবার কুইন দল সোমবার নতুন একটি AI মডেল সিরিজ, কুইন 2.5-VL, প্রকাশ করেছে যা অনেক ধরনের টেক্সট এবং ইমেজ বিশ্লেষণ কাজ করতে সক্ষম। এই মডেলগুলি ফাইল বিশ্লেষণ, ভিডিও বোঝা, চিত্রে বস্তু গণনা এবং একটি পিসি নিয়ন্ত্রণ করতে পারে, যা OpenAI এর অপারেটর মডেলের মতোই কাজ করে।কুইন টিমের পরীক্ষার অনুযায়ী, কুইন 2.5-VL মডেলটি OpenAI এর GPT-4o, Anthropic এর Claude 3.5 Sonnet, এবং গুগল এর Gemini 2.0 Flash কে পিছনে ফেলেছে বিভিন্ন ভিডিও বোঝা, গণনা, ডকুমেন্ট বিশ্লেষণ, এবং প্রশ্ন-উত্তর মূল্যায়নে। কুইন 2.5-VL মডেলটি আলিবাবার কুইন চ্যাট অ্যাপে পরীক্ষা করা যাবে এবং AI ডেভেলপমেন্ট প্ল্যাটফর্ম Hugging Face থেকে ডাউনলোড করা যাবে। এই মডেলটি চার্ট এবং গ্রাফ বিশ্লেষণ, ইনভয়েস ও ফর্মের স্ক্যান থেকে ডেটা সংগ্রহ এবং বহু ঘণ্টার ভিডিও “বোঝা” করতে পারে।কুইন2.5-VL মডেলটি ফিল্ম এবং টিভি সিরিজের “IP” (ইন্টেলেকচুয়াল প্রপার্টি) চিহ্নিত করতে সক্ষম এবং বিভিন্ন ধরনের পণ্যও চিনতে পারে, যা থেকে ইঙ্গিত পাওয়া যায় যে, এই মডেলটি সম্ভবত কিছু কপিরাইটযুক্ত কাজের উপর প্রশিক্ষিত হয়েছে। তবে, চীনা কোম্পানির তৈরি AI হিসেবে কিছু বিষয় নিয়ে কুইন চ্যাটে আলোচনা সীমিত। উদাহরণস্বরূপ, যখন “Xi Jinping এর ভুল” নিয়ে প্রশ্ন করা হয়েছিল, তখন একটি এরর বার্তা দেখানো হয়েছিল।চীনের ইন্টারনেট নিয়ন্ত্রক প্রতিষ্ঠান দেশীয় AI মডেলগুলির উত্তরগুলি “কোর সোশ্যালিস্ট ভ্যালুস” এর সঙ্গে সঙ্গতিপূর্ণ কিনা তা পরীক্ষা করে। অনেক চীনা AI সিস্টেম এমন বিষয়গুলিতে উত্তর দিতে অস্বীকার করে, যা নিয়ন্ত্রকদের বিরক্তি তৈরি করতে পারে, যেমন তাইওয়ানের স্বায়ত্তশাসন। কুইন 2.5-VL মডেলের একটি আকর্ষণীয় বৈশিষ্ট্য হল এর সফটওয়্যার এর সাথে ইন্টারঅ্যাক্ট করার ক্ষমতা — এটি পিসি এবং মোবাইল ডিভাইসে অ্যাপস নিয়ন্ত্রণ করতে পারে। Hugging Face এর টেকনিক্যাল লিড Philipp Schmid এর একটি ভিডিওতে দেখা যায়, কুইন 2.5-VL Android এর Booking.com অ্যাপ চালু করে এবং চংকিং থেকে বেইজিংয়ের জন্য একটি ফ্লাইট বুক করে। একটি ভিডিওতে, কুইন 2.5-VL মডেলটি Linux ডেস্কটপের অ্যাপস নিয়ন্ত্রণ করছে, তবে ট্যাব সুইচ করা ছাড়া তেমন কিছুই করতে পারছে না।কুইন টিমের পরীক্ষার ফলাফল অনুযায়ী, Qwen2.5-VL মডেলটি OSWorld নামক পরীক্ষায় খুব ভালো ফলাফল করতে পারেনি, যা একটি বাস্তব কম্পিউটার পরিবেশের অনুকরণ করতে চেষ্টা করে। কুইন 2.5-VL সিরিজের দুইটি ছোট মডেল, কুইন 2.5-VL-3B এবং কুইন 2.5-VL-7B, একটি পরিমিত লাইসেন্সের অধীনে উপলব্ধ, তবে কুইন 2.5-VL-72B মডেলটি আলিবাবার কাস্টম লাইসেন্সের অধীনে রয়েছে, যার মানে হল যে, যে কোম্পানিগুলি বা ডেভেলপাররা ১০০ মিলিয়ন বা তার বেশি মাসিক সক্রিয় ব্যবহারকারী রয়েছে, তাদের কুইন/আলিবাবার কাছ থেকে অনুমতি নেওয়া প্রয়োজন এই মডেলটি বাণিজ্যিকভাবে ব্যবহার করার জন্য।