
AI স্টার্টআপ Stability AI একটি নতুন অডিও তৈরি করার কৃত্রিম বুদ্ধিমত্তা মডেল প্রকাশ করেছে, যার নাম Stable Audio Open Small। এটি এমন একটি মডেল যা স্টেরিও অডিও তৈরি করতে পারে এবং এতটাই দ্রুত ও হালকা যে এটি স্মার্টফোনেও ব্যবহার করা যায়। এই মডেলটি Stability AI এবং চিপ নির্মাতা Arm-এর যৌথ সহযোগিতায় তৈরি হয়েছে। Arm হলো সেই কোম্পানি যারা বেশিরভাগ স্মার্টফোন ও মোবাইল ডিভাইসের চিপ বা প্রসেসর তৈরি করে। যদিও অনেক AI অ্যাপ যেমন Suno বা Udio অডিও তৈরি করতে পারে, সেগুলোর বেশিরভাগই ক্লাউডে চলে, তাই অফলাইনে কাজ করে না। কিন্তু Stable Audio Open Small স্মার্টফোনে সরাসরি কাজ করতে পারে, ইন্টারনেট ছাড়াই। Stability AI জানিয়েছে যে, এই মডেলের ট্রেনিং ডেটা তৈরি হয়েছে কেবলমাত্র ফ্রি এবং কপিরাইটমুক্ত অডিও সংগ্রহ যেমন Free Music Archive এবং Freesound থেকে নেওয়া গান দিয়ে। এটি অন্যান্য মডেলের চেয়ে আলাদা, কারণ Suno বা Udio-র মতো অনেক মডেলের ডেটাতে কপিরাইটযুক্ত গান রয়েছে, যা আইনি সমস্যার ঝুঁকি তৈরি করে। Stable Audio Open Small মডেলটির আকার ৩৪১ মিলিয়ন প্যারামিটার। এটি Arm প্রসেসরের জন্য অপটিমাইজড, যার মানে এটি ফোনে বা ট্যাবলেটে খুব দ্রুত চলে। এই মডেল দিয়ে দ্রুত ছোট ছোট সাউন্ড ইফেক্ট বা অডিও স্যাম্পল তৈরি করা যায় যেমন ড্রাম বিট বা বাদ্যযন্ত্রের অংশ। Stability AI জানিয়েছে, একটি স্মার্টফোনে এটি ৮ সেকেন্ডের কম সময়ে প্রায় ১১ সেকেন্ডের অডিও তৈরি করতে পারে। তবে এই মডেলের কিছু সীমাবদ্ধতাও আছে। এটি শুধু ইংরেজিতে লেখা প্রম্পট বুঝতে পারে, এবং এটি খুব ভালো গানের কোয়ালিটি বা বাস্তবসম্মত কণ্ঠ তৈরি করতে পারে না। আবার সব ধরনের সঙ্গীতেও এই মডেল ভালো পারফর্ম করে না, কারণ এর ট্রেনিং মূলত পশ্চিমা ধরনের ডেটা দিয়ে হয়েছে। ব্যবহার করার দিক থেকেও কিছু শর্ত রয়েছে। যারা গবেষণা করেন, বা ছোট স্টার্টআপ যাদের বার্ষিক আয় ১০ লাখ ডলারের কম, তারা এটি ফ্রিতে ব্যবহার করতে পারবেন। তবে বড় কোম্পানি যারা এক মিলিয়ন ডলারের বেশি আয় করে, তাদের জন্য আলাদা এন্টারপ্রাইজ লাইসেন্স কিনতে হবে। Stability AI মূলত জনপ্রিয় ছবি তৈরির মডেল Stable Diffusion দিয়ে আলোচনায় আসে। গত বছর কোম্পানিটি কিছু আর্থিক সংকটে পড়ে এবং প্রতিষ্ঠাতা এমাদ মোস্তাকের বিরুদ্ধে অব্যবস্থাপনার অভিযোগ ওঠে। এতে করে অনেক কর্মী চাকরি ছাড়েন এবং বিনিয়োগকারীদের আস্থা কমে যায়। তবে সাম্প্রতিক মাসগুলোতে Stability AI নতুন CEO নিয়োগ দিয়েছে, বিখ্যাত পরিচালক জেমস ক্যামেরনকে বোর্ডে এনেছে এবং আরও কিছু নতুন ইমেজ জেনারেশন মডেল প্রকাশ করেছে। Stable Audio Open Small তাদের নতুন প্রচেষ্টার অংশ হিসেবে ধরা হচ্ছে।