
Odyssey নামে একটি স্টার্টআপ, যা গঠিত হয়েছে স্বচালিত গাড়ি প্রযুক্তির পথপ্রদর্শক Oliver Cameron এবং Jeff Hawke-এর দ্বারা, তারা এমন একটি AI মডেল তৈরি করেছে যা ব্যবহারকারীদের ভিডিওর ভেতর ঘুরে বেড়ানোর সুযোগ দেয়। ওয়েবে ‘early demo’ হিসেবে এই প্রযুক্তি এখন দেখা যাচ্ছে। এই মডেল প্রতি ৪০ মিলিসেকেন্ডে একটি নতুন ভিডিও ফ্রেম তৈরি ও স্ট্রিম করে। ব্যবহারকারীরা কিছু সাধারণ কন্ট্রোল ব্যবহার করে ভিডিওর ভেতর ঘোরাফেরা করতে পারেন, ঠিক যেন ৩D ভিডিও গেম খেলা হচ্ছে। Odyssey তাদের ব্লগ পোস্টে জানায়, “বর্তমান অবস্থা, পূর্বের কিছু অ্যাকশন এবং আগের অবস্থা থেকে ভবিষ্যতের অবস্থা কেমন হবে, তা অনুমান করাই এই মডেলের কাজ।” এই প্রযুক্তি এমনভাবে কাজ করে যেন ভিডিওর পিক্সেলগুলো বাস্তবসম্মত লাগে, স্পেস ঠিক থাকে, এবং ভিডিও থেকে শেখা অ্যাকশনগুলোর মাধ্যমে একটানা ৫ মিনিট বা তার বেশি সময় ধরে স্টেবল ভিডিও তৈরি করা যায়। (https://twitter.com/i/status/1927767196756853179)
DeepMind, Microsoft, Fei-Fei Li’র World Labs, , এবং Decart-এর মতো অনেক বড় বড় কোম্পানি ও স্টার্টআপ এই ‘world models’ তৈরি করার দৌড়ে আছে। এই প্রযুক্তি দিয়ে ভবিষ্যতে ইন্টারঅ্যাকটিভ সিনেমা বা ভিডিও গেম তৈরি হতে পারে, এমনকি রোবট ট্রেনিংয়ের জন্য বাস্তবসদৃশ সিমুলেশনও চালানো যেতে পারে। তবে সবার অভিমত এক নয়। কিছু গেম কোম্পানি যেমন Activision Blizzard AI ব্যবহার করে খরচ কমাচ্ছে এবং কর্মী ছাঁটাই করছে। ২০২৪ সালে করা একটি গবেষণায় দেখা গেছে, AI-র কারণে আমেরিকায় ১ লক্ষেরও বেশি ফিল্ম, টিভি ও অ্যানিমেশন সম্পর্কিত চাকরি ঝুঁকির মুখে। Odyssey বলছে তারা সৃজনশীল মানুষদের প্রতিস্থাপন নয়, বরং তাদের সঙ্গে কাজ করতে চায়। তাদের ব্লগ পোস্টে লেখা হয়েছে, “ইন্টারঅ্যাকটিভ ভিডিও একদম নতুন ধরনের বিনোদনের দরজা খুলে দিচ্ছে। যেখানে গল্প তৈরি হবে চাহিদা অনুযায়ী, প্রচলিত প্রোডাকশনের খরচ ও সীমাবদ্ধতা ছাড়াই।” তাদের বিশ্বাস ভবিষ্যতে সব ভিডিও — চিত্রবিনোদন, বিজ্ঞাপন, শিক্ষা, ট্রেনিং, ভ্রমণ — ইন্টারঅ্যাকটিভ হয়ে উঠবে। (https://x.com/olivercameron/status/1927788546632417386?ref_src=twsrc%5Etfw%7Ctwcamp%5Etweetembed%7Ctwterm%5E1927788546632417386%7Ctwgr%5E2f92cf3027d2f7ccc320d09458d0fdf72d22b4ab%7Ctwcon%5Es1_c10&ref_url=https%3A%2F%2Ftechcrunch.com%2F2025%2F05%2F28%2Fodysseys-new-ai-model-streams-3d-interactive-worlds%2F)
তবে এখনো ডেমো ভার্সনে কিছু সীমাবদ্ধতা রয়েছে। ভিডিও কিছুটা ঝাপসা, পরিবেশ মাঝে মাঝে বদলে যাচ্ছে। একদিকে কিছুটা এগিয়ে গেলে বা ঘুরে তাকালেই চারপাশ আলাদা দেখা যেতে পারে। তাদের মডেল Nvidia H100 GPU ক্লাস্টার ব্যবহার করে ভিডিও স্ট্রিম করে প্রতি ইউজার প্রতি ঘণ্টায় ১ থেকে ২ ডলার খরচে এবং সর্বোচ্চ ৩০ ফ্রেম পার সেকেন্ড গতিতে। Odyssey জানিয়েছে, তারা ভবিষ্যতে ভিডিওকে আরও স্থিতিশীল করে তুলতে, বাস্তবসম্মত গতি আনতে এবং ভিডিওর মধ্যে সরাসরি মিথস্ক্রিয়ার মতো কাজ শিখিয়ে আরও উন্নত করতে কাজ করছে।
অন্যান্য কোম্পানির চেয়ে ভিন্ন পথে হাঁটছে Odyssey। তারা একটি ৩৬০ ডিগ্রির ক্যামেরা সিস্টেম তৈরি করেছে, যা ব্যাকপ্যাকে বসিয়ে প্রকৃত পরিবেশ ধারণ করা যায়। তারা বিশ্বাস করে এই বাস্তব চিত্রই তাদের AI মডেলকে আরও নিখুঁত করবে। এখন পর্যন্ত Odyssey ২৭ মিলিয়ন ডলার বিনিয়োগ পেয়েছে EQT Ventures, GV ও Air Street Capital-এর কাছ থেকে। Pixar-এর সহ-প্রতিষ্ঠাতা ও Disney Animation Studios-এর সাবেক প্রেসিডেন্ট Ed Catmull এই কোম্পানির বোর্ডে আছেন। ২০২৪ সালের ডিসেম্বরে Odyssey জানায়, তারা এমন সফটওয়্যার তৈরি করছে যার মাধ্যমে তাদের মডেল দিয়ে বানানো দৃশ্য Unreal Engine, Blender বা Adobe After Effects-এর মতো টুলে ব্যবহার করা যাবে এবং ক্রিয়েটররা সহজে তা সম্পাদনা করতে পারবেন। চাইলে আপনি এই প্রযুক্তির ডেমো দেখতে পারেন বা বিশ্লেষণমূলক পর্যালোচনা জানতে পারেন।