জেনারেটিভ ডেটা ইন্টেলিজেন্স

অ্যাপল ভিশন প্রো-এ সত্যিকারের মুখোমুখি চ্যাটের জন্য ব্যক্তিদের আপগ্রেড করে

তারিখ:

অ্যাপল আজ ভিশন প্রো-তে পাবলিক বিটাতে 'স্পেশিয়াল পারসোনাস' প্রকাশ করেছে। নতুন আপগ্রেড করা অবতার সিস্টেম এখন লোকেদের সরাসরি আপনার ঘরে আনতে পারে। আমরা একটি প্রাথমিক চেহারা পেয়েছিলাম.

ভিশন প্রো-এর জন্য অ্যাপলের পারসোনা অবতার সিস্টেম সম্পর্কে অনেক কিছু বলা হয়েছে। আপনি সেগুলিকে অস্বাভাবিক বা পাসযোগ্য বলে মনে করেন না কেন, একটি জিনিস নিশ্চিত: এটি আজ উপলব্ধ যেকোন হেডসেটে তৈরি করা সবচেয়ে ফটোরিয়ালিস্টিক রিয়েল-টাইম অবতার সিস্টেম। এবং এখন Personas 'Spatial Personas'-এর সাথে আপগ্রেড হচ্ছে।

কিন্তু ব্যক্তিরা কি ইতিমধ্যেই 'স্থানীয়' ছিল না? আমাকে বিস্তারিত বলতে দাও.

Sorta স্থানিক

লঞ্চের সময় পারসোনা সিস্টেম ব্যবহারকারীদের হেডসেটে তাদের মুখ স্ক্যান করার অনুমতি দেয় একটি ডিজিটাল পরিচয় তৈরি করতে যা ব্যবহারকারীর মতো দেখতে এবং নড়াচড়া করে ভিশন প্রো-তে সেন্সরগুলির জন্য ধন্যবাদ৷ অন্য ভিশন প্রো ব্যবহারকারীর (বা ব্যবহারকারীদের) সাথে ফেসটাইম কল করার সময়, তাদের ব্যক্তিত্ব(গুলি) মাথা, কাঁধ এবং হাতগুলি একটি ভাসমান বাক্সের ভিতরে দেখানো হবে।

ছবি অ্যাপলের সৌজন্যে

যদিও এটি মাঝে মাঝে সামনাসামনি কথা বলার মতো মনে হতে পারে, তবে সত্য যে সেগুলি একটি ফ্রেমের মধ্যে ছিল (যা আপনি অন্য যে কোনও উইন্ডোর মতো সরাতে বা আকার পরিবর্তন করতে পারেন) এটিকে মনে হয়েছে যে সেগুলি আসলে ছিল না আপনার পাশে দাঁড়িয়ে. এবং এটি কেবল ফ্রেমের কারণে নয়, বরং আপনি আসলে তাদের মতো একই জায়গা ভাগ করে নেওয়ার ক্ষেত্রেও ছিলেন না—এটা এমন নয় যে তারা হাই-ফাইভ পর্যন্ত আপনার কাছে হাঁটতে পারে, কারণ তারা আটকে থাকবে আপনার পর্দায় উইন্ডো।

মুখোমুখি

এখন Spatial Personas (VisionOS-এর সর্বশেষ সংস্করণে আজ বিটাতে প্রকাশিত), প্রতিটি ব্যক্তির অবতার ফ্রেম ছাড়াই একটি ভাগ করা জায়গায় রেন্ডার করা হয়েছে৷ যখন আমি বলি 'শেয়ারড স্পেস', আমি বলতে চাচ্ছি যে কেউ যদি তাদের ঘরে আমার দিকে এক পা বাড়ায়, আমি আসলে তাদের আমার আরও এক ধাপ কাছে আসতে দেখি।

পূর্বে ফ্রেমটি এমন মনে করেছিল যে আপনি একটি 3D ভিডিও চ্যাট করছেন। এখন ভাগ করা স্থান এবং কোনও ফ্রেম ছাড়াই, সত্যিই মনে হচ্ছে আপনি একে অপরের পাশে দাঁড়িয়ে আছেন৷ এটি 'একই সোফায় হ্যাং আউট' বা 'একই টেবিলের চারপাশে জড়ো হওয়া' অভিজ্ঞতা যা আসলে লঞ্চের সময় ভিশন প্রোতে সম্ভব ছিল না।

এবং এটা সত্যিই বেশ বাধ্যতামূলক. আমি চারজনের সাথে একটি ভিশন প্রো ফেসটাইম কলে (যদিও মোট পাঁচটি সমর্থিত) নতুন সিস্টেমে এক ঝলক দেখেছি, সবই স্থানিক ব্যক্তিত্ব ব্যবহার করে। আপনি এখনও তাদের মাথা, কাঁধ, এবং হাত দেখতে পাবেন কিন্তু এখন এটি একটি 3D ভিডিও চ্যাটের পরিবর্তে একটি হাডলের মতো মনে হচ্ছে৷ এটা অনেক বেশি ব্যক্তিগত মনে হয়.

স্থানিক ব্যক্তিরা অপ্ট-ইন করা হয়

স্পষ্ট করে বলতে গেলে, Personas এর 'ভিডিও চ্যাট' সংস্করণ (ফ্রেম সহ) এখনও বিদ্যমান। আসলে, এটি একটি ডিফল্ট উপায় যে অবতারগুলি দেখানো হয় যখন একটি ফেসটাইম কল শুরু হয়৷ একটি স্থানিক ব্যক্তিত্বে স্যুইচ করার জন্য ফেসটাইম মেনুতে একটি বোতাম টিপতে হবে৷

এবং এটি একটি অদ্ভুত পছন্দ মত মনে হতে পারে, আমি আসলে এটা কিছু আছে মনে.

একদিকে, ডিফল্ট 'ফেসটাইম ইন ভিশন প্রো' অভিজ্ঞতা একটি ভিডিও চ্যাটের মতো অনুভব করে। দৈনন্দিন ব্যবসায় আমরা সবাই এখন ওয়েবক্যামের অন্য দিকে অন্য কাউকে দেখতে অভ্যস্ত। এবং যদিও এটি শুধুমাত্র অডিও কলের চেয়ে ব্যক্তিগত, তবুও এটি আসলে কারো সাথে দেখা করা থেকে এক ধাপ দূরে ব্যাক্তিগতভাবে.

স্থানিক ব্যক্তিত্বগুলি অনেকটা এমন হয় যে আপনি আসলে ব্যক্তিগতভাবে মিলিত হচ্ছেন, যেহেতু আপনি এই ভাগ করা জায়গায় আপনার এবং অন্যান্য লোকেদের মধ্যে আন্তঃব্যক্তিক স্থান অনুভব করতে পারেন। ওরা যদি হেঁটে উঠে একটু পায় খুব কাছে, বাস্তব জীবনে কেউ আপনার খুব কাছাকাছি দাঁড়ালে আপনি সত্যিই এটি একই ভাবে অনুভব করবেন।

তাই এই দুটি বিকল্প আছে চমৎকার. আমি নিয়মিত মোড সহ কারো সাথে 'ভিডিও চ্যাট' করতে পারি, বা পরিস্থিতি যদি আরও ব্যক্তিগত বৈঠকের জন্য আহ্বান করে তবে আমি তাদের আমার স্পেসে আমন্ত্রণ জানাতে পারি।

এবং স্থানিক ব্যক্তিত্বগুলি কেবল চ্যাট করার জন্য নয়। সাধারণ ব্যক্তিদের মতোই, আপনি ফেসটাইমে থাকাকালীন সিনেমা দেখতে এবং একসাথে গেম খেলতে শেয়ারপ্লে ব্যবহার করতে পারেন (যদি আপনার উভয়ের একটি সমর্থিত অ্যাপ ইনস্টল থাকে)।

গ্রহণ করা বিনামূল্যে ফর্ম উদাহরণস্বরূপ, অ্যাপলের সহযোগী ডিজিটাল হোয়াইটবোর্ড অ্যাপ। লঞ্চ করলে বিনামূল্যে ফর্ম Spatial Personas-এর সাথে একটি FaceTime কল করার সময়, অন্য সবাইকে অ্যাপে যোগ দিতে বলা হবে, যা হোয়াইটবোর্ডের সামনে সবাইকে লোড করবে।

সবকিছুও সিঙ্ক্রোনাইজ করা হয়। কলে থাকা অন্য যে কেউ হোয়াইটবোর্ডে আপনি যা রেখেছেন তা দেখতে পারবেন এবং আপনি নতুন ফটো যোগ করার সাথে বা টীকা আঁকলে রিয়েল টাইমে দেখতে পারবেন। এবং ঠিক তত সহজে, যে কেউ শারীরিকভাবে বোর্ডে যেতে পারে এবং নিজের সাথে যোগাযোগ করতে পারে।

যখন Vision Pro-তে Apple TV-তে শেয়ার করা মুভি দেখার কথা আসে, তখন Spatial Personas একই সোফায় একসাথে বসার অনুভূতি আনলক করে, যা লঞ্চের সময় হেডসেট দিয়ে একেবারেই সম্ভব ছিল না। এখন আপনি যখন আপনার বন্ধুদের সাথে একটি সিনেমা দেখবেন তখন আপনি তাদের সাথে কাঁধে কাঁধ মিলিয়ে বসে থাকবেন, যা আপনি যে ভিডিওটি দেখছেন তার কাছে তাদের মুখের সাথে একটি জানালা ভাসানোর চেয়ে খুব আলাদা মনে হয়৷

Spatial Personas ব্যবহার করার সময় FaceTime কলে যে কারো কাছে অনেকগুলি ফ্ল্যাট অ্যাপ স্ট্রিম করা সম্ভব, কিন্তু 3D বা ইন্টারেক্টিভ কন্টেন্ট ডেভেলপারদের জন্য বিশেষভাবে বৈশিষ্ট্যটি বাস্তবায়ন করতে হবে।

যদিও এটি কিছুটা সমস্যাযুক্ত কারণ ঠিক কোন অ্যাপগুলি স্থানিক ব্যক্তি বা এমনকি শেয়ারপ্লে সমর্থন করে তা জানা কঠিন। এখন পর্যন্ত, আপনাকে একটি অ্যাপের পৃষ্ঠার নীচের দিকে স্ক্রোল করতে হবে এটি শেয়ারপ্লে সমর্থন করে কিনা তা দেখতে (যদি না বিকাশকারী অ্যাপের বিবরণে এটি উল্লেখ করেন)। এবং তারপরেও এর অর্থ এই নয় যে এটি স্থানিক ব্যক্তিদের সমর্থন করে।

ছোট বিবরণ

অ্যাপল স্থানিক ব্যক্তিদের জন্য কিছু ছোট বিবরণও ভেবেছিল, সম্ভবত সবচেয়ে আকর্ষণীয় হল 'লোকোমোশন'।

রুম-স্কেল লোকোমোশন মূলত ডিফল্ট। আপনি যদি কোনও ব্যক্তি বা অ্যাপের কাছাকাছি যেতে চান… আপনি কেবল শারীরিকভাবে এটির কাছে যান। কিন্তু কি হবে যদি এটি আপনার শারীরিক স্থানের সীমার বাইরে থাকে? ওয়েল, পরিবর্তে সরাসরি সরানো নিজেকে কার্যত, আপনি প্রকৃতপক্ষে পুরো ভাগ করা স্থানটিকে আপনার থেকে কাছাকাছি বা আরও দূরে সরাতে পারেন।

আপনি যেকোনো সময়, যেকোনো অ্যাপে এটি করতে পারেন এবং অন্য সবাই আপনার নতুন অবস্থানের মধ্যে প্রতিফলিত দেখতে পাবে তাদের স্থান, সবকিছু সিঙ্ক্রোনাইজ রাখা।

অ্যাপলও তৈরি করেছে তাই যখন দুটি স্থানিক ব্যক্তি একসাথে খুব কাছাকাছি আসে, তারা সাময়িকভাবে একটি ভাসমান পরিচিতি ছবির মতো দেখায়। আমি মনে করি এটি সম্ভবত কারণ তারা সম্ভাব্য হয়রানি বা ট্রোলিং এড়াতে চায় (যেমন: আপনি কাউকে বিরক্ত করতে চান যাতে আপনি তাদের ভার্চুয়াল মুখের মাধ্যমে আপনার ভার্চুয়াল হাতটি ফেজ করেন, যা দৃশ্যত এবং আন্তঃব্যক্তিক স্থানের দৃষ্টিকোণ থেকে উভয়ই অস্বস্তিকর)।

হেডসেটের চমৎকার স্থানিক অডিও অবশ্যই ডিফল্টরূপে অন্তর্ভুক্ত করা হয়েছে, তাই প্রত্যেকেরই মনে হয় যে তারা রুমে যেখানেই দাঁড়িয়ে আছে সেখান থেকে আসছে এবং তাদের কণ্ঠস্বর আসলে শোনাচ্ছে যেন তারা ভিতরে আছে আপনার কক্ষ (হেডসেটের অনুমানের উপর ভিত্তি করে ধ্বনিবিদ্যা কেমন হওয়া উচিত)। এবং আপনি যদি 'পরিবেশ'-এর মতো সম্পূর্ণ নিমজ্জিত স্থানে চলে যান, স্থানিক অডিও সেই নতুন অ্যাকোস্টিক পরিবেশে রূপান্তরিত হয়-তাই উদাহরণস্বরূপ আপনি কাছাকাছি সমস্ত শিলা পৃষ্ঠের কারণে জোশুয়া ট্রি পরিবেশে লোকেদের প্রতিধ্বনি শুনতে পাবেন। আপনার নিজের ঘরের ভিতরে থাকা থেকে পরিবেশে 'বাইরে' হওয়া পর্যন্ত ধ্বনিতত্ত্ব শোনা একটি সূক্ষ্ম জাদু।

ছবি অ্যাপলের সৌজন্যে

এবং শেষ কিন্তু অন্তত নয়, ফেসটাইম অংশগ্রহণকারীদের একটি মিশ্র গোষ্ঠী থাকা সম্ভব। উদাহরণস্বরূপ, আপনি একটি আইফোন, একটি অ্যান্ড্রয়েড ট্যাবলেট ব্যবহার করতে পারেন (হ্যাঁ আপনি পারেন৷ নন-অ্যাপল ডিভাইসে লোকেদের সাথে ফেসটাইম), একটি সাধারণ ব্যক্তিত্ব, এবং একটি স্থানিক ব্যক্তিত্ব একযোগে। সেক্ষেত্রে SharePlay সেই ফরম্যাটের মধ্যেও কাজ করবে (নন-অ্যাপল ডিভাইস ব্যতীত) যতক্ষণ পর্যন্ত অ্যাপটি সমর্থন করে। ভিশন প্রো নেটিভ অ্যাপগুলির ক্ষেত্রে, আইফোন ব্যবহারকারী একটি বিজ্ঞপ্তি পাবেন যে তাদের ডিভাইসটি সমর্থিত নয়।

- - - - -

Spatial Personas অ্যাপলের অবতার সিস্টেমে একটি বড় আপগ্রেড, তবে কোম্পানিটি বজায় রাখে যে পুরো পারসোনা সিস্টেমটি এখনও 'বিটা'-তে রয়েছে। সম্ভবত এর মানে আরও উন্নতি এখনও আসা বাকি আছে।

স্পট_আইএমজি

সর্বশেষ বুদ্ধিমত্তা

স্পট_আইএমজি