উন্নত বৈশিষ্ট্যসম্পন্ন এমন একটি গাড়ির মালিক হওয়া যা আপনি ঠিক বোঝেন না, তা একটি চাপের অভিজ্ঞতা হতে পারে। একজন AI সহকারী কি সাহায্য করতে পারেন?

ভয়েস অ্যাসিস্ট্যান্ট প্রযুক্তি অনেকের কাছেই নতুন ধারণা নয়। SIRI থেকে Alexa পর্যন্ত, আমাদের বেশিরভাগই এই ধরণের AI-ভিত্তিক প্রযুক্তির সাথে পরিচিত হয়েছি। তবে, গাড়ির ভেতরে ভয়েস অ্যাসিস্ট্যান্ট এমন একটি অ্যাপ্লিকেশন যা কারও কারও কাছে নতুন হতে পারে, যা গাড়ির ভেতরে ভয়েস অ্যাসিস্ট্যান্টের সুযোগ করে দেয় যার ফলে গাড়ির কেবিনের ভিতরে বিভিন্ন তথ্য সরবরাহ করার জন্য হ্যান্ডস-ফ্রি সমাধান পাওয়া যায়।
অডিও এবং স্পিচ রিকগনিশন কোম্পানি সাউন্ডহাউন্ড জানিয়েছে যে তারাই প্রথম একটি ইন-ভেহিকেল ভয়েস অ্যাসিস্ট্যান্ট অফার করেছে যা জেনারেটিভ এআই-এর সাথে একটি প্রতিষ্ঠিত ভয়েস অ্যাসিস্ট্যান্টকে একত্রিত করে। সম্প্রতি, কোম্পানিটি প্রযুক্তিতে আরও উন্নয়নের ঘোষণা দিয়েছে, যা চালকদের সরলীকৃত এবং সহজ উপায়ে যানবাহনের হ্যান্ডবুক তথ্য অ্যাক্সেস করার সুযোগ করে দেবে।
আমরা নতুন বৈশিষ্ট্যগুলি এবং তারা কী অর্জন করতে পারে তা নিয়ে আলোচনা করার জন্য, সেইসাথে এই প্রযুক্তির ভবিষ্যত বিবেচনা করার জন্য সাউন্ডহাউন্ডের সিওও মাইকেল জাগোরসেকের সাথে কথা বলেছি।

জাস্ট অটো (জেএ): সাউন্ডহাউন্ড কে এবং কোম্পানিটি কী করে?
মাইকেল জাগোরসেক (এমজেড): আমরা নিজেদেরকে অটোমোটিভের জন্য ভয়েস এআই প্রযুক্তির একটি শীর্ষস্থানীয় স্বাধীন সরবরাহকারী হিসাবে বিবেচনা করি। মূলত, আমরা যা করি তা হল আমরা OEM-গুলিকে একটি সাদা লেবেলযুক্ত ভয়েস সহকারী সরবরাহ করি যাতে ড্রাইভার বা যাত্রীরা কেবল তাদের ভয়েসের মাধ্যমে গাড়ির ভিতরে এবং বাইরে গাড়ির তথ্যের সাথে যোগাযোগ করতে পারে।
আমরা ২০০৫ সালে আমাদের প্রযুক্তির উন্নয়ন শুরু করি। অ্যামাজন এবং গুগল যা করছিল তার সাথে আমরা ২০১৫ সালে এটি চালু করেছিলাম। মূল পার্থক্য হল, বড় প্রযুক্তি সরবরাহকারীরা গাড়িতে তাদের ভয়েস পরিষেবা সম্প্রসারণ করছিল, যেখানে আমরা যা করছিলাম তা হল গাড়ির এবং সেইজন্য OEM ব্র্যান্ডগুলির নিজস্ব ক্ষমতা এবং শক্তি বৃদ্ধি করা।
আমরা শেষ পর্যন্ত অটোমোটিভ অ্যাপ্লিকেশনগুলির জন্য অনেক ফিল্টারিং এবং ফলো-আপ করতে পারি, এমনকি এমনভাবে যা বড় প্রযুক্তি সরবরাহকারীরা পারেনি। মূল পার্থক্য হল এটি কেবল ChatGPT এর মতো কোনও কিছুতে ভয়েস ইন্টারফেস স্থাপন করা নয়; আমাদের সমস্ত ডোমেন রয়েছে: আবহাওয়া, নেভিগেশন, আগ্রহের বিষয়গুলি - যা রিয়েল-টাইম, যা ChatGPT বা অন্য কোনও বৃহৎ ভাষা মডেলের সাথে সংযুক্ত করা যেতে পারে। আমরা বিশ্বাস করি যে এই দুটি জিনিস একসাথে (মেশিন লার্নিং সহ সফ্টওয়্যার ইঞ্জিনিয়ারিং) সবচেয়ে শক্তিশালী সহকারী তৈরি করে এবং এটি এমন কিছু যা আমরা গত বছর চালু করেছি।
আমরা হুন্ডাই ব্র্যান্ড এবং ইউরোপের বিভিন্ন বাজারে প্রাধান্য বিস্তার করছি। আমরা স্টেলান্টিস এবং তাদের ২০টি ব্র্যান্ডের সাথে একটি গভীর কৌশলগত অংশীদারিত্বের অংশীদার, সেইসাথে তুর্কি মোটরগাড়ি প্রস্তুতকারক টগের সাথে, এবং আমরা আরও বেশ কয়েকটি OEM-এর সাথে কথা বলছি।
সম্প্রতি চালু হওয়া নতুন জেনারেটিভ এআই ফিচারটি নিয়ে কি আলোচনা করতে পারবেন?
আমরা যা অফার করি তার মূল উপাদানগুলির মধ্যে একটি হল এই ধারণা যে আপনি গাড়ির বাইরে এবং গাড়ির ভিতরে তথ্য অ্যাক্সেস করতে পারবেন। গাড়ির ম্যানুয়ালটি সর্বদা গাড়ি নির্মাতাদের জন্য একটি চ্যালেঞ্জ ছিল। এটি স্পষ্টতই মোটা এবং খুব বিস্তৃত; জিনিসগুলি খুঁজে বের করা স্পষ্টতই সকলের জন্য একটি চ্যালেঞ্জ। এটি এমন একটি 'বেদনাদায়ক বিষয়' যা গাড়ির মালিক প্রত্যেকেরই থাকে।
আমরা যা অফার করি তার মূল উপাদানগুলির মধ্যে একটি হল এই ধারণা যে আপনি গাড়ির বাইরে এবং গাড়ির ভিতরে তথ্য অ্যাক্সেস করতে পারেন।
আমরা যা করতে পারি তা হল এটি গ্রহণ করা এবং তারপর আমাদের সফ্টওয়্যার ইঞ্জিনিয়ারিং এবং বৃহৎ ভাষার মডেলের সমন্বয় ব্যবহার করে, ইনডেক্সিং এবং অনুসন্ধানের মালিকানাধীন মিশ্রণ ব্যবহার করে সেই ম্যানুয়ালটিকে ভয়েস সহ অ্যাক্সেসযোগ্য করে তোলা। বৃহৎ ভাষার মডেলগুলির নমনীয়তা ব্যাখ্যার জন্য অনেক জায়গা দেয়। লোকেদের বৈশিষ্ট্যটির নাম জানতে হবে না। তারা কেবল বলে, উদাহরণস্বরূপ: "আপনি যদি পাহাড়ের উপরে থাকেন তবে সেই বৈশিষ্ট্যটি কী যাতে আপনি নীচে পিছলে না যান?" সহকারী নির্ধারণ করে যে আপনি পাহাড়-হোল্ড সহায়তা বৈশিষ্ট্য সম্পর্কে কথা বলছেন।
এটি সত্যিই আমাদের মূল্যবোধকে শক্তিশালী করে। মূলত, আমরা বিশ্বাস করি যে ভয়েস অভিজ্ঞতা গাড়িরই একটি সম্প্রসারণ হওয়া উচিত।
দ্বিতীয়ত, গাড়িগুলি যত বেশি সফটওয়্যার-কেন্দ্রিক হয়ে উঠছে, মুদ্রিত ম্যানুয়ালটির ধারণাটি তত বেশি অপ্রচলিত হয়ে পড়ছে কারণ সফ্টওয়্যারটি ওভার দ্য এয়ার (OTA) আপডেট করা হয় এবং স্পষ্টতই এর কোনও হালনাগাদ মুদ্রিত সংস্করণ নেই। আরও OEM তাদের ম্যানুয়ালটি ইনফোটেইনমেন্ট সিস্টেমের মধ্যেই ডিজিটালভাবে উপলব্ধ করবে, তবে এটিও স্পষ্টতই অ্যাক্সেসের জন্য চ্যালেঞ্জ তৈরি করে, যেমনটি আপনি কল্পনা করতে পারেন।
এই প্রযুক্তি কি যেকোনো যানবাহনের সাথে সামঞ্জস্যপূর্ণ হবে?
প্রতিটি যানবাহনেরই কিছুটা হলেও শব্দ-সক্ষমতা থাকে। আমি বলব এর লিগ্যাসি অংশ হল এমবেডেড ক্ষমতা। এটি যানবাহনগুলিকে ক্লাউড বা কোনও পরিষেবার সাথে সংযুক্ত করার আগে ঘটে। তাদের কার্যকারিতা খুব সীমিত হবে।
যখন আমরা বাজারে প্রবেশ করি, তখন আমরা সংযুক্ত গাড়ির জন্য ক্লাউড ক্যাপাবিলিটি অফার করা শুরু করি। এর ফলে আমরা গাড়িতে আমাদের প্ল্যাটফর্মের মাধ্যমে আমাদের ক্ষমতা প্রদান করব এবং তারপর এর মাধ্যমে আমরা এই গাড়ির গোয়েন্দা বৈশিষ্ট্যটি উপলব্ধ করব।
আমরা কোনও একমুখী গাড়ি কোম্পানির এই পদ্ধতি বাস্তবায়ন করা উচিত বলে দ্বিধা করি না। কিছু ক্ষেত্রে, যদি তারা অ্যামাজন বা গুগল ব্যবহার চালিয়ে যেতে চায়, তবে তারা অবশ্যই তা করতে পারে। এর পাশাপাশি একটি স্বাধীন মালিকানাধীন ভয়েস সহকারী থাকা, আমরা মনে করি, তাদের ব্র্যান্ড কৌশলেরই একটি সম্প্রসারণ।
আমরা মনে করি যে এই প্রযুক্তির বৈশিষ্ট্যযুক্ত একটি আরও সুসংগঠিত এবং ব্র্যান্ডেড সহকারী থাকাই সর্বোত্তম উপায়, তবে স্পষ্টতই এর একাধিক উপায় রয়েছে।
আগামী তিন বছরে এই জায়গায় কী ঘটবে বলে আপনি ভবিষ্যদ্বাণী করেন?
আমি বলব যে এই উৎপাদক AI প্রযুক্তির চারপাশের সর্বশেষ উদ্ভাবনগুলি সত্যিই মানুষকে সত্যিকারের কথোপকথনমূলক AI এর সম্ভাবনা সম্পর্কে জাগিয়ে তুলেছে।
এটি গাড়ির জন্য ঠিক ততটাই কাজ করে যতটা স্মার্ট স্পিকার বা ভয়েস-সক্ষম যেকোনো কিছুর জন্য। ChatGPT এমন অনেক ব্যবহারের দরজা খুলে দেয় যা আগে ছিল না। গাড়ির ভেতরে থাকা লোকেরা বলতে পারে: "আমি এই জায়গায় ভ্রমণ করছি; আমার জন্য আপনার কি কোন পরামর্শ আছে?" একবার লোকেরা বুঝতে শুরু করলে যে এটি তাদের জীবনে অর্থপূর্ণ প্রভাব ফেলতে পারে, আমরা সেখানে আরও অনেক কার্যকলাপ দেখতে পাব।
আমি বলব যে এই উৎপাদক AI প্রযুক্তির চারপাশের সর্বশেষ উদ্ভাবনগুলি সত্যিই মানুষকে সত্যিকারের কথোপকথনমূলক AI এর সম্ভাবনা সম্পর্কে জাগিয়ে তুলেছে।
অন্যান্য যেসব বিষয় নিয়ে মানুষ ফ্লার্ট করেছে, কিন্তু এখনও তা প্রকাশ পায়নি, সেগুলো একটু বেশিই 'আবেগগত বুদ্ধিমত্তা' নামক কিছুর সাথে মিলে যায়। যদি আমি কোনও নির্দিষ্ট অনুভূতি অনুভব করি, তাহলে ভয়েস অ্যাসিস্ট্যান্ট সেই অনুযায়ী চিনতে এবং প্রতিক্রিয়া জানাতে পারে। এটি হল আবেগ সনাক্তকরণের ধারণা। যদি আমি রেগে যাই, তাহলে প্রতিক্রিয়ার মাধ্যমে সেই আবেগকে নিয়ন্ত্রণ করার কোন সুযোগ আছে কি?
উদাহরণস্বরূপ, এই মুহূর্তে যখন আপনি AI-কে একটি রসিকতা জিজ্ঞাসা করেন, তখন টেক্সট টু স্পিচ একই সুরে কথা বলে যেন আপনি এটিকে নিকটতম পেট্রোল পাম্পে যেতে বলছেন। আমার মনে হয় আসল টেক্সট টু স্পিচের জন্য অনেক নতুনত্ব আসবে যাতে এটি কী বলছে তার প্রেক্ষাপটের উপর ভিত্তি করে এর প্রতিক্রিয়া পরিবর্তন করা যায়। আমার মনে হয় এটি সত্যিই এই অনুভূতিটি আরও উন্মোচন করবে যে আপনি এমন কিছুর সাথে কথোপকথন করছেন যা কেবল কমান্ড গ্রহণকারী রোবটের চেয়ে কিছুটা বেশি বুদ্ধিমান বলে মনে হয়।
এছাড়াও, বক্তৃতা সনাক্তকরণ এবং কণ্ঠস্বর সনাক্তকরণ - প্রযুক্তিটি বিদ্যমান, কিন্তু OEM-তে এটি প্রদর্শিত হয়নি। তাই, কল্পনা করুন যদি আপনি আপনার গাড়িতে প্রবেশ করেন এবং হ্যালো বলেন। আপনার গাড়িটি আপনার কণ্ঠস্বর চিনতে পারে এবং "হাই" বলে। এটি অবশ্যই নাগালের মধ্যে, আমি আগামী কয়েক বছরের মধ্যে এটি ঘটতে দেখতে পাচ্ছি।
সবশেষে, কিন্তু কম গুরুত্বপূর্ণ নয়, নগদীকরণ এবং বাণিজ্য আমাদের রোডম্যাপে খুব বেশি। আমাদের ব্যবসার একটি অংশ হল আমরা ভয়েস-সক্ষম পরিষেবাগুলির পাশাপাশি রেস্তোরাঁ, খাবার অর্ডার, ড্রাইভ-থ্রু - প্রচুর সম্ভাবনা দেখতে পাই।
ধারণাটি হল আপনি স্বাভাবিক কণ্ঠস্বরের মাধ্যমে খাবার অর্ডার করতে পারেন অথবা ব্যবসায়িক প্রতিষ্ঠানকে যেকোনো প্রশ্ন জিজ্ঞাসা করতে পারেন। আমাদের কৌশল সবসময়ই ছিল গাড়িতে সেই পরিষেবাগুলি আনা এবং গাড়িটিকে আমাদের চারপাশের জগতে আরও শক্তিশালী প্রবেশদ্বার করে তোলা। আগামী কয়েক বছরের মধ্যে, আমরা এটি দেখতে পাচ্ছি, এবং এটি OEM-দের জন্য আকর্ষণীয় কারণ তাদের রাজস্ব চ্যালেঞ্জের দাম আরও কঠোর হচ্ছে। আমরা জানি যে EV গুলি লাভজনকভাবে বিক্রি হচ্ছে না, তাই অতিরিক্ত রাজস্বের ধরণ অত্যন্ত গুরুত্বপূর্ণ, এবং আমরা বিশ্বাস করি যে ভয়েস ইন্টারঅ্যাকশন এর কিছুটা আনলক করতে পারে।
তোমার কি মনে হয় AI সম্পর্কে মানুষের জানা উচিত এমন আর কিছু আছে?
যখন মানুষ প্রথম ভয়েস অ্যাসিস্ট্যান্টের কথা ভাবত, তখন আমি বলবো, প্রথম দিকের দিনগুলোতে - হয়তো সাত থেকে দশ বছর আগে - তারা প্রযুক্তিটি এবং এর সম্ভাব্য কার্যকারিতা আকর্ষণীয়ভাবে দেখেছিল। তারা এতে খুশি ছিল, কিন্তু তাদের কল্পনাশক্তিও অনেক বেশি শক্তিশালী ছিল। বিজ্ঞান কল্পকাহিনীর সিনেমাগুলি আয়রন ম্যানের জন্য জার্ভিসের মতো ধারণাগুলি উপস্থাপন করছিল। মানুষ যা করতে চাইত এবং যা করত তার মধ্যে সর্বদা এই ব্যবধান ছিল।
আমার মনে হয় অগ্রগতি এত দ্রুত হচ্ছে যে, আপনার সাথে কথা বলতে পারে এবং আপনার জন্য প্রস্তুত এমন একজন সহকারী থাকা উচিত, এই ধারণাটি আগের চেয়ে অনেক বেশি সহজলভ্য হয়ে উঠেছে।
আমরা এমন এক পর্যায়ে পৌঁছেছি যেখানে মানুষ বুঝতে পারছে যে তারা তাদের ভয়েস অ্যাসিস্ট্যান্টের সাথে কথা বলতে পারবে, শুধু আদেশ না দিয়ে। আমার মনে হয় একবার মানুষ এই আচরণে প্রবেশ করলে, তারা আর কখনও ফিরে যাবে না। একবার আপনি AI এর সাথে মূল্যবোধ তৈরি করে ফেললে, এটি কেবল আপনার কাজের এবং আপনার যোগাযোগের অংশ হয়ে ওঠে। ভাবনা হলো, আমরা সত্যিই সেই কথোপকথনমূলক ভয়েস অ্যাসিস্ট্যান্টকে সত্যিকার অর্থে গ্রহণ করার অবস্থানে আছি।
সূত্র থেকে জাস্ট অটো
দাবিত্যাগ: উপরে উল্লিখিত তথ্য Cooig.com থেকে স্বাধীনভাবে just-auto.com দ্বারা সরবরাহ করা হয়েছে। Cooig.com বিক্রেতা এবং পণ্যের গুণমান এবং নির্ভরযোগ্যতা সম্পর্কে কোনও প্রতিনিধিত্ব বা ওয়ারেন্টি দেয় না।