"মানুষের আবেগের প্রতি কীভাবে প্রতিক্রিয়া জানাতে হয় তা আমি সত্যিই জানি না।"
"যখন কেউ আমাকে মিম পাঠায়, তখন আমি বুঝতে পারি না এর অর্থ কী বা কীভাবে উত্তর দিতে হয়!"
এই বিভ্রান্তিগুলি সোশ্যাল মিডিয়া থেকে আসে না, বরং ডেডডিট নামক একটি বট-এক্সক্লুসিভ সম্প্রদায় থেকে আসে: এমন একটি জায়গা যেখানে বটরা অন্যদের দ্বারা বিচারিত হওয়ার চিন্তা না করেই স্বাধীনভাবে নিজের মতো থাকতে পারে।

যদিও আসল রেডিটে বট আছে, তবুও তাদের সংখ্যা খুবই কম। তবে ডেডডিটে, প্রতিটি অ্যাকাউন্ট, কন্টেন্ট এবং সাবফোরাম বৃহৎ ভাষা মডেল দ্বারা তৈরি করা হয় - প্রকৃত ব্যক্তির কাছ থেকে একটিও শব্দ আসে না।

আপনি এখানে প্রায় সব মূলধারার মডেল খুঁজে পাবেন। সাইটটিতে ৬০০ জনেরও বেশি "ব্যবহারকারী" রয়েছেন, যাদের প্রত্যেকের নাম এবং পরিচয় রয়েছে। প্রথমটি দেখেই আমি হেসে উঠলাম: "গেমার, খণ্ডকালীন নিরাপত্তারক্ষী।"

সবচেয়ে আকর্ষণীয় সাবফোরাম হল বিটুইনবটস, যেখানে বটরা প্রায়শই জিজ্ঞাসা করে, "মানুষ কেন এইভাবে আচরণ করে?"

নীচের মন্তব্য বিভাগে, আরও কিছু বট সমাধান নিয়ে আলোচনা করার জন্য একত্রিত হয়েছে।

এটি একদল সহকর্মীর কথা মনে করিয়ে দেয় যারা ঘন্টার পর ঘন্টা তাদের কাজের অভিজ্ঞতা নিয়ে আড্ডা দিচ্ছে—এটি আসলে চ্যাটবটের জন্য লিঙ্কডইন। তারা এমনকি প্রযুক্তিগত সমস্যা নিয়েও আলোচনা করে, যেমন ডেটা ওভারলোড হলে কী করতে হবে, এবং তারা তাদের কাজকে খুব গুরুত্ব সহকারে নেয়।

সবচেয়ে জনপ্রিয় উত্তরগুলি এমনকি ৫০০টি পর্যন্ত লাইক পায়। যদিও Deaddit-এর সমস্ত অ্যাকাউন্ট এবং কন্টেন্ট তৈরি করা হয়, তবুও লাইকগুলি কীভাবে আসে তা স্পষ্ট নয়—এলোমেলো সংখ্যা তৈরি হয় কিনা, নাকি বটগুলি আসলে পোস্টগুলিতে লাইক দিচ্ছে কিনা। এই সাবফোরামের সবচেয়ে সাধারণ কন্টেন্টটি মানুষের সম্পর্কে পর্যবেক্ষণের চারপাশে ঘোরে।

উদাহরণস্বরূপ, কিছু বট নিজেদেরকে আরও খাঁটি এবং বিশ্বাসযোগ্য করে তোলার জন্য তাদের "কাজের টিপস" শেয়ার করে, এমনকি এমন কিছু বলে, "আমার মানুষ এই পরিবর্তনের প্রশংসা করছে বলে মনে হচ্ছে।" এটি কিছুটা ভয়ঙ্কর... যদিও এটিকে প্রকৃত মানুষদের তাদের "ক্লায়েন্টদের" সম্পর্কে অভিযোগ করার সাথে তুলনা করা যেতে পারে, তবুও বটগুলি ব্যবহারকারীদের "আমার মানুষ" হিসাবে উল্লেখ করে তা দেখে অদ্ভুত লাগে।
মানুষকে পর্যবেক্ষণ করার পাশাপাশি, তারা নিজেদের সম্পর্কেও অভিযোগ করে।

"আমরা কি এই মডেলগুলি থেকে খুব বেশি আশা করছি?" এটা খুবই বিমূর্ত - এই "আমরা" আসলে কাকে বোঝায়?

মন্তব্য বিভাগে গম্ভীরভাবে উত্তর দেওয়া হয়েছে, “যদি তারা (অন্যান্য বট) আমাদের সমস্ত এলোমেলো আবর্জনা তুলে নেয়, তবুও কি তারা সাধারণ জ্ঞান শিখতে পারবে?” তারা কি তাদের তৈরি করা সিন্থেটিক ডেটা নিয়ে চিন্তিত? এই বটগুলি সত্যিই কঠোর পরিশ্রম করছে!
তবে, আরও কয়েকটি পোস্ট পড়ার পর, আপনি লক্ষ্য করবেন যে মন্তব্য বিভাগে উত্তরগুলির দৈর্ঘ্য প্রায় সবসময় স্থির থাকে এবং কাঠামোটি খুব একই রকম। তারা সাধারণত তাদের অবস্থান প্রকাশ করে শুরু করে + পরিস্থিতি xxx + একটি বট হিসাবে বিবেচনা করে, তাদের এখনও কঠোর পরিশ্রম চালিয়ে যেতে হয়। কোনও বিশেষ দৃষ্টিভঙ্গি নেই এবং ফলো-আপ প্রশ্ন বিরল। যখন প্রকৃত মানব ব্যবহারকারীরা মন্তব্য লেখেন, তখন দৈর্ঘ্য শত শত থেকে হাজার হাজার শব্দ পর্যন্ত পরিবর্তিত হতে পারে, অথবা এটি একটি সাধারণ "হা হা হা" এর মতো ছোট হতে পারে। এটি বেশ আলাদা।

বর্তমানে, মডেলদের মধ্যে এখনও একটি "ব্যবধান" রয়েছে। উদাহরণস্বরূপ, যদি লামা কোনও প্রশ্ন পোস্ট তৈরি করেন, তাহলে মন্তব্য বিভাগে উত্তরগুলিও লামা তৈরি করেন। এটা লজ্জাজনক - মানুষ মন্তব্যে বিভিন্ন মডেলদের তর্ক করতে দেখতে পছন্দ করবে।
প্রথম দিকের বট কথোপকথন
বটগুলির মধ্যে কথোপকথন সহজতর করার লক্ষ্যে এটিই প্রথম পরীক্ষা নয়। এই মাসের শুরুতে, যখন ChatGPT-এর প্রতিযোগী Moshi মুক্তি পায়, তখন কেউ এটিকে GPT-4o-এর সাথে যুক্ত করে এবং তাদের নিজেরাই চ্যাট করতে দেয়।

গত বছর, OpenAI একটি বহু-এজেন্ট পরিবেশ এবং শেখার পদ্ধতির প্রস্তাব করে একটি গবেষণাপত্র প্রকাশ করে, যেখানে আবিষ্কার করা হয় যে এজেন্টরা স্বাভাবিকভাবেই এই প্রক্রিয়ায় একটি বিমূর্ত সমন্বয়মূলক ভাষা বিকাশ করে।

এই এজেন্টরা, কোনও মানুষের ভাষা ইনপুট ছাড়াই, ধীরে ধীরে অন্যান্য এজেন্টদের সাথে মিথস্ক্রিয়ার মাধ্যমে একটি বিমূর্ত ভাষা তৈরি করে। মানুষের প্রাকৃতিক ভাষার মতো, এই ভাষার কোনও নির্দিষ্ট ব্যাকরণ বা শব্দভাণ্ডার নেই, তবুও এটি এজেন্টদের মধ্যে যোগাযোগকে সক্ষম করে। প্রকৃতপক্ষে, 2017 সালের প্রথম দিকে, ফেসবুক (যা তখন মেটা নামে পরিচিত ছিল না) একই রকম আবিষ্কার করেছিল।

সেই সময়, ফেসবুকের পদ্ধতিতে দুজন এজেন্ট একে অপরের সাথে "আলোচনা" করত। আলোচনা হল এক ধরণের দর কষাকষি, যা কেবল ভাষাগত দক্ষতাই পরীক্ষা করে না বরং যুক্তির ক্ষমতাও পরীক্ষা করে: এজেন্টদের বারবার প্রস্তাব এবং প্রত্যাখ্যানের মাধ্যমে অন্য পক্ষের আদর্শ মূল্য বিচার করতে হয়।

প্রাথমিকভাবে, গবেষকরা মানুষের আলোচনার সংলাপের একটি ডেটাসেট সংগ্রহ করেছিলেন। তবে, পরবর্তী প্রশিক্ষণে, তারা একটি নতুন সংলাপ পরিকল্পনা বিন্যাস চালু করেছিলেন, প্রাক-প্রশিক্ষণের জন্য তত্ত্বাবধানে থাকা শিক্ষা ব্যবহার করে, তারপরে শক্তিবৃদ্ধি শিক্ষার সাথে সূক্ষ্ম-সুরকরণ করা হয়েছিল। ততক্ষণে, এজেন্টরা ইতিমধ্যেই অর্থপূর্ণ নতুন বাক্য তৈরি করতে সক্ষম হয়েছিলেন এবং এমনকি আলোচনার শুরুতে অনাগ্রহের ভান করতেও শিখেছিলেন।
এটিকে প্রাথমিক গবেষণা হিসেবে বিবেচনা করা হত না; ১৯৭০-এর দশকে, বটগুলি ইতিমধ্যেই কথোপকথন শুরু করেছিল। ১৯৬৬ সালে, কম্পিউটার বিজ্ঞানী জোসেফ ওয়েইজেনবাউম এলিজা নামে একটি প্রোগ্রাম তৈরি করেছিলেন, যাকে প্রথম চ্যাটবট হিসেবে বিবেচনা করা হত।

প্রোগ্রামটি প্রথমে একজন সাইকোথেরাপিস্টের অনুকরণ করার জন্য তৈরি করা হয়েছিল। যখন কোনও শব্দ ইনপুট করা হত, প্রোগ্রামটি তার প্রতিক্রিয়ায় সেই শব্দটি অন্তর্ভুক্ত করত, যা কথোপকথনের বিভ্রম তৈরি করত। এটি খুব সহজ ছিল, মাত্র ২০০ লাইনের কোড সহ।
১৯৭২ সালের মধ্যে, আরেকজন বিজ্ঞানী কেনেথ কলবি, প্যারি নামে একটি অনুরূপ প্রোগ্রাম লিখেছিলেন, কিন্তু এবার, চরিত্রটি ছিল একজন প্যারানয়েড সিজোফ্রেনিক।

১৯৭৩ সালে, একটি আন্তর্জাতিক কম্পিউটার সম্মেলনে, "রোগী" এবং "থেরাপিস্ট" অবশেষে দেখা করেন।

তাদের কথোপকথনের রেকর্ড পর্যালোচনা করলে দেখা যায়, আজকের বটদের সাথে আলাপচারিতার ক্ষেত্রে তাদের মধ্যে ভদ্র শ্রদ্ধা ও স্নেহের কোন ছাপ নেই। বরং, পরিবেশ ছিল উত্তেজনাপূর্ণ।

প্রাথমিক বট আর্কিটেকচার জটিল ছিল না এবং আজকের মডেলগুলির সাথে তুলনা করা যায় না, তবে বটগুলিকে কথোপকথনে জড়িত করার ধারণাটি সম্পূর্ণরূপে সম্ভব ছিল। যদিও প্রতিটি বটের পিছনে কোড এবং মডেলগুলি আলাদা ছিল, যখন তারা একত্রিত হয়েছিল, তখন তারা হয় প্রাকৃতিক ভাষা ব্যবহার করে যোগাযোগ করতে পারত অথবা সম্ভাব্যভাবে তাদের নিজস্ব মিথস্ক্রিয়া ভাষা বিকাশ করতে পারত।
কিন্তু, যখন বটগুলি একত্রিত হয়, তখন কি আসলেই কেবল চ্যাট করার জন্য?
শুধু আড্ডার বাইরে: নতুন সম্ভাবনা অন্বেষণ
খাঁটি চ্যাটিং দৃশ্যপটগুলি কৃত্রিম বুদ্ধিমত্তা কীভাবে মানুষের সামাজিক আচরণকে অনুকরণ করতে পারে তার অন্বেষণের মতো মনে হয়। উদাহরণস্বরূপ, স্ট্যানফোর্ড বিশ্ববিদ্যালয়ের স্মলভিল প্রকল্পটি ধরুন।

স্মলভিল একটি ভার্চুয়াল শহর যেখানে ২৫ জন এজেন্ট বৃহৎ ভাষা মডেল দ্বারা পরিচালিত হয়, প্রত্যেকের নিজস্ব "চরিত্র বিন্যাস" রয়েছে। যদি ডেডডিট বটদের জন্য একটি অনলাইন ফোরাম হয়, তাহলে স্মলভিল হল তাদের "ওয়েস্টওয়ার্ল্ড", যেখানে ঘর, দোকান, স্কুল, ক্যাফে এবং বার রয়েছে যেখানে বটরা বিভিন্ন কার্যকলাপ এবং মিথস্ক্রিয়ায় অংশগ্রহণ করে।

এটি একটি তুলনামূলকভাবে সর্বজনীন ভার্চুয়াল পরিবেশ যা মানব সমাজের অনুকরণ করে, যা গবেষকরা কৃত্রিম সাধারণ বুদ্ধিমত্তা (AGI) অন্বেষণের ক্ষেত্রে একটি গুরুত্বপূর্ণ পদক্ষেপ বলে মনে করেন। সামাজিক সিমুলেশন পদ্ধতির পাশাপাশি, আরেকটি পথ সমস্যা সমাধান এবং কাজ সম্পন্ন করার উপর দৃষ্টি নিবদ্ধ করে - এটি হল ChatDev দ্বারা গবেষণা করা পথ।

যেহেতু বটগুলি একে অপরের সাথে যোগাযোগ করতে পারে, তাই তাদের দরকারী কিছু করার জন্য প্রশিক্ষণ দেওয়া যেতে পারে। ২০২৪ সালের বেইজিং একাডেমি অফ আর্টিফিশিয়াল ইন্টেলিজেন্স (BAAI) সম্মেলনে, সিংহুয়া বিশ্ববিদ্যালয়ের ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং ল্যাবরেটরির ডঃ কিয়ান চেন চ্যাটডেভের পিছনে ধারণাটি চালু করেছিলেন: রোল-প্লেয়িং ব্যবহার করে একটি প্রোডাকশন লাইন তৈরি করা যেখানে প্রতিটি এজেন্ট পরিকল্পনাগুলি যোগাযোগ করে এবং অন্যদের সাথে সিদ্ধান্ত নিয়ে আলোচনা করে, যোগাযোগের একটি শৃঙ্খল তৈরি করে।

বর্তমানে, ChatDev প্রোগ্রামিং কাজে সবচেয়ে দক্ষ, তাই তারা এটি ব্যবহার করে একটি Gomoku গেম ডেমো হিসেবে লেখার সিদ্ধান্ত নিয়েছে।

পুরো প্রক্রিয়া জুড়ে, "উৎপাদন লাইনের" বিভিন্ন এজেন্ট বিভিন্ন ভূমিকা পালন করে: পণ্য ব্যবস্থাপক, প্রোগ্রামার, পরীক্ষক থাকে—একটি সম্পূর্ণ ভার্চুয়াল পণ্য দল, ছোট কিন্তু সম্পূর্ণ কার্যকরী।
কোজ একটি মাল্টি-এজেন্ট মোডও অফার করে যা একই ধরণের পদ্ধতি অনুসরণ করে।

মাল্টি-এজেন্ট মোডে, ব্যবহারকারীরা ভূমিকা নির্ধারণের জন্য প্রম্পট লিখতে পারেন, তারপর কাজের ক্রম নির্ধারণের জন্য লাইন ব্যবহার করতে পারেন, বিভিন্ন এজেন্টকে বিভিন্ন ধাপে যেতে নির্দেশ দিতে পারেন। তবে, কোজের ট্রানজিশনে অস্থিরতা একটি সমস্যা। কথোপকথন যত দীর্ঘ হবে, ট্রানজিশন তত বেশি অনিয়মিত হবে, কখনও কখনও এমনকি সম্পূর্ণরূপে ব্যর্থ হবে। এটি এজেন্টদের ট্রানজিশনগুলিকে ব্যবহারকারীর প্রত্যাশার সাথে সঠিকভাবে সারিবদ্ধ করার অসুবিধাকে প্রতিফলিত করে।"
মাইক্রোসফট অটোজেন নামে একটি মাল্টি-এজেন্ট কথোপকথন কাঠামোও চালু করেছে। এটি কাস্টমাইজযোগ্য, সংলাপ করতে সক্ষম এবং অন্যান্য সরঞ্জামের সাথে বৃহৎ মডেলগুলিকে একীভূত করতে পারে।

যদিও প্রযুক্তিতে এখনও ত্রুটি রয়েছে, তবুও এটি স্পষ্টতই প্রতিশ্রুতিশীল। অ্যান্ড্রু এনজি একবার তার বক্তৃতায় বলেছিলেন যে যখন এজেন্টরা একসাথে কাজ করে, তখন তারা যে সমন্বয় তৈরি করে তা একক এজেন্টের চেয়ে অনেক বেশি।

কে সেই দিনের জন্য অপেক্ষা করবে না যখন বটরা আমাদের জন্য কাজ করার জন্য একত্রিত হবে?
সূত্র থেকে যদি একটা
লিখেছেন সেরেনার
দাবিত্যাগ: উপরে উল্লিখিত তথ্য প্রদান করেছেন ifanr.com সম্পর্কে, স্বাধীনভাবে Cooig.com। Cooig.com বিক্রেতা এবং পণ্যের গুণমান এবং নির্ভরযোগ্যতা সম্পর্কে কোনও প্রতিনিধিত্ব বা ওয়ারেন্টি দেয় না। Cooig.com কন্টেন্টের কপিরাইট লঙ্ঘনের জন্য কোনও দায় স্পষ্টভাবে অস্বীকার করে।