راهنمایی-هوش-مصنوعی

پلتفرم جدید AI برای یادگیری مشابه انسان‌ها

در اولین کلاس رانندگی‌تان، احتمالاً مربی در کنار شما نشسته بود و به‌طور فوری در مورد هر پیچ، توقف، و تنظیمات جزئی مشاوره می‌داد. اگر مربی شما یکی از والدین‌تان بود، ممکن است چند بار فرمان را گرفته و فریاد زده باشد “ترمز!” با گذشت زمان، این اصلاحات و بینش‌ها به تجربه و شهود تبدیل شد و شما را به یک راننده مستقل و توانمند کرد. اگرچه پیشرفت‌های هوش مصنوعی (AI) باعث شده‌اند که خودروهای خودران به واقعیت تبدیل شوند، روش‌های آموزشی که برای آموزش آن‌ها استفاده می‌شود، هنوز هم فاصله زیادی با حتی نگران‌ترین راننده کناری دارد. به جای ظرافت و آموزش در زمان واقعی، AI عمدتاً از طریق مجموعه‌های داده بزرگ و شبیه‌سازی‌های گسترده یاد می‌گیرد، بدون توجه به کاربرد آن.

اکنون، محققان دانشگاه دوک و آزمایشگاه تحقیقات ارتش، پلتفرمی را توسعه داده‌اند که به AI کمک می‌کند تا وظایف پیچیده را بیشتر شبیه به انسان‌ها انجام دهد. این پلتفرم که به اختصار GUIDE نامیده می‌شود، در کنفرانس آینده سیستم‌های پردازش اطلاعات عصبی (NeurIPS 2024) که از ۹ تا ۱۵ دسامبر در ونکوور کانادا برگزار می‌شود، به نمایش گذاشته خواهد شد.

بویوان چن، استاد مهندسی مکانیک و علم مواد، مهندسی برق و کامپیوتر و علوم کامپیوتر در دانشگاه دوک، که همچنین مدیریت آزمایشگاه رباتیک عمومی دوک را بر عهده دارد، توضیح داد: “برای AI چالش بزرگی است که وظایفی را که نیاز به تصمیم‌گیری سریع بر اساس اطلاعات یادگیری محدود دارند، مدیریت کند.” او افزود: “روش‌های آموزشی موجود معمولاً به دلیل وابستگی به مجموعه‌های داده گسترده پیشین محدود هستند و همچنین با قابلیت انطباق محدود رویکردهای بازخورد سنتی دست و پنجه نرم می‌کنند.” چن گفت: “هدف ما پر کردن این شکاف با گنجاندن بازخورد انسانی مداوم و در زمان واقعی بود.”

GUIDE به انسان‌ها این امکان را می‌دهد که در زمان واقعی به عملکرد AI نظارت کنند و بازخورد مستمر و دقیقی ارائه دهند. این شبیه به این است که یک مربی رانندگی ماهر فقط فریاد نزند “چپ” یا “راست”، بلکه راهنمایی‌های دقیقی ارائه دهد که به بهبود تدریجی و درک عمیق‌تر کمک کند.

📢 اگر عاشق علم هستید و نمی‌خواهید هیچ مقاله‌ای را از دست بدهید…

به کانال تلگرام ما بپیوندید! تمامی مقالات جدید روزانه در آنجا منتشر می‌شوند.

📲 عضویت در کانال تلگرام
پاپ‌آپ اطلاعیه با اسکرول
مربی رانندگی که به یک راننده تازه‌کار در حال یادگیری کمک می‌کند و به او بازخورد می‌دهد.
یادگیری رانندگی با کمک مربی، تصویری از تعامل انسان و آموزش عملی.

آزمایش اولیه GUIDE

در اولین مطالعه خود، GUIDE به AI کمک می‌کند تا بهترین روش را برای بازی قایم‌موشک یاد بگیرد. این بازی شامل دو بازیکن به شکل سوسک، یکی قرمز و دیگری سبز است. در حالی که هر دو توسط کامپیوتر کنترل می‌شوند، تنها بازیکن قرمز در حال پیشرفت در کنترل‌کننده AI خود است. بازی در یک میدان بازی مربعی با یک مانع به شکل C در مرکز انجام می‌شود. بیشتر میدان بازی سیاه و ناشناخته باقی می‌ماند تا زمانی که جستجوگر قرمز به مناطق جدید وارد شود و آنچه را که در آنجا وجود دارد، افشا کند. در حالی که بازیکن AI قرمز در حال تعقیب دیگری است، یک مربی انسانی بازخوردی در مورد استراتژی جستجوی آن ارائه می‌دهد.

در حالی که تلاش‌های قبلی برای این نوع استراتژی آموزشی تنها اجازه سه ورودی انسانی – خوب، بد یا خنثی – را می‌داد، GUIDE به انسان‌ها این امکان را می‌دهد که با قرار دادن نشانگر ماوس بر روی یک مقیاس گرادیان، بازخورد در زمان واقعی ارائه دهند. این آزمایش شامل ۵۰ شرکت‌کننده بزرگسال بدون آموزش یا دانش تخصصی قبلی بود که به‌طور قابل توجهی بزرگ‌ترین مطالعه از نوع خود به شمار می‌رود.

تحقیقات جدید در زمینه یادگیری تقویتی هوش مصنوعی

محققان دریافتند که تنها ۱۰ دقیقه بازخورد انسانی منجر به بهبود قابل توجهی در عملکرد هوش مصنوعی شده است. سیستم GUIDE توانسته است ۳۰ درصد افزایش در نرخ موفقیت نسبت به روش‌های پیشرفته یادگیری تقویتی انسانی موجود به دست آورد. لینگیو ژانگ، نویسنده اصلی و دانشجوی سال اول دکتری در آزمایشگاه چن، گفت: “این شواهد کمی و کیفی قوی، اثربخشی رویکرد ما را نشان می‌دهد.” او افزود: “این تحقیق نشان می‌دهد که چگونه GUIDE می‌تواند قابلیت انطباق را افزایش داده و به هوش مصنوعی کمک کند تا به‌طور مستقل در محیط‌های پیچیده و پویا حرکت کند و واکنش نشان دهد.”

پلتفرم یادگیری هوش مصنوعی GUIDE که رابطه بین انسان و AI را نشان می‌دهد.
پلتفرم جدید GUIDE که به هوش مصنوعی کمک می‌کند تا مانند انسان‌ها یاد بگیرد.

محققان همچنین نشان دادند که مربیان انسانی تنها برای مدت زمان کوتاهی واقعاً مورد نیاز هستند. در حین ارائه بازخورد توسط شرکت‌کنندگان، تیم تحقیق یک هوش مصنوعی مربی انسانی شبیه‌سازی‌شده بر اساس بینش‌های آن‌ها در سناریوهای خاص و در زمان‌های مشخص ایجاد کرد. این امر به هوش مصنوعی اجازه می‌دهد تا مدت‌ها پس از خستگی انسان از کمک به یادگیری، به آموزش ادامه دهد.

آموزش یک “مربی” هوش مصنوعی که به اندازه هوش مصنوعی که آن را آموزش می‌دهد، خوب نیست، ممکن است غیرمنطقی به نظر برسد، اما چن توضیح می‌دهد که این واقعاً یک کار انسانی است. او گفت: “در حالی که تسلط بر یک کار خاص برای کسی بسیار دشوار است، قضاوت درباره اینکه آیا در حال بهتر شدن است یا نه، کار سختی نیست.” چن افزود: “بسیاری از مربیان می‌توانند بازیکنان را به قهرمانی هدایت کنند بدون اینکه خودشان قهرمان باشند.”

تفاوت‌های فردی در مربیان انسانی

یک جنبه جالب دیگر برای GUIDE، بررسی تفاوت‌های فردی میان مربیان انسانی است. آزمون‌های شناختی که به تمام ۵۰ شرکت‌کننده داده شد، نشان داد که برخی از توانایی‌ها، مانند استدلال فضایی و تصمیم‌گیری سریع، تأثیر قابل توجهی بر چگونگی راهنمایی مؤثر یک فرد در آموزش هوش مصنوعی دارند. این نتایج، امکانات جالبی را نشان می‌دهد، از جمله تقویت این توانایی‌ها از طریق آموزش هدفمند و کشف عوامل دیگری که ممکن است به راهنمایی موفق هوش مصنوعی کمک کنند.

دو شخصیت سوسک در حال بازی قایم‌موشک با زمینه‌ای غنی و پرجنب و جوش.
بازی قایم‌موشک که در آن هوش مصنوعی با راهنمایی انسانی یاد می‌گیرد.

این سوالات به پتانسیل هیجان‌انگیزی برای توسعه چارچوب‌های آموزشی بیشتر انطباقی اشاره دارد که نه تنها بر آموزش هوش مصنوعی تمرکز دارند، بلکه بر تقویت قابلیت‌های انسانی برای تشکیل تیم‌های آینده انسان-هوش مصنوعی نیز تأکید می‌کنند. با پرداختن به این سوالات، محققان امیدوارند آینده‌ای را ایجاد کنند که در آن هوش مصنوعی نه تنها به طور مؤثرتر، بلکه به طور غریزی‌تر یاد بگیرد و فاصله بین شهود انسانی و یادگیری ماشین را پر کند و به هوش مصنوعی اجازه دهد تا در محیط‌هایی با اطلاعات محدود به طور خودکار عمل کند.

چن گفت: “با افزایش استفاده از فناوری‌های هوش مصنوعی، طراحی سیستم‌هایی که برای کاربران روزمره غریزی و قابل دسترس باشند، بسیار حیاتی است.” او افزود: “GUIDE راه را برای هوش مصنوعی هوشمندتر و پاسخگوتر هموار می‌کند که قادر به عملکرد خودکار در محیط‌های پویا و غیرقابل پیش‌بینی است.”

تحقیقات آینده

تیم تحقیقاتی آینده را با استفاده از سیگنال‌های ارتباطی متنوع، شامل زبان، حالات چهره، حرکات دست و موارد دیگر تصور می‌کند تا یک چارچوب جامع‌تر و غریزی‌تر برای یادگیری هوش مصنوعی از تعاملات انسانی ایجاد کند. این کار بخشی از مأموریت آزمایشگاه برای ساخت سیستم‌های هوشمند سطح بعدی است که با انسان‌ها همکاری می‌کنند تا وظایفی را انجام دهند که نه هوش مصنوعی و نه انسان به تنهایی نمی‌توانند حل کنند. این کار به طور جزئی توسط آزمایشگاه تحقیقات ارتش (W911NF2320182, W911NF2220113) حمایت می‌شود.

مقاله های شبیه به این مقاله

بیشتر بخوانید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *