ایجاد-فرضیه-تحقیقاتی-هوش-مصنوعی

ایجاد فرضیه‌های پژوهشی نوآورانه با یاری هوش مصنوعی

تدوین یک فرضیهٔ پژوهشی بکر و امیدبخش، مهارتی بنیادین برای هر پژوهشگری به‌حساب می‌آید. این فرایند ممکن است زمان‌بر باشد؛ طوری‌که دانشجویان دکترا گاهی در سال‌های ابتدایی تحصیلشان، تنها درگیر تصمیم‌گیری دربارهٔ موضوع تحقیقات خود می‌شوند. حالا تصور کنید هوش مصنوعی بتواند در این مسیر یاری‌رسان باشد؟ پژوهشگران MIT راهی را برای پدیدآوردن و ارزیابی خودکار فرضیه‌های پژوهشی نویدبخش در حوزه‌های گوناگون، از طریق همکاری انسان و هوش مصنوعی، یافته‌اند.

در مقاله‌ای تازه، آن‌ها شرح می‌دهند که چگونه از این چارچوب برای تولید فرضیه‌های مبتنی بر شواهد استفاده کرده‌اند که با نیازهای پژوهشی برآورده‌نشده در زمینهٔ مواد الهام‌گرفته از زیست‌شناسی، هم‌خوانی دارد. این پژوهش که امروز در نشریهٔ Advanced Materials منتشر شده، حاصل همکاری علیرضا غفاری‌لاهی، پژوهشگر پسادکترا در آزمایشگاه مکانیک اتمی و مولکولی (LAMM)، و مارکوس بیولر، استاد مهندسی در دانشکده‌های مهندسی عمران و محیط زیست و مهندسی مکانیک MIT، و مدیر LAMM، است.

چارچوب SciAgents

چارچوبی که پژوهشگران آن را SciAgents نامیده‌اند، شامل چند عامل هوش مصنوعی است که هر کدام قابلیت‌ها و دسترسی‌های ویژه‌ای به داده‌ها دارند. این عوامل از شیوه‌های «استدلال گرافی» بهره می‌برند؛ جایی که مدل‌های هوش مصنوعی از یک گراف دانش استفاده می‌کنند که روابط بین مفاهیم مختلف علمی را ساختاردهی و تعریف می‌کند. این رویکرد چندعاملی، به نحوهٔ ساختاردهی سامانه‌های زیستی به‌عنوان گروه‌هایی از واحدهای سازندهٔ پایه شباهت دارد.

بیولر اشاره می‌کند که این اصل «تفرقه و غلبه» یک الگو است که در زیست‌شناسی در سطوح گوناگون دیده می‌شود، از مواد گرفته تا دسته‌های حشرات و تمدن‌ها—همه نمونه‌هایی که در آن‌ها هوش کلی بسیار فراتر از مجموع توانایی‌های افراد است. او می‌گوید: «با استفاده از چندین عامل هوش مصنوعی، ما در تلاشیم تا فرایند کشف را بازآفرینی کنیم که جوامع علمی چگونه اکتشاف‌ها را انجام می‌دهند. در MIT، ما این کار را با همکاری افرادی از زمینه‌های مختلف انجام می‌دهیم که در کافه‌ها یا در راه‌روهای بی‌پایان MIT با هم برخورد می‌کنند. اما این فرایند تصادفی و کند است. هدف ما بازسازی فرایند اکتشاف با بررسی این است که آیا سامانه‌های هوش مصنوعی می‌توانند خلاق باشند و اکتشافات نوینی انجام دهند.»

خودکارسازی ایده‌های خوب

همان‌طور که تحولات اخیر نشان داده‌اند، مدل‌های زبانی بزرگ (LLMs) توانایی‌های شایان توجهی در پاسخ‌گویی به پرسش‌ها، خلاصه‌سازی اطلاعات و انجام وظایف ساده دارند. اما آن‌ها در تولید ایده‌های جدید از صفر، محدودیت‌های فراوانی دارند. پژوهشگران MIT می‌خواستند سیستمی بسازند که به مدل‌های هوش مصنوعی اجازه دهد فرایند پیچیده‌تری را انجام دهند که فراتر از یادآوری اطلاعات آموخته‌شده باشد و به استخراج و ابداع دانش تازه بپردازد.

تصویر از یک آزمایشگاه مجهز که در آن پژوهشگران با سامانه‌های هوش مصنوعی برای تولید فرضیه‌های علمی مشارکت دارند.
همکاری پژوهشگران با سامانه‌های هوش مصنوعی برای ساخت فرضیه‌های علمی بی‌نظیر.

بنای این رویکرد، یک گراف دانش هستی‌شناختی است که مفاهیم علمی گوناگون را ساختاربندی کرده و ارتباط آن‌ها را برقرار می‌کند. برای ایجاد این گراف‌ها، پژوهشگران مجموعه‌ای از مقالات علمی را وارد یک مدل هوش مصنوعی مولد می‌کنند. در کارهای قبلی، بیولر از یک زمینه از ریاضیات به نام نظریهٔ رده‌ها بهره برد تا به مدل هوش مصنوعی یاری رساند انتزاعاتی از مفاهیم علمی به شکل گراف‌ها بسازد، که در آن روابط بین اجزا تعریف می‌شود و به گونه‌ای تحلیل می‌شود که سایر مدل‌ها بتوانند از طریق فرایند استدلال گرافی به آن دسترسی یابند. این رویکرد به مدل‌های هوش مصنوعی کمک می‌کند شیوه‌های اصولی‌تری برای درک مفاهیم توسعه دهند و همچنین به آن‌ها اجازه می‌دهد در حوزه‌های مختلف بهتر تعمیم دهند.

بیولر می‌گوید: «برای ما بسیار مهم است که مدل‌های هوش مصنوعی متمرکز بر دانش را ایجاد کنیم، زیرا نظریه‌های علمی معمولاً بر اصول قابل تعمیم تکیه دارند، نه فقط بر یادآوری دانش. با متمرکز کردن مدل‌های هوش مصنوعی بر «تفکر» به این شیوه، می‌توانیم از شیوه‌های معمول فراتر رویم و کاربردهای خلاقانه‌تری از هوش مصنوعی را بررسی کنیم.»

برای مقالهٔ اخیر، پژوهشگران از حدود ۱۰۰۰ مطالعهٔ علمی در زمینهٔ مواد بیولوژیکی استفاده کردند، اما بیولر می‌افزاید گراف‌های دانش را می‌توان با استفاده از تعداد بیشتری یا کم‌تری از مقالات پژوهشی از هر حوزه‌ای پدید آورد. با ایجاد گراف، پژوهشگران یک سامانهٔ هوش مصنوعی برای اکتشاف علمی توسعه دادند که شامل چندین مدل تخصصی است که نقش‌های ویژه‌ای در سامانه ایفا می‌کنند. بیشتر اجزا بر اساس نسخه‌های سری ChatGPT-4 شرکت OpenAI ساخته شده‌اند و از فن یادگیری از محیط استفاده می‌کنند، که در آن ورودی‌ها اطلاعات زمینه‌ای دربارهٔ نقش مدل در سامانه را فراهم می‌آورند و به آن اجازه می‌دهد از داده‌های ارائه‌شده یاد بگیرد.

عوامل مجزا در این چارچوب، با یکدیگر تعامل دارند تا به‌صورت جمعی یک مسئلهٔ پیچیده را حل کنند که هیچ‌یک از آن‌ها به تنهایی قدرت انجام آن را ندارد. اولین وظیفه‌ای که به آن‌ها واگذار می‌شود، تولید یک فرضیهٔ پژوهشی است.

تعاملات LLM و گراف دانش

تعاملات LLM، پس از تعریف یک زیرگراف از گراف دانش، آغاز می‌شود. این فرایند می‌تواند به‌صورت تصادفی یا با وارد کردن دستی یک جفت کلمه کلیدی که در مقالات مورد بحث قرار گرفته‌اند، انجام شود. در این چارچوب، یک مدل زبانی که پژوهشگران آن را «هستی‌شناس» نامیده‌اند، مسئول تعریف اصطلاحات علمی در مقالات و بررسی روابط بین آن‌ها و گسترش گراف دانش است.

نموداری که چارچوب SciAgents را با چندین عامل هوش مصنوعی که به شکل گراف دانش با هم در تعامل هستند، نشان می‌دهد.
هم‌کاری عوامل هوش مصنوعی در چارچوب SciAgents به‌منظور تولید نوآوری‌های علمی.

ارائهٔ طرح پژوهشی و توسعهٔ ایده‌ها

مدلی به نام «دانشمند ۱»، سپس یک طرح پژوهشی را بر اساس عواملی مانند توانایی کشف ویژگی‌های غیرمنتظره و نوآوری، پیشنهاد می‌دهد. این طرح شامل بحثی دربارهٔ نتایج احتمالی، تأثیر پژوهش و حدس‌هایی دربارهٔ مکانیسم‌های زیربنایی عملکرد است. مدل «دانشمند ۲» روی ایده کار می‌کند و شیوه‌های تجربی و شبیه‌سازی ویژه‌ای را پیشنهاد می‌دهد و بهبودهای دیگری نیز ارائه می‌دهد. در پایان، مدل «منتقد» نقاط قوت و ضعف را برجسته می‌کند و پیشنهادهایی برای بهبود بیشتر ارائه می‌دهد.

بوهلر می‌گوید: «هدف این است که تیمی از متخصصان بسازیم که همه به یک شکل فکر نکنند. آن‌ها باید به شیوه‌های گوناگون فکر کنند و قابلیت‌های مختلفی داشته باشند. عامل منتقد، عمداً طوری برنامه‌ریزی شده است که به نقد بقیه بپردازد، بنابراین همه نمی‌گویند که این یک ایدهٔ فوق‌العاده است. بلکه یک عامل می‌گوید: «این‌جا یک نقطه ضعف وجود دارد، می‌توانید آن را بهتر توضیح دهید؟» این کار، خروجی را با مدل‌های تکی تفاوت زیادی می‌دهد.»

تقویت سامانه

سایر عوامل موجود در سامانه، قادر به جستجوی در ادبیات موجود هستند که به سامانه این امکان را می‌دهد که نه تنها قابلیت اجرایی را ارزیابی کند، بلکه نوآوری هر ایده را نیز ایجاد و ارزیابی کند.

برای اعتبارسنجی رویکرد خود، بوهلر و غفاری‌لاهی یک گراف دانش را بر اساس کلمات «ابریشم» و «انرژی‌بر» ساختند. با استفاده از این چارچوب، مدل «دانشمند ۱» پیشنهاد تلفیق ابریشم با رنگدانه‌های مبتنی بر قاصدک را برای ایجاد زیست‌موادی با ویژگی‌های نوری و مکانیکی بهبودیافته ارائه داد. این مدل پیش‌بینی کرد که این ماده به‌طور قابل توجهی محکم‌تر از مواد ابریشم معمولی خواهد بود و به انرژی کم‌تری برای پردازش نیاز دارد.

سپس «دانشمند ۲» پیشنهاداتی ارائه داد، از جمله استفاده از ابزارهای شبیه‌سازی دینامیک مولکولی خاص برای بررسی این‌که مواد پیشنهادی چگونه با هم تعامل می‌کنند و افزود که یک کاربرد خوب برای این ماده می‌تواند یک چسب الهام‌گرفته از طبیعت باشد. مدل منتقد سپس چندین نقطهٔ قوت مادهٔ پیشنهادی و حوزه‌هایی برای بهبود را برجسته کرد، از جمله مقیاس‌پذیری، پایداری درازمدت و تأثیرات زیست‌محیطی استفاده از حلال.

تصویری از مدل‌های هوش مصنوعی با نام‌های 'دانشمند 1'، 'دانشمند 2' و 'منتقد' که در حال بحث دربارهٔ یک طرح پژوهشی هستند.
گفت‌وگوی فعال مدل‌های هوش مصنوعی دربارهٔ طرح پژوهشی و نقد ایده‌ها.

برای رفع این نگرانی‌ها، منتقد پیشنهاد کرد که مطالعات آزمایشی برای اعتبارسنجی فرایند انجام شود و تحلیل‌های دقیقی از ماندگاری مواد صورت گیرد. پژوهشگران همچنین آزمایش‌های دیگری را با کلمات کلیدی به‌طور تصادفی انتخاب شده انجام دادند که باعث ایجاد فرضیه‌های اساسی گوناگونی دربارهٔ تراشه‌های میکروسیال شبیه‌ساز زیستی کارآمدتر، بهبود ویژگی‌های مکانیکی داربست‌های مبتنی بر کلاژن و تعامل بین گرافن و فیبرهای آمیلوئید برای ساخت دستگاه‌های بیوالکترونیکی شد.

غفاری‌لاهی می‌گوید: «این سامانه توانست این ایده‌های جدید و دقیق را بر اساس مسیر گراف دانش ارائه دهد. از نقطه نظر نوآوری و کاربرد، مواد به‌نظر قوی و نوآورانه آمده‌اند. در کارهای آینده، ما قصد داریم هزاران یا ده‌ها هزار ایدهٔ پژوهشی جدید تولید کنیم و سپس می‌توانیم آن‌ها را دسته‌بندی کنیم و سعی کنیم بهتر بفهمیم که این مواد چگونه ساخته می‌شوند و چگونه می‌توانند بیشتر بهبود یابند.»

آینده و ابزارهای نو

در آینده، پژوهشگران امیدوارند ابزارهای جدیدی برای بازیابی اطلاعات و انجام شبیه‌سازی‌ها به چارچوب‌های خود اضافه کنند. آن‌ها همچنین می‌توانند به آسانی مدل‌های پایه را در چارچوب‌های خود با مدل‌های پیشرفته‌تر جایگزین کنند، که به سامانه اجازه می‌دهد با تازه‌ترین نوآوری‌ها در عرصهٔ هوش مصنوعی سازگار شود.

بوهلر می‌گوید: «به دلیل نحوهٔ تعامل این عوامل، بهبود در یک مدل، حتا اگر جزئی باشد، تأثیر زیادی بر رفتارها و خروجی کلی سامانه دارد.» از زمان انتشار پیش‌نویس با شرح جزئیات منبع باز رویکرد خود، پژوهشگران با صدها نفر که به استفاده از این چارچوب‌ها در حوزه‌های علمی گوناگون و حتا در حوزه‌هایی مانند مالی و امنیت سایبری علاقه‌مند بودند، تماس گرفته‌اند.

بوهلر می‌گوید: «کارهای زیادی هست که می‌توانید بدون رفتن به آزمایشگاه انجام دهید. شما اساساً می‌خواهید در انتهای فرایند به آزمایشگاه بروید. آزمایشگاه پرهزینه و وقت‌گیر است، بنابراین شما به سامانه‌ای نیاز دارید که بتواند به عمق بهترین ایده‌ها برود، بهترین فرضیات را فرموله کند و رفتارهای نوظهور را به‌طور دقیق پیش‌بینی کند. چشم‌انداز ما این است که این کار را آسان کنیم، طوری‌که بتوانید از یک برنامه کاربردی برای وارد کردن ایده‌های دیگر یا وارد کردن مجموعه داده‌ها استفاده کنید تا واقعاً مدل را به چالش بکشید و اکتشافات جدیدی انجام دهید.»

مقاله های شبیه به این مقاله

بیشتر بخوانید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *