ایجاد-فرضیه-تحقیقاتی-هوش-مصنوعی

ایجاد فرضیه‌های تحقیقاتی منحصر به فرد با کمک هوش مصنوعی

ایجاد یک فرضیه تحقیقاتی منحصر به فرد و امیدوارکننده، مهارتی اساسی برای هر دانشمند به شمار می‌آید. این فرآیند ممکن است زمان‌بر باشد؛ به‌طوری‌که دانشجویان دکترا ممکن است در سال اول تحصیل خود صرفاً در تلاش برای تصمیم‌گیری درباره موضوعات تحقیقات خود باشند. اما اگر هوش مصنوعی بتواند به این فرآیند کمک کند؟ محققان MIT راهی را برای تولید و ارزیابی خودکار فرضیه‌های تحقیقاتی امیدوارکننده در زمینه‌های مختلف، از طریق همکاری انسان و هوش مصنوعی، ایجاد کرده‌اند.

در مقاله‌ای جدید، آن‌ها توضیح می‌دهند که چگونه از این چارچوب برای ایجاد فرضیه‌های مبتنی بر شواهد استفاده کرده‌اند که با نیازهای تحقیقاتی برآورده‌نشده در زمینه مواد الهام‌گرفته از زیست‌شناسی هم‌راستا هستند. این مطالعه که امروز در نشریه Advanced Materials منتشر شده، به‌طور مشترک توسط علیرضا غفاری‌لاهی، پژوهشگر پسادکترا در آزمایشگاه مکانیک اتمی و مولکولی (LAMM)، و مارکوس بیولر، استاد مهندسی در دپارتمان‌های مهندسی عمران و محیط زیست و مهندسی مکانیک MIT، و مدیر LAMM نوشته شده است.

چارچوب SciAgents

چارچوبی که محققان آن را SciAgents نامیده‌اند، شامل چندین عامل هوش مصنوعی است که هر کدام قابلیت‌ها و دسترسی‌های خاصی به داده‌ها دارند. این عوامل از روش‌های “استدلال گرافی” استفاده می‌کنند، جایی که مدل‌های هوش مصنوعی از یک گراف دانش بهره می‌برند که روابط بین مفاهیم علمی مختلف را سازماندهی و تعریف می‌کند. این رویکرد چندعاملی، شبیه به نحوه سازماندهی سیستم‌های زیستی به‌عنوان گروه‌هایی از بلوک‌های سازنده ابتدایی است.

بیولر اشاره می‌کند که این اصل تقسیم و تسخیر یک الگوی بارز در زیست‌شناسی در سطوح مختلف است، از مواد تا گروه‌های حشرات و تمدن‌ها – همه نمونه‌هایی که در آن‌ها هوش کلی بسیار بیشتر از مجموع توانایی‌های افراد است. او می‌گوید: “با استفاده از چندین عامل هوش مصنوعی، ما در تلاش هستیم تا فرآیند کشف را شبیه‌سازی کنیم که جوامع علمی چگونه کشفیات را انجام می‌دهند. در MIT، ما این کار را با همکاری افرادی با زمینه‌های مختلف انجام می‌دهیم که در کافه‌ها یا در کریدور بی‌پایان MIT با هم برخورد می‌کنند. اما این فرآیند تصادفی و کند است. هدف ما شبیه‌سازی فرآیند کشف با بررسی این است که آیا سیستم‌های هوش مصنوعی می‌توانند خلاق باشند و کشفیات جدیدی انجام دهند.”

خودکارسازی ایده‌های خوب

همان‌طور که تحولات اخیر نشان داده‌اند، مدل‌های زبانی بزرگ (LLMs) توانایی قابل توجهی در پاسخ به سوالات، خلاصه‌سازی اطلاعات و انجام وظایف ساده دارند. اما آن‌ها در تولید ایده‌های جدید از صفر محدودیت‌های زیادی دارند. محققان MIT می‌خواستند سیستمی طراحی کنند که به مدل‌های هوش مصنوعی اجازه دهد فرآیند پیچیده‌تری را انجام دهند که فراتر از یادآوری اطلاعات آموخته‌‌شده باشد و به استخراج و ایجاد دانش جدید بپردازد.

تصویری از یک آزمایشگاه پیشرفته که محققان با سیستم‌های هوش مصنوعی برای تولید فرضیه‌های علمی همکاری می‌کنند.
همکاری محققان با سیستم‌های هوش مصنوعی برای ایجاد فرضیه‌های منحصر به فرد علمی.

پایه‌گذار این رویکرد یک گراف دانش هستی‌شناختی است که مفاهیم علمی مختلف را سازماندهی و ارتباطات بین آن‌ها را برقرار می‌کند. برای ایجاد این گراف‌ها، محققان مجموعه‌ای از مقالات علمی را به یک مدل هوش مصنوعی تولیدی وارد می‌کنند. در کارهای قبلی، بیولر از زمینه‌ای از ریاضیات به نام نظریه دسته‌ها استفاده کرده است تا به مدل هوش مصنوعی کمک کند تا انتزاعاتی از مفاهیم علمی به‌عنوان گراف‌ها ایجاد کند، که در آن روابط بین اجزا تعریف می‌شود و به‌گونه‌ای تحلیل می‌شود که سایر مدل‌ها بتوانند از طریق فرآیند استدلال گرافی به آن دسترسی پیدا کنند. این رویکرد به مدل‌های هوش مصنوعی کمک می‌کند تا روش‌های اصولی‌تری برای درک مفاهیم توسعه دهند و همچنین به آن‌ها اجازه می‌دهد تا در حوزه‌های مختلف بهتر تعمیم دهند.

بیولر می‌گوید: “این برای ما بسیار مهم است که مدل‌های هوش مصنوعی متمرکز بر علم ایجاد کنیم، زیرا نظریه‌های علمی معمولاً بر اصول قابل تعمیم استوارند نه فقط یادآوری دانش. با تمرکز بر مدل‌های هوش مصنوعی بر ‘تفکر’ به این شیوه، می‌توانیم از روش‌های متداول فراتر برویم و کاربردهای خلاقانه‌تری از هوش مصنوعی را بررسی کنیم.”

برای مقاله اخیر، محققان از حدود ۱۰۰۰ مطالعه علمی در زمینه مواد زیستی استفاده کردند، اما بیولر می‌گوید که گراف‌های دانش می‌توانند با استفاده از تعداد بیشتری یا کمتری از مقالات تحقیقاتی از هر زمینه‌ای تولید شوند. با ایجاد گراف، محققان یک سیستم هوش مصنوعی برای کشف علمی توسعه دادند که شامل چندین مدل تخصصی است که نقش‌های خاصی در سیستم ایفا می‌کنند. بیشتر اجزا بر اساس مدل‌های سری ChatGPT-4 اوپن‌ای‌آی ساخته شده‌اند و از تکنیکی به نام یادگیری در زمینه استفاده می‌کنند، که در آن ورودی‌ها اطلاعات زمینه‌ای درباره نقش مدل در سیستم را فراهم می‌کنند و به آن اجازه می‌دهند از داده‌های ارائه‌شده یاد بگیرد.

عوامل فردی در این چارچوب با یکدیگر تعامل دارند تا به‌طور جمعی یک مشکل پیچیده را حل کنند که هیچ‌یک از آن‌ها به تنهایی قادر به انجام آن نیستند. اولین وظیفه‌ای که به آن‌ها داده می‌شود، تولید فرضیه تحقیقاتی است.

تعاملات LLM و گراف دانش

تعاملات LLM پس از تعریف یک زیرگراف از گراف دانش آغاز می‌شود. این فرآیند می‌تواند به‌طور تصادفی یا با وارد کردن دستی یک جفت کلمه کلیدی که در مقالات بحث شده‌اند، انجام شود. در این چارچوب، یک مدل زبانی که محققان آن را “اونتولوژیست” نامیده‌اند، مسئول تعریف اصطلاحات علمی در مقالات و بررسی ارتباطات بین آن‌ها است و گراف دانش را گسترش می‌دهد.

نموداری نمایانگر چارچوب SciAgents با چندین عامل هوش مصنوعی که به شکل گراف دانش در حال تعامل هستند.
تعامل عوامل هوش مصنوعی در چارچوب SciAgents به‌منظور تولید نوآوری‌های علمی.

پیشنهاد تحقیق و توسعه ایده‌ها

مدلی به نام “دانشمند 1” سپس یک پیشنهاد تحقیقاتی بر اساس عواملی مانند توانایی کشف ویژگی‌های غیرمنتظره و نوآوری ارائه می‌دهد. این پیشنهاد شامل بحثی درباره یافته‌های بالقوه، تأثیر تحقیق و حدس‌هایی درباره مکانیزم‌های زیرین عمل است. مدل “دانشمند 2” بر روی ایده گسترش می‌یابد و روش‌های تجربی و شبیه‌سازی خاصی را پیشنهاد می‌کند و بهبودهای دیگری نیز ارائه می‌دهد. در نهایت، مدل “منتقد” نقاط قوت و ضعف را برجسته کرده و پیشنهاداتی برای بهبود بیشتر ارائه می‌دهد.

بوهلر می‌گوید: “هدف این است که تیمی از کارشناسان بسازیم که همه به یک شکل فکر نکنند. آن‌ها باید به شیوه‌های متفاوت فکر کنند و قابلیت‌های مختلفی داشته باشند. عامل منتقد به‌طور عمدی برنامه‌ریزی شده است تا به نقد دیگران بپردازد، بنابراین همه نمی‌گویند که این یک ایده عالی است. بلکه یک عامل می‌گوید: ‘اینجا یک ضعف وجود دارد، می‌توانید آن را بهتر توضیح دهید؟’ این امر خروجی را بسیار متفاوت از مدل‌های تکی می‌کند.”

تقویت سیستم

سایر عوامل در سیستم قادر به جستجوی ادبیات موجود هستند که به سیستم این امکان را می‌دهد تا نه تنها قابلیت اجرایی را ارزیابی کند بلکه نوآوری هر ایده را نیز ایجاد و ارزیابی کند.

برای اعتبارسنجی رویکرد خود، بوهلر و غفاری‌لاهی گراف دانشی را بر اساس کلمات “ابریشم” و “انرژی‌بر” ساختند. با استفاده از این چارچوب، مدل “دانشمند 1” پیشنهاد ادغام ابریشم با رنگدانه‌های مبتنی بر دندلیون را برای ایجاد بیومواد با خواص نوری و مکانیکی بهبود یافته ارائه داد. این مدل پیش‌بینی کرد که ماده به‌طور قابل توجهی قوی‌تر از مواد ابریشم سنتی خواهد بود و برای پردازش انرژی کمتری نیاز دارد.

سپس “دانشمند 2” پیشنهاداتی ارائه داد، از جمله استفاده از ابزارهای شبیه‌سازی دینامیک مولکولی خاص برای بررسی نحوه تعامل مواد پیشنهادی و افزود که یک کاربرد خوب برای این ماده می‌تواند یک چسب الهام‌گرفته از طبیعت باشد. مدل منتقد سپس چندین نقطه قوت ماده پیشنهادی و زمینه‌های بهبود را برجسته کرد، از جمله مقیاس‌پذیری، پایداری درازمدت و تأثیرات زیست‌محیطی استفاده از حلال.

تصویری از مدل‌های هوش مصنوعی به‌نام‌های 'دانشمند 1'، 'دانشمند 2' و 'منتقد' که در حال بحث درباره یک پیشنهاد تحقیقاتی هستند.
گفت‌وگوی فعال مدل‌های هوش مصنوعی در زمینه پیش‌نهاد تحقیقاتی و نقد ایده‌ها.

برای رفع این نگرانی‌ها، منتقد پیشنهاد کرد که مطالعات آزمایشی برای اعتبارسنجی فرآیند انجام شود و تحلیل‌های دقیقی از دوام مواد صورت گیرد. محققان همچنین آزمایش‌های دیگری با کلمات کلیدی به‌طور تصادفی انتخاب شده انجام دادند که فرضیات اصلی مختلفی درباره چیپ‌های میکروسیال بیومیمتیک کارآمدتر، بهبود خواص مکانیکی داربست‌های مبتنی بر کلاژن و تعامل بین گرافن و فیبرهای آمیلوئید برای ایجاد دستگاه‌های بیوالکترونیکی تولید کرد.

غفاری‌لاهی می‌گوید: “این سیستم توانست این ایده‌های جدید و دقیق را بر اساس مسیر گراف دانش ارائه دهد. از نظر نوآوری و کاربرد، مواد به‌نظر قوی و نوآورانه بودند. در کارهای آینده، ما قصد داریم هزاران یا ده‌ها هزار ایده تحقیقاتی جدید تولید کنیم و سپس می‌توانیم آن‌ها را دسته‌بندی کنیم و سعی کنیم بهتر بفهمیم که این مواد چگونه تولید می‌شوند و چگونه می‌توانند بیشتر بهبود یابند.”

آینده و ابزارهای جدید

در آینده، محققان امیدوارند که ابزارهای جدیدی برای بازیابی اطلاعات و اجرای شبیه‌سازی‌ها به چارچوب‌های خود اضافه کنند. آن‌ها همچنین می‌توانند به‌راحتی مدل‌های پایه را در چارچوب‌های خود با مدل‌های پیشرفته‌تر تعویض کنند، که به سیستم اجازه می‌دهد با آخرین نوآوری‌ها در زمینه هوش مصنوعی سازگار شود.

بوهلر می‌گوید: “به دلیل نحوه تعامل این عوامل، بهبود در یک مدل، حتی اگر جزئی باشد، تأثیر زیادی بر رفتارها و خروجی کلی سیستم دارد.” از زمان انتشار پیش‌نویس با جزئیات منبع باز رویکرد خود، محققان با صدها نفر که به استفاده از این چارچوب‌ها در زمینه‌های علمی مختلف و حتی در زمینه‌هایی مانند مالی و امنیت سایبری علاقه‌مند بودند، تماس گرفته‌اند.

بوهلر می‌گوید: “کارهای زیادی وجود دارد که می‌توانید بدون رفتن به آزمایشگاه انجام دهید. شما اساساً می‌خواهید در انتهای فرآیند به آزمایشگاه بروید. آزمایشگاه هزینه‌بر و زمان‌بر است، بنابراین شما به سیستمی نیاز دارید که بتواند به عمق بهترین ایده‌ها برود، بهترین فرضیات را فرموله کند و رفتارهای نوظهور را به‌طور دقیق پیش‌بینی کند. چشم‌انداز ما این است که این کار را آسان کنیم، به‌طوری که بتوانید از یک اپلیکیشن برای وارد کردن ایده‌های دیگر یا کشیدن مجموعه داده‌ها استفاده کنید تا واقعاً مدل را به چالش بکشید و کشفیات جدیدی انجام دهید.”

مقاله های شبیه به این مقاله

بیشتر بخوانید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *