ایجاد فرضیههای پژوهشی نوآورانه با یاری هوش مصنوعی
تدوین یک فرضیهٔ پژوهشی بکر و امیدبخش، مهارتی بنیادین برای هر پژوهشگری بهحساب میآید. این فرایند ممکن است زمانبر باشد؛ طوریکه دانشجویان دکترا گاهی در سالهای ابتدایی تحصیلشان، تنها درگیر تصمیمگیری دربارهٔ موضوع تحقیقات خود میشوند. حالا تصور کنید هوش مصنوعی بتواند در این مسیر یاریرسان باشد؟ پژوهشگران MIT راهی را برای پدیدآوردن و ارزیابی خودکار فرضیههای پژوهشی نویدبخش در حوزههای گوناگون، از طریق همکاری انسان و هوش مصنوعی، یافتهاند.
در مقالهای تازه، آنها شرح میدهند که چگونه از این چارچوب برای تولید فرضیههای مبتنی بر شواهد استفاده کردهاند که با نیازهای پژوهشی برآوردهنشده در زمینهٔ مواد الهامگرفته از زیستشناسی، همخوانی دارد. این پژوهش که امروز در نشریهٔ Advanced Materials منتشر شده، حاصل همکاری علیرضا غفاریلاهی، پژوهشگر پسادکترا در آزمایشگاه مکانیک اتمی و مولکولی (LAMM)، و مارکوس بیولر، استاد مهندسی در دانشکدههای مهندسی عمران و محیط زیست و مهندسی مکانیک MIT، و مدیر LAMM، است.
چارچوب SciAgents
چارچوبی که پژوهشگران آن را SciAgents نامیدهاند، شامل چند عامل هوش مصنوعی است که هر کدام قابلیتها و دسترسیهای ویژهای به دادهها دارند. این عوامل از شیوههای «استدلال گرافی» بهره میبرند؛ جایی که مدلهای هوش مصنوعی از یک گراف دانش استفاده میکنند که روابط بین مفاهیم مختلف علمی را ساختاردهی و تعریف میکند. این رویکرد چندعاملی، به نحوهٔ ساختاردهی سامانههای زیستی بهعنوان گروههایی از واحدهای سازندهٔ پایه شباهت دارد.
بیولر اشاره میکند که این اصل «تفرقه و غلبه» یک الگو است که در زیستشناسی در سطوح گوناگون دیده میشود، از مواد گرفته تا دستههای حشرات و تمدنها—همه نمونههایی که در آنها هوش کلی بسیار فراتر از مجموع تواناییهای افراد است. او میگوید: «با استفاده از چندین عامل هوش مصنوعی، ما در تلاشیم تا فرایند کشف را بازآفرینی کنیم که جوامع علمی چگونه اکتشافها را انجام میدهند. در MIT، ما این کار را با همکاری افرادی از زمینههای مختلف انجام میدهیم که در کافهها یا در راهروهای بیپایان MIT با هم برخورد میکنند. اما این فرایند تصادفی و کند است. هدف ما بازسازی فرایند اکتشاف با بررسی این است که آیا سامانههای هوش مصنوعی میتوانند خلاق باشند و اکتشافات نوینی انجام دهند.»
خودکارسازی ایدههای خوب
همانطور که تحولات اخیر نشان دادهاند، مدلهای زبانی بزرگ (LLMs) تواناییهای شایان توجهی در پاسخگویی به پرسشها، خلاصهسازی اطلاعات و انجام وظایف ساده دارند. اما آنها در تولید ایدههای جدید از صفر، محدودیتهای فراوانی دارند. پژوهشگران MIT میخواستند سیستمی بسازند که به مدلهای هوش مصنوعی اجازه دهد فرایند پیچیدهتری را انجام دهند که فراتر از یادآوری اطلاعات آموختهشده باشد و به استخراج و ابداع دانش تازه بپردازد.

بنای این رویکرد، یک گراف دانش هستیشناختی است که مفاهیم علمی گوناگون را ساختاربندی کرده و ارتباط آنها را برقرار میکند. برای ایجاد این گرافها، پژوهشگران مجموعهای از مقالات علمی را وارد یک مدل هوش مصنوعی مولد میکنند. در کارهای قبلی، بیولر از یک زمینه از ریاضیات به نام نظریهٔ ردهها بهره برد تا به مدل هوش مصنوعی یاری رساند انتزاعاتی از مفاهیم علمی به شکل گرافها بسازد، که در آن روابط بین اجزا تعریف میشود و به گونهای تحلیل میشود که سایر مدلها بتوانند از طریق فرایند استدلال گرافی به آن دسترسی یابند. این رویکرد به مدلهای هوش مصنوعی کمک میکند شیوههای اصولیتری برای درک مفاهیم توسعه دهند و همچنین به آنها اجازه میدهد در حوزههای مختلف بهتر تعمیم دهند.
بیولر میگوید: «برای ما بسیار مهم است که مدلهای هوش مصنوعی متمرکز بر دانش را ایجاد کنیم، زیرا نظریههای علمی معمولاً بر اصول قابل تعمیم تکیه دارند، نه فقط بر یادآوری دانش. با متمرکز کردن مدلهای هوش مصنوعی بر «تفکر» به این شیوه، میتوانیم از شیوههای معمول فراتر رویم و کاربردهای خلاقانهتری از هوش مصنوعی را بررسی کنیم.»
برای مقالهٔ اخیر، پژوهشگران از حدود ۱۰۰۰ مطالعهٔ علمی در زمینهٔ مواد بیولوژیکی استفاده کردند، اما بیولر میافزاید گرافهای دانش را میتوان با استفاده از تعداد بیشتری یا کمتری از مقالات پژوهشی از هر حوزهای پدید آورد. با ایجاد گراف، پژوهشگران یک سامانهٔ هوش مصنوعی برای اکتشاف علمی توسعه دادند که شامل چندین مدل تخصصی است که نقشهای ویژهای در سامانه ایفا میکنند. بیشتر اجزا بر اساس نسخههای سری ChatGPT-4 شرکت OpenAI ساخته شدهاند و از فن یادگیری از محیط استفاده میکنند، که در آن ورودیها اطلاعات زمینهای دربارهٔ نقش مدل در سامانه را فراهم میآورند و به آن اجازه میدهد از دادههای ارائهشده یاد بگیرد.
عوامل مجزا در این چارچوب، با یکدیگر تعامل دارند تا بهصورت جمعی یک مسئلهٔ پیچیده را حل کنند که هیچیک از آنها به تنهایی قدرت انجام آن را ندارد. اولین وظیفهای که به آنها واگذار میشود، تولید یک فرضیهٔ پژوهشی است.
تعاملات LLM و گراف دانش
تعاملات LLM، پس از تعریف یک زیرگراف از گراف دانش، آغاز میشود. این فرایند میتواند بهصورت تصادفی یا با وارد کردن دستی یک جفت کلمه کلیدی که در مقالات مورد بحث قرار گرفتهاند، انجام شود. در این چارچوب، یک مدل زبانی که پژوهشگران آن را «هستیشناس» نامیدهاند، مسئول تعریف اصطلاحات علمی در مقالات و بررسی روابط بین آنها و گسترش گراف دانش است.

ارائهٔ طرح پژوهشی و توسعهٔ ایدهها
مدلی به نام «دانشمند ۱»، سپس یک طرح پژوهشی را بر اساس عواملی مانند توانایی کشف ویژگیهای غیرمنتظره و نوآوری، پیشنهاد میدهد. این طرح شامل بحثی دربارهٔ نتایج احتمالی، تأثیر پژوهش و حدسهایی دربارهٔ مکانیسمهای زیربنایی عملکرد است. مدل «دانشمند ۲» روی ایده کار میکند و شیوههای تجربی و شبیهسازی ویژهای را پیشنهاد میدهد و بهبودهای دیگری نیز ارائه میدهد. در پایان، مدل «منتقد» نقاط قوت و ضعف را برجسته میکند و پیشنهادهایی برای بهبود بیشتر ارائه میدهد.
بوهلر میگوید: «هدف این است که تیمی از متخصصان بسازیم که همه به یک شکل فکر نکنند. آنها باید به شیوههای گوناگون فکر کنند و قابلیتهای مختلفی داشته باشند. عامل منتقد، عمداً طوری برنامهریزی شده است که به نقد بقیه بپردازد، بنابراین همه نمیگویند که این یک ایدهٔ فوقالعاده است. بلکه یک عامل میگوید: «اینجا یک نقطه ضعف وجود دارد، میتوانید آن را بهتر توضیح دهید؟» این کار، خروجی را با مدلهای تکی تفاوت زیادی میدهد.»
تقویت سامانه
سایر عوامل موجود در سامانه، قادر به جستجوی در ادبیات موجود هستند که به سامانه این امکان را میدهد که نه تنها قابلیت اجرایی را ارزیابی کند، بلکه نوآوری هر ایده را نیز ایجاد و ارزیابی کند.
برای اعتبارسنجی رویکرد خود، بوهلر و غفاریلاهی یک گراف دانش را بر اساس کلمات «ابریشم» و «انرژیبر» ساختند. با استفاده از این چارچوب، مدل «دانشمند ۱» پیشنهاد تلفیق ابریشم با رنگدانههای مبتنی بر قاصدک را برای ایجاد زیستموادی با ویژگیهای نوری و مکانیکی بهبودیافته ارائه داد. این مدل پیشبینی کرد که این ماده بهطور قابل توجهی محکمتر از مواد ابریشم معمولی خواهد بود و به انرژی کمتری برای پردازش نیاز دارد.
سپس «دانشمند ۲» پیشنهاداتی ارائه داد، از جمله استفاده از ابزارهای شبیهسازی دینامیک مولکولی خاص برای بررسی اینکه مواد پیشنهادی چگونه با هم تعامل میکنند و افزود که یک کاربرد خوب برای این ماده میتواند یک چسب الهامگرفته از طبیعت باشد. مدل منتقد سپس چندین نقطهٔ قوت مادهٔ پیشنهادی و حوزههایی برای بهبود را برجسته کرد، از جمله مقیاسپذیری، پایداری درازمدت و تأثیرات زیستمحیطی استفاده از حلال.

برای رفع این نگرانیها، منتقد پیشنهاد کرد که مطالعات آزمایشی برای اعتبارسنجی فرایند انجام شود و تحلیلهای دقیقی از ماندگاری مواد صورت گیرد. پژوهشگران همچنین آزمایشهای دیگری را با کلمات کلیدی بهطور تصادفی انتخاب شده انجام دادند که باعث ایجاد فرضیههای اساسی گوناگونی دربارهٔ تراشههای میکروسیال شبیهساز زیستی کارآمدتر، بهبود ویژگیهای مکانیکی داربستهای مبتنی بر کلاژن و تعامل بین گرافن و فیبرهای آمیلوئید برای ساخت دستگاههای بیوالکترونیکی شد.
غفاریلاهی میگوید: «این سامانه توانست این ایدههای جدید و دقیق را بر اساس مسیر گراف دانش ارائه دهد. از نقطه نظر نوآوری و کاربرد، مواد بهنظر قوی و نوآورانه آمدهاند. در کارهای آینده، ما قصد داریم هزاران یا دهها هزار ایدهٔ پژوهشی جدید تولید کنیم و سپس میتوانیم آنها را دستهبندی کنیم و سعی کنیم بهتر بفهمیم که این مواد چگونه ساخته میشوند و چگونه میتوانند بیشتر بهبود یابند.»
آینده و ابزارهای نو
در آینده، پژوهشگران امیدوارند ابزارهای جدیدی برای بازیابی اطلاعات و انجام شبیهسازیها به چارچوبهای خود اضافه کنند. آنها همچنین میتوانند به آسانی مدلهای پایه را در چارچوبهای خود با مدلهای پیشرفتهتر جایگزین کنند، که به سامانه اجازه میدهد با تازهترین نوآوریها در عرصهٔ هوش مصنوعی سازگار شود.
بوهلر میگوید: «به دلیل نحوهٔ تعامل این عوامل، بهبود در یک مدل، حتا اگر جزئی باشد، تأثیر زیادی بر رفتارها و خروجی کلی سامانه دارد.» از زمان انتشار پیشنویس با شرح جزئیات منبع باز رویکرد خود، پژوهشگران با صدها نفر که به استفاده از این چارچوبها در حوزههای علمی گوناگون و حتا در حوزههایی مانند مالی و امنیت سایبری علاقهمند بودند، تماس گرفتهاند.
بوهلر میگوید: «کارهای زیادی هست که میتوانید بدون رفتن به آزمایشگاه انجام دهید. شما اساساً میخواهید در انتهای فرایند به آزمایشگاه بروید. آزمایشگاه پرهزینه و وقتگیر است، بنابراین شما به سامانهای نیاز دارید که بتواند به عمق بهترین ایدهها برود، بهترین فرضیات را فرموله کند و رفتارهای نوظهور را بهطور دقیق پیشبینی کند. چشمانداز ما این است که این کار را آسان کنیم، طوریکه بتوانید از یک برنامه کاربردی برای وارد کردن ایدههای دیگر یا وارد کردن مجموعه دادهها استفاده کنید تا واقعاً مدل را به چالش بکشید و اکتشافات جدیدی انجام دهید.»
بیشتر بخوانید
مدیتیشن یک روز پربرکت برای جذب عشق وامنیت و سلامتی
خود هیپنوتیزم درمان زود انزالی در مردان توسط هیپنوتراپیست رضا خدامهری
تقویت سیستم ایمنی بدن با خود هیپنوتیزم
شمس و طغری
خود هیپنوتیزم ماندن در رژیم لاغری و درمان قطعی چاقی کاملا علمی و ایمن
خود هیپنوتیزم تقویت اعتماد به نفس و عزت نفس