انقلابی در تحلیل سه‌بعدی ساختار ژنوم با هوش مصنوعی

هر کدوم از سلول‌های بدن شما حاوی یه دنباله ژنتیکی یکسان هستن، اما هر کدوم از سلول‌ها فقط بخشی از اون ژن‌ها رو فعال می‌کنن. الگوهای بیان ژن خاص هر سلول، این اطمینان رو میده که یه سلول مغزی با یه سلول پوستی فرق داره، و این تفاوت‌ها تا حدودی تحت تاثیر ساختار سه‌بعدی ماده ژنتیکی هست که دسترسی به هر ژن رو کنترل می‌کنه. دانشمندان شیمی در MIT حالا یه روش جدید برای تعیین این ساختارهای سه‌بعدی ژنوم با استفاده از هوش مصنوعی مولد ارائه دادن. تکنیکشون می‌تونه هزاران ساختار رو فقط در عرض چند دقیقه پیش‌بینی کنه، که خیلی سریع‌تر از روش‌های آزمایشی فعلی برای تحلیل ساختارهاست. با استفاده از این تکنیک، محققان می‌تونن راحت بررسی کنن که چطور سازماندهی سه‌بعدی ژنوم روی الگوهای بیان ژن و عملکردهای سلول‌های مختلف اثر می‌ذاره.

بین ژانگ، استادیار شیمی و نویسنده ارشد این مطالعه، میگه: “هدف ما پیش‌بینی ساختار سه‌بعدی ژنوم از روی دنباله DNA بود. حالا که می‌تونیم این کار رو انجام بدیم و این تکنیک رو در سطح تکنیک‌های آزمایشی پیشرفته قرار میدیم، واقعاً می‌تونه فرصت‌های جذابی رو باز کنه.” دانشجویان فارغ‌التحصیل MIT، گرگ شوت و ژوهان لائو، نویسندگان اصلی این مقاله هستن که امروز در نشریه Science Advances منتشر شده.

از دنباله تا ساختار

داخل هسته سلول، DNA و پروتئین‌ها یه ساختار پیچیده به‌نام کروماتین رو تشکیل میدن که چندین لایه سازماندهی داره و این امکان رو به سلول‌ها میده که 2 متر DNA رو تو هسته‌ای با قطر فقط یک‌صدم میلی‌متر جا بدن. رشته‌های بلند DNA دور پروتئین‌هایی به‌نام هیستون می‌پیچن و ساختاری شبیه دانه‌های روی نخ ایجاد می‌کنن. علائم شیمیایی که به تغییرات اپی‌ژنتیکی معروفن، می‌تونن در جاهای خاصی به DNA متصل بشن و این علائم، که بسته به نوع سلول متفاوته، روی چینش کروماتین و دسترسی به ژن‌های نزدیک اثر می‌ذارن. این تفاوت‌ها در شکل کروماتین تعیین می‌کنه که کدوم ژن‌ها در انواع مختلف سلول‌ها یا در زمان‌های مختلف تو یه سلول خاص فعال میشن.

تصویری از یه سلول انسانی با نمای نزدیک از هسته و ساختار پیچیده DNA
نمایی از درون یه سلول انسانی و پیچیدگی ساختار ژنوم.

تو 20 سال گذشته، دانشمندا تکنیک‌های آزمایشی برای تعیین ساختارهای کروماتین توسعه دادن. یکی از تکنیک‌های پرکاربرد به‌نام Hi-C، با پیوند دادن رشته‌های DNA که کنار هم هستن تو هسته سلول کار می‌کنه. محققان بعدش می‌تونن با خرد کردن DNA به تکه‌های کوچیک و تعیین دنباله اون‌ها، مشخص کنن که کدوم بخش‌ها نزدیک هم قرار دارن. این روش می‌تونه روی جمعیت‌های بزرگ سلولی برای محاسبه یه ساختار متوسط برای یه قسمت از کروماتین، یا روی تک‌تک سلول‌ها برای تعیین ساختارها تو اون سلول خاص استفاده بشه. با این حال، Hi-C و تکنیک‌های مشابه زمان‌بر هستن و تهیه داده‌ها از یه سلول حدود یه هفته طول می‌کشه.

برای حل این محدودیت‌ها، ژانگ و دانشجوهاش مدلی رو توسعه دادن که از پیشرفت‌های اخیر در هوش مصنوعی مولد استفاده می‌کنه تا یه روش سریع و دقیق برای پیش‌بینی ساختارهای کروماتین در سلول‌های جداگانه ایجاد کنه. مدلی که طراحی کردن می‌تونه به سرعت دنباله‌های DNA رو بررسی کنه و ساختارهای کروماتینی رو که اون دنباله‌ها ممکنه تو یه سلول ایجاد کنن، پیش‌بینی کنه. ژانگ میگه: “یادگیری عمیق واقعاً تو شناسایی الگوها خوبه. این به ما اجازه میده که بخش‌های خیلی طولانی DNA، هزاران جفت باز، رو بررسی کنیم و بفهمیم که اطلاعات مهمی که تو اون جفت بازهای DNA کدگذاری شده، چیه.”

مدل ChromoGen: تجزیه و تحلیل ساختار ژنوم با هوش مصنوعی

مدل ChromoGen که توسط محققان ساخته شده، از دو بخش تشکیل شده. بخش اول، یه مدل یادگیری عمیقه که برای “خوندن” ژنوم آموزش داده شده و اطلاعات موجود در دنباله DNA و داده‌های دسترسی کروماتین رو تجزیه و تحلیل می‌کنه. داده‌های دسترسی کروماتین به‌طور گسترده در دسترس هستن و برای هر نوع سلول ویژگی‌های خاص خودشون رو دارن. بخش دوم، یه مدل هوش مصنوعی مولد هست که شکل‌های فیزیکی کروماتین رو دقیق پیش‌بینی می‌کنه و روی بیش از 11 میلیون شکل کروماتین آموزش دیده. این داده‌ها از آزمایش‌هایی با استفاده از Dip-C (نوعی از Hi-C) روی 16 سلول از یه رده لنفوسیت B انسانی به‌دست اومدن.

وقتی این دو بخش با هم ترکیب میشن، بخش اول به مدل مولد اطلاعات میده که چطور محیط مخصوص هر نوع سلول روی تشکیل ساختارهای مختلف کروماتین اثر می‌ذاره و این طرح، روابط دنباله-ساختار رو به‌شکلی موثر نشون میده. برای هر دنباله، محققان از مدل خودشون برای تولید ساختارهای ممکن زیادی استفاده می‌کنن؛ چون DNA یه مولکول خیلی نامنظم هست و یه دنباله DNA می‌تونه شکل‌های مختلفی ایجاد کنه.

تصویری مقایسه‌ای از روش‌های آزمایشی سنتی و مدل پیش‌بینی هوش مصنوعی تو تحلیل ساختار ژنوم
مقایسه روش‌های سنتی و استفاده از هوش مصنوعی تو تحلیل ساختارهای ژنوم.

شوت می‌گه: “یه عامل پیچیده اصلی تو پیش‌بینی ساختار ژنوم اینه که هیچ راه‌حل واحدی وجود نداره که ما دنبالشیم. یه توزیع از ساختارها وجود داره، مهم نیست به کدوم قسمت از ژنوم نگاه می‌کنید. پیش‌بینی اون توزیع آماری خیلی پیچیده و با ابعاد بالاست و انجام دادنش خیلی چالش‌برانگیزه.”

تحلیل سریع

مدل، بعد از آموزش دیدن، می‌تونه پیش‌بینی‌هایی رو خیلی سریع‌تر از Hi-C یا بقیه تکنیک‌های آزمایشی تولید کنه. شوت میگه: “در حالی که ممکنه شش ماه وقت صرف انجام آزمایش‌ها کنید تا چند ده ساختار تو یه نوع سلول خاص به‌دست بیارید، می‌تونید تو 20 دقیقه و با استفاده از یه GPU، هزار ساختار رو تو یه ناحیه خاص تولید کنید.”

محققان، بعد از آموزش مدلشون، از اون برای تولید پیش‌بینی‌های ساختاری برای بیش از 2,000 دنباله DNA استفاده کردن و بعد اون‌ها رو با ساختارهای تعیین‌شده آزمایشی برای اون دنباله‌ها مقایسه کردن. اونا فهمیدن که ساختارهای تولید شده توسط مدل، مشابه یا خیلی نزدیک به چیزی هستن که تو داده‌های آزمایشی دیده شده. ژانگ میگه: “ما معمولاً به صدها یا هزاران شکل برای هر دنباله نگاه می‌کنیم و این، نمای قابل قبولی از تنوع ساختارهایی که یه ناحیه خاص می‌تونه داشته باشه، بهتون میده.”

تصویری از مدل ChromoGen در حال تجزیه و تحلیل دنباله‌های DNA با استفاده از الگوریتم‌های هوش مصنوعی
شرح عملکرد مدل ChromoGen در تجزیه و تحلیل داده‌های ژنومی.

اون ادامه میده: “اگه آزمایشتون رو چندبار تو سلول‌های مختلف تکرار کنید، احتمالاً به یه شکل خیلی متفاوت می‌رسید. این همون چیزیه که مدل ما سعی داره پیش‌بینی کنه.”

محققان همچنین فهمیدن که این مدل می‌تونه پیش‌بینی‌های دقیقی برای داده‌های مربوط به انواع سلول‌های دیگه، غیر از نوعی که روش آموزش داده شده، انجام بده. این نشون میده که مدل می‌تونه برای تجزیه و تحلیل تفاوت‌های ساختار کروماتین بین انواع سلول‌ها و اینکه چطور این تفاوت‌ها روی عملکردشون اثر می‌ذاره، مفید باشه. این مدل همچنین می‌تونه برای بررسی وضعیت‌های مختلف کروماتین که می‌تونن تو یه سلول واحد وجود داشته باشن و اینکه چطور این تغییرات روی بیان ژن اثر می‌ذاره، استفاده بشه.

یه کاربرد دیگه ممکنه بررسی این باشه که چطور جهش‌ها تو یه دنباله DNA خاص، شکل کروماتین رو تغییر میدن که می‌تونه به درک اینکه چطور این جهش‌ها ممکنه باعث بیماری بشن، کمک کنه. ژانگ میگه: “سوالات جالب زیادی وجود داره که فکر می‌کنم می‌تونیم با این نوع مدل بهشون جواب بدیم.”

محققان، تمام داده‌ها و مدلشون رو برای بقیه که می‌خوان ازش استفاده کنن، در دسترس قرار دادن. این تحقیق توسط مؤسسات ملی بهداشت تامین مالی شده.

مقاله های شبیه به این مقاله

بیشتر بخوانید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *