تحولی در تحلیل ساختار ژنوم سه‌بعدی با هوش مصنوعی

هر سلول در بدن شما حاوی یک توالی ژنتیکی مشابه است، اما هر سلول تنها بخشی از آن ژن‌ها را بیان می‌کند. الگوهای بیان ژن خاص هر سلول تضمین می‌کنند که یک سلول مغزی با یک سلول پوستی متفاوت است و این ویژگی به طور جزئی تحت تأثیر ساختار سه‌بعدی ماده ژنتیکی قرار دارد که دسترسی به هر ژن را کنترل می‌کند. شیمیدانان MIT اکنون روشی جدید برای تعیین این ساختارهای سه‌بعدی ژنوم با استفاده از هوش مصنوعی مولد ارائه داده‌اند. تکنیک آن‌ها قادر است هزاران ساختار را تنها در چند دقیقه پیش‌بینی کند که این امر نسبت به روش‌های تجربی موجود برای تحلیل ساختارها بسیار سریع‌تر است. با استفاده از این تکنیک، پژوهشگران می‌توانند به راحتی مطالعه کنند که چگونه سازماندهی سه‌بعدی ژنوم بر الگوهای بیان ژن و عملکردهای سلول‌های فردی تأثیر می‌گذارد.

بین ژانگ، استاد یار شیمی و نویسنده ارشد این مطالعه، می‌گوید: “هدف ما پیش‌بینی ساختار سه‌بعدی ژنوم از توالی DNA زیرین بود. اکنون که می‌توانیم این کار را انجام دهیم و این تکنیک را در سطح تکنیک‌های تجربی پیشرفته قرار می‌دهیم، حقیقتاً می‌تواند فرصت‌های جالبی را باز کند.” دانشجویان فارغ‌التحصیل MIT، گرگ شوت و ژوهان لائو، نویسندگان اصلی این مقاله هستند که امروز در نشریه Science Advances منتشر شده است.

از توالی تا ساختار

درون هسته سلول، DNA و پروتئین‌ها یک ساختار پیچیده به نام کروماتین را تشکیل می‌دهند که دارای چندین سطح سازماندهی است و به سلول‌ها این امکان را می‌دهد که ۲ متر DNA را در هسته‌ای که تنها یک صدم میلی‌متر قطر دارد، جا دهند. رشته‌های بلند DNA دور پروتئین‌هایی به نام هیستون می‌پیچند و ساختاری شبیه به دانه‌های روی نخ ایجاد می‌کنند. برچسب‌های شیمیایی معروف به تغییرات اپی‌ژنتیکی می‌توانند در مکان‌های خاصی به DNA متصل شوند و این برچسب‌ها که بسته به نوع سلول متفاوت هستند، بر چینش کروماتین و دسترسی به ژن‌های نزدیک تأثیر می‌گذارند. این تفاوت‌ها در شکل کروماتین به تعیین اینکه کدام ژن‌ها در انواع مختلف سلول‌ها یا در زمان‌های مختلف در یک سلول خاص بیان می‌شوند، کمک می‌کند.

تصویری از یک سلول انسانی با نمای زوم شده از هسته و ساختار DNA پیچیده.
نمایی از درون یک سلول انسانی و پیچیدگی ساختار ژنوم.

در ۲۰ سال گذشته، دانشمندان تکنیک‌های تجربی برای تعیین ساختارهای کروماتین توسعه داده‌اند. یکی از تکنیک‌های پرکاربرد که به نام Hi-C شناخته می‌شود، با پیوند دادن رشته‌های DNA همسایه در هسته سلول کار می‌کند. پژوهشگران می‌توانند سپس با خرد کردن DNA به قطعات کوچک و توالی‌یابی آن، تعیین کنند که کدام بخش‌ها در نزدیکی یکدیگر قرار دارند. این روش می‌تواند بر روی جمعیت‌های بزرگ سلولی برای محاسبه یک ساختار متوسط برای یک بخش از کروماتین یا بر روی سلول‌های منفرد برای تعیین ساختارها در آن سلول خاص استفاده شود. با این حال، Hi-C و تکنیک‌های مشابه زمان‌بر هستند و تولید داده‌ها از یک سلول حدود یک هفته طول می‌کشد.

📢 اگر عاشق علم هستید و نمی‌خواهید هیچ مقاله‌ای را از دست بدهید…

به کانال تلگرام ما بپیوندید! تمامی مقالات جدید روزانه در آنجا منتشر می‌شوند.

📲 عضویت در کانال تلگرام
پاپ‌آپ اطلاعیه با اسکرول

برای غلبه بر این محدودیت‌ها، ژانگ و دانشجویانش مدلی را توسعه دادند که از پیشرفت‌های اخیر در هوش مصنوعی مولد بهره می‌برد تا روشی سریع و دقیق برای پیش‌بینی ساختارهای کروماتین در سلول‌های منفرد ایجاد کند. مدلی که آن‌ها طراحی کردند می‌تواند به سرعت توالی‌های DNA را تحلیل کرده و ساختارهای کروماتینی را که آن توالی‌ها ممکن است در یک سلول تولید کنند، پیش‌بینی کند. ژانگ می‌گوید: “یادگیری عمیق واقعاً در شناسایی الگوها خوب است. این به ما اجازه می‌دهد تا بخش‌های بسیار طولانی DNA، هزاران جفت باز، را تحلیل کنیم و بفهمیم که اطلاعات مهمی که در آن جفت‌های باز DNA کدگذاری شده است، چیست.”

مدل ChromoGen: تجزیه و تحلیل ساختار ژنوم با هوش مصنوعی

مدل ChromoGen که توسط محققان ایجاد شده است، از دو بخش تشکیل شده است. بخش اول، یک مدل یادگیری عمیق است که برای “خواندن” ژنوم آموزش دیده و اطلاعات موجود در توالی DNA و داده‌های دسترسی کروماتین را تجزیه و تحلیل می‌کند. داده‌های دسترسی کروماتین به طور گسترده‌ای در دسترس و خاص نوع سلول هستند. بخش دوم، یک مدل هوش مصنوعی مولد است که شکل‌های فیزیکی کروماتین را به دقت پیش‌بینی می‌کند و بر روی بیش از ۱۱ میلیون شکل کروماتین آموزش دیده است. این داده‌ها از آزمایش‌هایی با استفاده از Dip-C (نوعی از Hi-C) بر روی ۱۶ سلول از یک خط لنفوسیت B انسانی تولید شده‌اند.

زمانی که این دو بخش با هم ترکیب می‌شوند، بخش اول به مدل مولد اطلاعات می‌دهد که چگونه محیط خاص نوع سلول بر تشکیل ساختارهای مختلف کروماتین تأثیر می‌گذارد و این طرح به طور مؤثری روابط توالی-ساختار را به تصویر می‌کشد. برای هر توالی، مح تحقیق‌کنندگان از مدل خود برای تولید بسیاری از ساختارهای ممکن استفاده می‌کنند؛ زیرا DNA یک مولکول بسیار نامنظم است و یک توالی DNA می‌تواند منجر به شکل‌های مختلفی شود.

تصویری مقایسه ای از روش های تجربی سنتی و مدل پیش بینی هوش مصنوعی در تحلیل ساختار ژنوم.
مقایسه روش های سنتی و بهره گیری از هوش مصنوعی در تحلیل ساختارهای ژنوم.

شوت می‌گوید: “یک عامل پیچیده اصلی در پیش‌بینی ساختار ژنوم این است که هیچ راه‌حل واحدی وجود ندارد که ما به دنبال آن هستیم. یک توزیع از ساختارها وجود دارد، صرف‌نظر از اینکه به کدام بخش از ژنوم نگاه می‌کنید. پیش‌بینی آن توزیع آماری بسیار پیچیده و با ابعاد بالا است و انجام آن به شدت چالش‌برانگیز می‌باشد.”

تحلیل سریع

پس از آموزش، این مدل می‌تواند پیش‌بینی‌هایی را در زمان بسیار سریع‌تری نسبت به Hi-C یا سایر تکنیک‌های تجربی تولید کند. شوت می‌گوید: “در حالی که ممکن است شش ماه را صرف انجام آزمایشات کنید تا چند ده ساختار در یک نوع سلول خاص به دست آورید، می‌توانید در ۲۰ دقیقه و با استفاده از یک GPU، هزار ساختار در یک منطقه خاص تولید کنید.”

پس از آموزش مدل خود، محققان از آن برای تولید پیش‌بینی‌های ساختاری برای بیش از ۲,۰۰۰ توالی DNA استفاده کردند و سپس آن‌ها را با ساختارهای تعیین‌شده تجربی برای آن توالی‌ها مقایسه کردند. آن‌ها دریافتند که ساختارهای تولیدشده توسط مدل مشابه یا بسیار نزدیک به آنچه در داده‌های تجربی مشاهده شده‌اند، هستند. ژانگ می‌گوید: “ما معمولاً به صدها یا هزاران شکل برای هر توالی نگاه می‌کنیم و این به شما نمای معقولی از تنوع ساختارهایی که یک منطقه خاص می‌تواند داشته باشد، می‌دهد.”

تصویری از مدل ChromoGen در حال تجزیه و تحلیل توالی های DNA با استفاده از الگوریتم های هوش مصنوعی.
شرح عملکرد مدل ChromoGen در تجزیه و تحلیل داده های ژنومی.

او ادامه می‌دهد: “اگر آزمایش خود را چندین بار در سلول‌های مختلف تکرار کنید، به احتمال زیاد به یک شکل بسیار متفاوت خواهید رسید. این همان چیزی است که مدل ما سعی در پیش‌بینی آن دارد.”

محققان همچنین دریافتند که این مدل می‌تواند پیش‌بینی‌های دقیقی برای داده‌های مربوط به انواع سلول‌های دیگر، غیر از نوعی که بر روی آن آموزش دیده است، انجام دهد. این نشان می‌دهد که مدل می‌تواند برای تجزیه و تحلیل تفاوت‌های ساختار کروماتین بین انواع سلول‌ها و اینکه چگونه این تفاوت‌ها بر عملکرد آن‌ها تأثیر می‌گذارد، مفید باشد. این مدل همچنین می‌تواند برای بررسی وضعیت‌های مختلف کروماتین که می‌توانند در یک سلول واحد وجود داشته باشند و اینکه چگونه این تغییرات بر بیان ژن تأثیر می‌گذارد، استفاده شود.

یک کاربرد دیگر ممکن است بررسی این باشد که چگونه جهش‌ها در یک توالی DNA خاص، شکل کروماتین را تغییر می‌دهند که می‌تواند به درک اینکه چگونه چنین جهش‌هایی ممکن است باعث بیماری شوند، کمک کند. ژانگ می‌گوید: “سوالات جالب زیادی وجود دارد که فکر می‌کنم می‌توانیم با این نوع مدل به آن‌ها پاسخ دهیم.”

محققان تمام داده‌ها و مدل خود را برای دیگران که مایل به استفاده از آن هستند، در دسترس قرار داده‌اند. این تحقیق توسط مؤسسات ملی بهداشت تأمین مالی شده است.

مقاله های شبیه به این مقاله

بیشتر بخوانید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *