مدل‌های شبکه‌های عصبی عمیق و چالش‌های محاسباتی آن‌ها

مدل‌های شبکه‌های عصبی عمیق که امروزه در کاربردهای پیچیده یادگیری ماشین به کار می‌روند، به قدری بزرگ و پیچیده شده‌اند که در حال فشار آوردن به مرزهای سخت‌افزارهای الکترونیکی سنتی هستند. سخت‌افزارهای فوتونیکی که می‌توانند محاسبات یادگیری ماشین را با استفاده از نور انجام دهند، گزینه‌ای سریع‌تر و با مصرف انرژی کمتری ارائه می‌دهند. با این حال، برخی از نوع‌های محاسبات شبکه‌های عصبی وجود دارند که یک دستگاه فوتونیکی نمی‌تواند آن‌ها را انجام دهد و این امر نیاز به استفاده از الکترونیک‌های خارج از تراشه یا تکنیک‌های دیگر دارد که سرعت و کارایی را کاهش می‌دهد.

توسعه تراشه فوتونیکی جدید

با تکیه بر یک دهه تحقیق، دانشمندان از MIT و دیگر مراکز، یک تراشه فوتونیکی جدید توسعه داده‌اند که این موانع را برطرف می‌کند. آن‌ها یک پردازنده فوتونیکی کاملاً یکپارچه را معرفی کردند که می‌تواند تمام محاسبات کلیدی یک شبکه عصبی عمیق را به صورت نوری بر روی تراشه انجام دهد. این دستگاه نوری توانست محاسبات کلیدی برای یک وظیفه طبقه‌بندی یادگیری ماشین را در کمتر از نیم نانوثانیه به پایان برساند و دقتی بیش از 92 درصد را به دست آورد — عملکردی که با سخت‌افزارهای سنتی برابری می‌کند.

ویژگی‌های تراشه و کاربردهای آن

این تراشه که از ماژول‌های متصل به هم تشکیل شده و یک شبکه عصبی نوری را شکل می‌دهد، با استفاده از فرآیندهای تولید تجاری ساخته شده است که می‌تواند به مقیاس‌پذیری این فناوری و ادغام آن با الکترونیک کمک کند. در درازمدت، پردازنده فوتونیکی می‌تواند به یادگیری عمیق سریع‌تر و با مصرف انرژی کمتر برای کاربردهای محاسباتی سنگین مانند لیدار، تحقیقات علمی در نجوم و فیزیک ذرات، یا ارتباطات پرسرعت منجر شود.

نمایی از یک آزمایشگاه پیشرفته با دانشمندان در حال توسعه یک تراشه فوتونیکی جدید.
دانشمندان در حال کار بر روی تراشه فوتونیکی که انقلاب در محاسبات عمیق را نوید می‌دهد.

نظرات محققان

سومیل باندیوده‌پادیا، دانشمند مهمان در گروه فوتونیک کوانتومی و هوش مصنوعی در آزمایشگاه تحقیقاتی الکترونیک (RLE) و نویسنده اصلی مقاله‌ای درباره این تراشه، می‌گوید: «در بسیاری از موارد، عملکرد مدل تنها چیزی نیست که اهمیت دارد، بلکه سرعت دریافت پاسخ نیز مهم است. حالا که ما یک سیستم انتها به انتها داریم که می‌تواند یک شبکه عصبی را در مقیاس نانوثانیه اجرا کند، می‌توانیم به طور عمیق‌تری درباره کاربردها و الگوریتم‌ها فکر کنیم.»

📢 اگر عاشق علم هستید و نمی‌خواهید هیچ مقاله‌ای را از دست بدهید…

به کانال تلگرام ما بپیوندید! تمامی مقالات جدید روزانه در آنجا منتشر می‌شوند.

📲 عضویت در کانال تلگرام
پاپ‌آپ اطلاعیه با اسکرول

باندیوده‌پادیا در این مقاله با الکساندر اسلودز، نیکلاس هریس، داریوش بونندار و دیگر محققان همکاری کرده است. این تحقیق امروز در Nature Photonics منتشر شده است.

یادگیری ماشین با نور

شبکه‌های عصبی عمیق از لایه‌های متصل به هم از نودها یا نورون‌ها تشکیل شده‌اند که بر روی داده‌های ورودی کار می‌کنند تا خروجی تولید کنند. یکی از عملیات کلیدی در یک شبکه عصبی عمیق شامل استفاده از جبر خطی برای انجام ضرب ماتریس است که داده‌ها را در حین انتقال از لایه‌ای به لایه دیگر تغییر می‌دهد. اما علاوه بر این عملیات خطی، شبکه‌های عصبی عمیق عملیات غیرخطی نیز انجام می‌دهند که به مدل کمک می‌کند الگوهای پیچیده‌تری را یاد بگیرد.

عملیات غیرخطی و قدرت شبکه‌های عصبی عمیق

عملیات غیرخطی، مانند توابع فعال‌سازی، به شبکه‌های عصبی عمیق این امکان را می‌دهند که مسائل پیچیده را حل کنند. در سال ۲۰۱۷، گروه انگلوند به همراه محققان آزمایشگاه مارین سوجاچیچ، استاد فیزیک، یک شبکه عصبی نوری را روی یک چیپ فوتونیک معرفی کردند که می‌توانست ضرب ماتریس را با نور انجام دهد. اما در آن زمان، این دستگاه نمی‌توانست عملیات غیرخطی را روی چیپ انجام دهد. داده‌های نوری باید به سیگنال‌های الکتریکی تبدیل می‌شدند و به یک پردازشگر دیجیتال ارسال می‌شدند تا عملیات غیرخطی انجام شود.

نمای نزدیک از تراشه فوتونیکی جدید با طراحی پیچیده و ماژول‌های متصل به هم.
تراشه فوتونیکی جدید که طراحی مدرن و عملکرد بالایی دارد.

باندی‌وپادیا توضیح می‌دهد: “غیرخطی بودن در اپتیک بسیار چالش‌برانگیز است زیرا فوتون‌ها به راحتی با یکدیگر تعامل ندارند. این موضوع باعث می‌شود که تحریک غیرخطی‌های نوری بسیار انرژی‌بر باشد و ساخت سیستمی که بتواند این کار را به‌صورت مقیاس‌پذیر انجام دهد، چالش‌برانگیز گردد.”

آنها با طراحی دستگاه‌هایی به نام واحدهای عملکرد نوری غیرخطی (NOFU) که الکترونیک و اپتیک را ترکیب می‌کنند، این چالش را پشت سر گذاشتند تا عملیات غیرخطی را روی چیپ پیاده‌سازی کنند. محققان یک شبکه عصبی عمیق نوری را روی یک چیپ فوتونیک با استفاده از سه لایه از دستگاه‌هایی که عملیات‌های خطی و غیرخطی را انجام می‌دهند، ساختند.

یک شبکه کاملاً یکپارچه

در ابتدا، سیستم آنها پارامترهای یک شبکه عصبی عمیق را به نور کدگذاری می‌کند. سپس، یک آرایه از تقسیم‌کننده‌های پرتو قابل برنامه‌ریزی که در مقاله ۲۰۱۷ معرفی شده بود، ضرب ماتریس را روی ورودی‌ها انجام می‌دهد. داده‌ها سپس به NOFUهای قابل برنامه‌ریزی منتقل می‌شوند که با هدایت مقدار کمی نور به فوتودیودها، که سیگنال‌های نوری را به جریان الکتریکی تبدیل می‌کنند، توابع غیرخطی را پیاده‌سازی می‌کنند. این فرآیند که نیاز به تقویت‌کننده خارجی را از بین می‌برد، انرژی بسیار کمی مصرف می‌کند.

تصویری از یک شبکه عصبی نشان‌دهنده لایه‌ها و ارتباطات میان نورون‌ها با رنگ‌های جذاب.
این شبکه عصبی پیچیده قادر به عملکرد در سطح‌های مختلف یادگیری و پردازش اطلاعات است.

باندی‌وپادیا می‌گوید: “ما در تمام مدت در حوزه نوری باقی می‌مانیم، تا زمانی که بخواهیم پاسخ را بخوانیم. این به ما این امکان را می‌دهد که تأخیر فوق‌العاده پایینی را به دست آوریم.”

دستیابی به چنین تأخیری به آنها این امکان را داد که یک شبکه عصبی عمیق را به‌طور مؤثر روی چیپ آموزش دهند. این فرآیند به عنوان آموزش در محل شناخته می‌شود و معمولاً در سخت‌افزار دیجیتال مقدار زیادی انرژی مصرف می‌کند. او می‌گوید: “این موضوع به‌ویژه برای سیستم‌هایی که پردازش سیگنال‌های نوری در دامنه انجام می‌دهند، مفید است. مانند ناوبری یا مخابرات، و همچنین در سیستم‌هایی که می‌خواهید در زمان واقعی یاد بگیرند.”

سیستم فوتونیک در طول آزمایش‌های آموزشی بیش از ۹۶ درصد دقت و در طول استنتاج بیش از ۹۲ درصد دقت را به دست آورد که قابل مقایسه با سخت‌افزارهای سنتی است. علاوه بر این، چیپ محاسبات کلیدی را در کمتر از نیم نانوثانیه انجام می‌دهد. انگلوند می‌گوید: “این کار نشان می‌دهد که محاسبات — در ذات خود، نگاشت ورودی‌ها به خروجی‌ها — می‌تواند بر روی معماری‌های جدید فیزیک خطی و غیرخطی که یک قانون مقیاس‌بندی کاملاً متفاوت از محاسبه در مقابل تلاشی که نیاز است، پیاده‌سازی گردد.”

تمام مدار با استفاده از همان زیرساخت و فرآیندهای کارخانه‌ای که چیپ‌های کامپیوتری CMOS را تولید می‌کنند، ساخته شد. این می‌تواند به تولید چیپ به‌صورت انبوه کمک کند و از تکنیک‌های آزموده‌شده‌ای استفاده کند که خطای بسیار کمی را در فرآیند ساخت وارد می‌کنند. باندی‌وپادیا می‌گوید: “گسترش دستگاه و ادغام آن با الکترونیک‌های دنیای واقعی مانند دوربین‌ها یا سیستم‌های مخابراتی، تمرکز اصلی کارهای آینده خواهد بود.”

علاوه بر این، محققان می‌خواهند الگوریتم‌هایی را بررسی کنند که بتوانند از مزایای اپتیک برای آموزش سریع‌تر سیستم‌ها و با کارایی انرژی بهتر بهره‌برداری کنند. این تحقیق به‌طور جزئی توسط بنیاد ملی علوم، دفتر تحقیقات علمی نیروی هوایی و تحقیقات NTT تأمین مالی شده است.

مقاله های شبیه به این مقاله

بیشتر بخوانید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *