شبکه‌های عصبی عمیق و دشواری‌های محاسباتی‌شون

مدل‌های شبکه‌های عصبی عمیق که این روزا تو کاربردهای پیچیدهٔ یادگیری ماشین حسابی پرکاربرد شدن، اون‌قدر بزرگ و پیچیده شدن که دارن مرزهای سخت‌افزارهای الکترونیکی سنتی رو به چالش می‌کشن. سخت‌افزارهای فوتونیکی، که می‌تونن محاسبات یادگیری ماشین رو با استفاده از نور انجام بدن، یه راه حل سریع‌تر و کم‌مصرف‌تری رو پیش می‌کشن. با وجود این، یه سری از انواع محاسبات شبکه‌های عصبی هستن که یه دستگاه فوتونیکی تنها نمی‌تونه انجام‌شون بده و این قضیه احتیاج به استفاده از الکترونیک‌های خارج از تراشه یا روش‌های دیگه داره که سرعت و کارایی رو کم می‌کنه.

توسعهٔ تراشهٔ فوتونیکی جدید

دانشمندایی از MIT و جاهای دیگه، بعد از یه دهه تحقیق، یه تراشهٔ فوتونیکی جدید رو ساختن که این موانع رو دور می‌زنه. اونا یه پردازندهٔ فوتونیکی کاملاً یکپارچه رو معرفی کردن که می‌تونه تمام محاسبات کلیدی یه شبکهٔ عصبی عمیق رو به صورت نوری و رو خود تراشه انجام بده. این دستگاه نوری تونست محاسبات کلیدی برای یه وظیفهٔ طبقه‌بندی یادگیری ماشین رو تو کمتر از نیم نانوثانیه تموم بکنه و دقتش بیش از 92 درصد شد — عملکردی که با سخت‌افزارهای سنتی برابری می‌کنه.

ویژگی‌های تراشه و کاربردهاش

این تراشه که از ماژول‌های به‌هم‌پیوسته تشکیل شده و یه شبکهٔ عصبی نوری رو می‌سازه، با استفاده از فرایندهای تولید تجاری ساخته شده که می‌تونه به مقیاس‌پذیری این فناوری و ادغامش با الکترونیک کمک کنه. تو درازمدت، پردازندهٔ فوتونیکی می‌تونه به یادگیری عمیق سریع‌تر و کم‌مصرف‌تر برای کاربردهای محاسباتی سنگینی مثل لیدار، تحقیقات علمی توی نجوم و فیزیک ذرات، یا ارتباطات پرسرعت منجر بشه.

یه نمای از یه آزمایشگاه پیشرفته با دانشمندایی که دارن یه تراشه فوتونیکی جدید رو توسعه می‌دن.
دانشمندا دارن رو تراشهٔ فوتونیکی کار می‌کنن که نوید یه انقلاب تو محاسبات عمیق رو می‌ده.

نظرای محققا

سومیل باندیوده‌پادیا، دانشمند مهمان تو گروه فوتونیک کوانتومی و هوش مصنوعی تو آزمایشگاه تحقیقاتی الکترونیک (RLE) و نویسندهٔ اصلی مقاله‌ای دربارهٔ این تراشه، می‌گه: “تو خیلی از موارد، عملکرد یه مدل تنها چیزی نیست که اهمیت داره، بلکه سرعت گرفتن جواب هم مهمه. حالا که ما یه سیستم سر تا پا داریم که می‌تونه یه شبکهٔ عصبی رو تو مقیاس نانوثانیه اجرا کنه، می‌تونیم عمیق‌تر راجع به کاربردها و الگوریتما فکر کنیم.”

باندیوده‌پادیا تو این مقاله با الکساندر اسلودز، نیکلاس هریس، داریوش بونندار و محققای دیگه همکاری کرده. این تحقیق امروز تو Nature Photonics منتشر شده.

یادگیری ماشین با نور

شبکه‌های عصبی عمیق از لایه‌های به‌هم‌پیوستهٔ نودها یا نورون‌ها تشکیل شدن که روی داده‌های ورودی کار می‌کنن تا خروجی تولید کنن. یکی از عملکردهای کلیدی تو یه شبکهٔ عصبی عمیق شامل استفاده از جبر خطی برای انجام ضرب ماتریسه که داده‌ها رو موقع انتقال از یه لایه به لایهٔ دیگه تغییر می‌ده. ولی علاوه بر این عملیات خطی، شبکه‌های عصبی عمیق عملیات غیرخطی هم انجام می‌دن که به مدل کمک می‌کنه الگوهای پیچیده‌تری رو یاد بگیره.

عملیات غیرخطی و قدرت شبکه‌های عصبی عمیق

عملیات غیرخطی، مثل توابع فعال‌سازی، به شبکه‌های عصبی عمیق اجازه می‌دن که مسائل پیچیده رو حل کنن. تو سال ۲۰۱۷، گروه انگلوند به همراه محققای آزمایشگاه مارین سوجاچیچ، استاد فیزیک، یه شبکهٔ عصبی نوری رو روی یه چیپ فوتونیک معرفی کردن که می‌تونست ضرب ماتریس رو با نور انجام بده. اما اون موقع، این دستگاه نمی‌تونست عملیات غیرخطی رو رو چیپ انجام بده. داده‌های نوری باید به سیگنال‌های الکتریکی تبدیل می‌شدن و به یه پردازشگر دیجیتال فرستاده می‌شدن تا عملیات غیرخطی انجام بشه.

نمای نزدیک از تراشهٔ فوتونیکی جدید با یه طراحی پیچیده و ماژول‌های به‌هم‌پیوسته.
تراشهٔ فوتونیکی جدید که طراحی مدرن و عملکرد بالایی داره.

باندی‌وپادیا توضیح می‌ده: “غیرخطی بودن تو اپتیک خیلی چالش‌برانگیزه، چون فوتونا راحت با هم تعامل ندارن. این موضوع باعث می‌شه که تحریک غیرخطی‌های نوری خیلی انرژی‌بر باشه و ساختن یه سیستمی که بتونه این کار رو به‌صورت مقیاس‌پذیر انجام بده، سخت بشه.”

اونا با طراحی دستگاهایی به اسم واحدهای عملکرد نوری غیرخطی (NOFU) که الکترونیک و اپتیک رو ترکیب می‌کنن، این چالش رو پشت سر گذاشتن تا عملیات غیرخطی رو رو چیپ پیاده‌سازی کنن. محققا یه شبکهٔ عصبی عمیق نوری رو روی یه چیپ فوتونیک با استفاده از سه لایه از دستگاهایی که عملیات‌های خطی و غیرخطی رو انجام می‌دن، ساختن.

یه شبکهٔ کاملاً یکپارچه

اول کار، سیستم‌شون پارامترهای یه شبکهٔ عصبی عمیق رو به نور کدگذاری می‌کنه. بعدش، یه آرایه از تقسیم‌کننده‌های پرتوی قابل برنامه‌ریزی که تو مقالهٔ ۲۰۱۷ معرفی شده بود، ضرب ماتریس رو رو ورودی‌ها انجام می‌ده. داده‌ها بعدش به NOFUهای قابل برنامه‌ریزی منتقل می‌شن که با هدایت مقدار کمی نور به فوتودیودا، که سیگنال‌های نوری رو به جریان الکتریکی تبدیل می‌کنن، توابع غیرخطی رو پیاده‌سازی می‌کنن. این فرایند که نیاز به تقویت‌کنندهٔ خارجی رو از بین می‌بره، انرژی خیلی کمی مصرف می‌کنه.

یه تصویر از یه شبکهٔ عصبی که لایه‌ها و ارتباطات بین نورونا رو با رنگای جذاب نشون می‌ده.
این شبکهٔ عصبی پیچیده می‌تونه تو سطح‌های مختلفی از یادگیری و پردازش اطلاعات عمل کنه.

باندی‌وپادیا می‌گه: “ما تمام مدت تو حوزهٔ نوری می‌مونیم، تا وقتی که بخوایم جوابو بخونیم. این به ما این امکانو می‌ده که تأخیر فوق‌العاده پایینی رو به‌دست بیاریم.”

رسیدن به همچین تأخیری، بهشون این امکانو داد که یه شبکهٔ عصبی عمیق رو به‌خوبی روی چیپ آموزش بدن. این فرایند به اسم آموزش در محل شناخته می‌شه و معمولاً تو سخت‌افزار دیجیتال مقدار زیادی انرژی مصرف می‌کنه. او می‌گه: “این موضوع به‌خصوص برای سیستمایی که پردازش سیگنال‌های نوری تو دامنه انجام می‌دن، مفیده. مثل ناوبری یا مخابرات، و همچنین تو سیستمایی که می‌خواین تو زمان واقعی یاد بگیرن.”

سیستم فوتونیک تو طول آزمایشای آموزشی بیش از ۹۶ درصد دقت و تو طول استنتاج بیش از ۹۲ درصد دقت رو به‌دست آورد که با سخت‌افزارهای سنتی قابل مقایسه هستش. علاوه بر این، چیپ محاسبات کلیدی رو تو کمتر از نیم نانوثانیه انجام می‌ده. انگلوند می‌گه: “این نشون می‌ده که محاسبات — تو ذات خودش، نقشه‌کشی ورودی‌ها به خروجی‌ها — می‌تونه روی معماریای فیزیک خطی و غیرخطی جدید که یه قانون مقیاس‌بندی کاملاً متفاوتی از محاسبه در مقابل تلاش مورد نیازه، پیاده‌سازی بشه.”

تمام مدار با استفاده از همون زیرساخت و فرآیندهای کارخونه‌ای که چیپ‌های کامپیوتری CMOS رو تولید می‌کنن، ساخته شد. این می‌تونه به تولید چیپ به‌صورت انبوه کمک کنه و از تکنیک‌های آزموده‌شده‌ای استفاده کنه که خطای خیلی کمی رو تو فرایند ساخت وارد می‌کنن. باندی‌وپادیا می‌گه: “گسترش دستگاه و ادغامش با الکترونیکای دنیای واقعی مثل دوربیینا یا سیستمای مخابراتی، تمرکز اصلی کارهای آینده خواهد بود.”

علاوه بر این، محققا می‌خوان الگوریتمایی رو بررسی کنن که بتونن از مزایای اپتیک برای آموزش سریع‌تر سیستم‌ها و با کارایی انرژی بهتر استفاده کنن. این تحقیق به‌طور جزئی توسط بنیاد ملی علوم، دفتر تحقیقات علمی نیروی هوایی و تحقیقات NTT تأمین مالی شده.

مقاله های شبیه به این مقاله

بیشتر بخوانید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *