با حذف یک گلوگاه مهم
محاسبات هوش مصنوعی «با سرعت نور» ممکن شد
تاریخ انتشار
شنبه ۸ آذر ۱۴۰۴ ساعت ۱۲:۴۵
آیتیمن- به گفته پژوهشگران، این معماری جدید، گلوگاههای رایج در سیستمهای فعلی را با یک عملیات نوری منفرد و غیرفعال جایگزین میکند؛ فرآیندی که با یک بار شلیک لیزر انجام میشود و میتواند به سختافزار پایهای برای دستیابی به هوش عمومی مصنوعی (AGI) تبدیل شود.
در قلب مدلهای زبانی بزرگ (LLM) و سایر الگوریتمهای مبتنی بر یادگیری عمیق، ساختاری به نام «تنسور» قرار دارد؛ چیزی شبیه به یک کمد بایگانی که یادداشتهایی چسبانده شدهاند تا نشان دهند کدام کشوها بیشتر استفاده میشوند.
در زمان آموزش یک مدل هوش مصنوعی برای انجام وظایفی مانند شناسایی تصویر یا پیشبینی متن، دادهها در قالب همین تنسورها مرتبسازی میشوند. در سیستمهای کنونی، سرعت پردازش دادههای تنسوری، یکی از گلوگاههای اصلی عملکرد محسوب میشود و محدودیتی سختافزاری برای بزرگی مقیاس مدلها ایجاد میکند.
در محاسبات نوری رایج، مدلها تنسورها را با شلیک چندباره آرایههای لیزری پردازش میکنند؛ مانند دستگاهی که بارکد روی بستهها را اسکن میکند تا محتوای آن را تشخیص دهد، با این تفاوت که هر بارکد، یک مسئله ریاضی را نمایندگی میکند. توان پردازشی مورد نیاز برای حل این مسائل متناسب با پیچیدگی مدل افزایش مییابد.
اگرچه محاسبات نوری در مقیاسهای کوچکتر سریعتر و کممصرفتر هستند، بیشتر سیستمهای نوری توانایی پردازش همزمان (Parallel) ندارند. برخلاف پردازندههای گرافیکی (GPU) که میتوان آنها را بهصورت زنجیرهای متصل کرد تا توان پردازشی را بهطور نمایی افزایش داد، سیستمهای نوری معمولاً بهصورت خطی عمل میکنند. همین محدودیت باعث شده بسیاری از توسعهدهندگان، محاسبات نوری را کنار بگذارند و به سراغ مزایای پردازش موازی با GPUها بروند.
این گلوگاه مقیاسپذیری یکی از دلایلی است که شرکتهایی مانند OpenAI، گوگل، Anthropic و xAI برای آموزش و اجرای مدلهای بزرگ، به هزاران GPU بهصورت همزمان نیاز دارند.
اما معماری جدیدی به نام POMMM یا «ضرب ماتریس-ماتریس نوری موازی» میتواند این مشکل را حل کند. برخلاف روشهای نوری قبلی، این معماری قادر است چندین عملیات تنسوری را بهطور همزمان و تنها با یک شلیک لیزری انجام دهد.
نتیجه، طراحی سختافزاری پایهای برای هوش مصنوعی است که میتواند سرعت پردازش تنسورها را از مرزهای سختافزارهای الکترونیکی فعلی فراتر ببرد و در عین حال مصرف انرژی را نیز بهشدت کاهش دهد.
این پژوهش که در ۱۴ نوامبر در ژورنال علمی Nature Photonics منتشر شده، نتایج آزمایشهای اولیه این معماری نوری را همراه با مقایسههایی با سیستمهای پردازشی متعارف نوری و GPU نشان میدهد.
دانشمندان با آرایشی خاص از اجزای سختافزاری نوری معمول و همچنین روشی نوآورانه برای رمزگذاری و پردازش داده، موفق شدند بستههای تنسوری را در یک شلیک لیزری ثبت و تحلیل کنند.
آنها دادههای دیجیتال را به دامنه و فاز موجهای نوری رمزگذاری کردند، بهطوریکه اطلاعات به ویژگیهای فیزیکی در میدان نوری تبدیل شد و این موجهای نوری با یکدیگر ترکیب شده و عملیات ریاضی مانند ضرب ماتریس یا تنسور را انجام دادند.
در این چارچوب، عملیات نوری بهصورت غیرفعال و همزمان با عبور نور انجام میشود و هیچ نیازی به منبع تغذیه اضافی یا کنترلکنندههای فعال ندارد. این ویژگی باعث حذف نیاز به سوئیچینگ و کنترلهای پرمصرف در طول پردازش شده است.
به گفته پژوهشگران، این روش میتواند ظرف سه تا پنج سال آینده در پلتفرمهای اصلی هوش مصنوعی ادغام شود.
در قلب مدلهای زبانی بزرگ (LLM) و سایر الگوریتمهای مبتنی بر یادگیری عمیق، ساختاری به نام «تنسور» قرار دارد؛ چیزی شبیه به یک کمد بایگانی که یادداشتهایی چسبانده شدهاند تا نشان دهند کدام کشوها بیشتر استفاده میشوند.
در زمان آموزش یک مدل هوش مصنوعی برای انجام وظایفی مانند شناسایی تصویر یا پیشبینی متن، دادهها در قالب همین تنسورها مرتبسازی میشوند. در سیستمهای کنونی، سرعت پردازش دادههای تنسوری، یکی از گلوگاههای اصلی عملکرد محسوب میشود و محدودیتی سختافزاری برای بزرگی مقیاس مدلها ایجاد میکند.
در محاسبات نوری رایج، مدلها تنسورها را با شلیک چندباره آرایههای لیزری پردازش میکنند؛ مانند دستگاهی که بارکد روی بستهها را اسکن میکند تا محتوای آن را تشخیص دهد، با این تفاوت که هر بارکد، یک مسئله ریاضی را نمایندگی میکند. توان پردازشی مورد نیاز برای حل این مسائل متناسب با پیچیدگی مدل افزایش مییابد.
اگرچه محاسبات نوری در مقیاسهای کوچکتر سریعتر و کممصرفتر هستند، بیشتر سیستمهای نوری توانایی پردازش همزمان (Parallel) ندارند. برخلاف پردازندههای گرافیکی (GPU) که میتوان آنها را بهصورت زنجیرهای متصل کرد تا توان پردازشی را بهطور نمایی افزایش داد، سیستمهای نوری معمولاً بهصورت خطی عمل میکنند. همین محدودیت باعث شده بسیاری از توسعهدهندگان، محاسبات نوری را کنار بگذارند و به سراغ مزایای پردازش موازی با GPUها بروند.
این گلوگاه مقیاسپذیری یکی از دلایلی است که شرکتهایی مانند OpenAI، گوگل، Anthropic و xAI برای آموزش و اجرای مدلهای بزرگ، به هزاران GPU بهصورت همزمان نیاز دارند.
اما معماری جدیدی به نام POMMM یا «ضرب ماتریس-ماتریس نوری موازی» میتواند این مشکل را حل کند. برخلاف روشهای نوری قبلی، این معماری قادر است چندین عملیات تنسوری را بهطور همزمان و تنها با یک شلیک لیزری انجام دهد.
نتیجه، طراحی سختافزاری پایهای برای هوش مصنوعی است که میتواند سرعت پردازش تنسورها را از مرزهای سختافزارهای الکترونیکی فعلی فراتر ببرد و در عین حال مصرف انرژی را نیز بهشدت کاهش دهد.
این پژوهش که در ۱۴ نوامبر در ژورنال علمی Nature Photonics منتشر شده، نتایج آزمایشهای اولیه این معماری نوری را همراه با مقایسههایی با سیستمهای پردازشی متعارف نوری و GPU نشان میدهد.
دانشمندان با آرایشی خاص از اجزای سختافزاری نوری معمول و همچنین روشی نوآورانه برای رمزگذاری و پردازش داده، موفق شدند بستههای تنسوری را در یک شلیک لیزری ثبت و تحلیل کنند.
آنها دادههای دیجیتال را به دامنه و فاز موجهای نوری رمزگذاری کردند، بهطوریکه اطلاعات به ویژگیهای فیزیکی در میدان نوری تبدیل شد و این موجهای نوری با یکدیگر ترکیب شده و عملیات ریاضی مانند ضرب ماتریس یا تنسور را انجام دادند.
در این چارچوب، عملیات نوری بهصورت غیرفعال و همزمان با عبور نور انجام میشود و هیچ نیازی به منبع تغذیه اضافی یا کنترلکنندههای فعال ندارد. این ویژگی باعث حذف نیاز به سوئیچینگ و کنترلهای پرمصرف در طول پردازش شده است.
به گفته پژوهشگران، این روش میتواند ظرف سه تا پنج سال آینده در پلتفرمهای اصلی هوش مصنوعی ادغام شود.

































