چیپ های فوتونیک چینی؛ شتاب دهنده های نوین در بینایی ماشینی

تحقیقات چینی از چیپ‌های فوتونیک هوش مصنوعی خبر می‌دهد که در برخی وظایف بینایی و تولید تصویر سرعت و کارایی انرژی را به‌طور چشمگیری افزایش می‌دهند؛ این چیپ‌ها مکمل GPUها در پردازش تصویر خواهند شد.

5 نظرات
چیپ های فوتونیک چینی؛ شتاب دهنده های نوین در بینایی ماشینی

7 دقیقه

پژوهشگران چینی گزارش داده‌اند که یک کلاس جدید از چیپ‌های هوش مصنوعی فوتونیک (چیپ نوری) ساخته‌اند که در برخی وظایف مشخص یادگیری ماشینی به‌طور چشمگیری سرعت را افزایش می‌دهد — در برخی موارد با ادعای عملکرد بیش از 100 برابر نسبت به GPUهای مرسوم و مصرف انرژی بسیار کمتر. این دستگاه‌ها جایگزین همه‌منظوره برای شتاب‌دهنده‌های عمومی نیستند، اما می‌توانند ساختار پردازش تصویر، ویدئو و بینایی ماشین را دگرگون کنند و مدل‌های مولد تصویری و لوله‌های پردازش ویدیویی را بهینه نمایند.

چیستند این چیپ‌های فوتونیک هوش مصنوعی؟

دو نمونه اولیه برجسته از دانشگاه‌های برتر چین معرفی شده‌اند. نمونه اول، ACCEL، که در دانشگاه تسینگ‌هو (Tsinghua) توسعه یافته است، یک طراحی هیبریدی است که المان‌های فوتونیک را با مدارهای الکترونیکی آنالوگ ترکیب می‌کند. این مجموعه که با فرایندهای تولید SMIC ساخته شده، به‌گزارش تیم توسعه‌دهنده قادر است در برخی بارهای کاری آنالوگ به حدود 4.6 پتافلاپس دست یابد در حالی که تنها کسری از توان مصرفی GPUهای معمول را مصرف می‌کند. این ویژگی نشان‌دهنده بهینگی انرژی و توان پردازشی بالا در محاسبات ماتریسی و عملیات‌های هم‌زمان است.

پروژه دیگر با نام LightGen، نتیجه همکاری دانشگاه شانگهای جیاو تونگ و تسینگ‌هو است و یک چیپ کاملاً اپتیکال محسوب می‌شود که بیش از دو میلیون «نورون فوتونیک» (photonic neurons) را در خود جای داده است. به گفته پژوهشگران، LightGen در وظایف با تعریف محدود مانند تولید تصویر (image generation)، انتقال سبک (style transfer)، حذف نویز (denoising) و پردازش تصویر سه‌بعدی، افزایش سرعت و بهینگی انرژی بزرگی نشان می‌دهد. این گونه چیپ‌ها با معماری‌ها و مدل‌های شبکه عصبی که دارای ماتریس‌های بزرگ و عملیات‌های هم‌زمان هستند، بیشترین سازگاری را دارند و برای برنامه‌های بینایی مصنوعی و خدمات تولید تصویر می‌توانند نقش کلیدی ایفا کنند.

چرا فوتونیک در برخی وظایف هوش مصنوعی از الکترون جلو می‌زند

GPUهای مدرن مانند Nvidia A100 بر پایه جریان الکترون از طریق میلیاردها ترانزیستور کار می‌کنند. این معماری در اجرای گام‌به‌گام کد و برنامه‌پذیری انعطاف‌پذیر بسیار خوب عمل می‌کند، اما هزینه‌هایی نیز دارد: مصرف انرژی بالا، تولید گرمای قابل توجه و وابستگی به گره‌های پیشرفته تولید نیمه‌هادی. برای بسیاری از مراکز داده و کاربردهای لبه‌ای، این هزینه‌های انرژی و خنک‌کننده مسأله‌ای قابل توجه است.

در مقابل، چیپ‌های فوتونیک محاسبه را با نور انجام می‌دهند. آن‌ها عملیات را از طریق تداخل نوری و تبدیلات آنالوگ به انجام می‌رسانند و برخی محاسبات ریاضی را به‌صورت موازی و با سرعت نور اجرا می‌کنند. این ویژگی آن‌ها را برای بارهای کاری از پیش تعیین‌شده و ماتریس‌محور—مانند ضرب ماتریس‌ها، کانولوشن‌ها و عملیات خطی گسترده—بسیار سریع و کم‌مصرف می‌کند. به‌علاوه، برخی پیاده‌سازی‌های فوتونیک امکان ساخت با فرایندهای تولید بالغ‌تر و ارزان‌تر را فراهم می‌کنند که می‌تواند مسیر تجاری‌سازی را کوتاه‌تر نماید. به‌عبارتی، فوتونیک می‌تواند هزینه انرژی به‌ازای هر عملیات را کاهش دهد و تأخیر در پردازش موازی ماتریسی را به حداقل برساند، امری که برای پردازش تصویر و بینایی ماشین با نیاز به اجرای میلیون‌ها عملیات خطی در لحظه حیاتی است.

دستاوردهای واقعی — اما در یک مسیر محدود

گزارش‌ها نشان می‌دهند که ACCEL و LightGen در بنچ‌مارک‌های مشخص مرتبط با وظایف بینایی و تولیدی نسبت به GPUهای معمولی برتری‌های بزرگی دارند. با این وجود، تیم‌ها تأکید می‌کنند که این پردازنده‌های فوتونیک محاسبات آنالوگ از پیش تعریف شده را اجرا می‌کنند و برای اجرای کد عمومی یا عملیات‌های شدید حافظه‌ای مناسب نیستند. به عبارت دیگر، آن‌ها شتاب‌دهنده‌های تخصصی هستند، نه جایگزین‌های عمومی برای GPU. این محدودیت‌ها شامل برنامه‌پذیری محدود، مدیریت حافظهٔ پیچیده و عدم توانایی در اجرای همگانی مجموعه‌ای از عملیات دیجیتال پیچیده می‌شود. در نتیجه، استفاده بهینه از این چیپ‌ها نیازمند معماری‌های هیبریدی و مدل‌های مختص بهینه‌سازی در لایه نرم‌افزاری است.

  • نقاط قوت: سرعت بسیار بالا در عملیات ماتریسی و مشابه کانولوشن، مصرف انرژی بسیار کمتر به ازای هر عملیات، و پتانسیل قوی برای جریان‌های پردازش تصویر/ویدئو و بینایی ماشینی.
  • محدودیت‌ها: تطابق ضعیف با بارهای کاری عمومی، برنامه‌پذیری محدود، و محدودیت در مدیریت حافظه و داده‌های بزرگ.

این پیشرفت برای سخت‌افزار هوش مصنوعی چه معنایی دارد

می‌توان سناریویی را تصور کرد که در آن لوله‌های پردازش هوش مصنوعی بخش‌های سنگین بصری را به گره‌های فوتونیک کم‌مصرف واگذار می‌کنند، در حالی که GPUها وظایف آموزش انعطاف‌پذیر، مدیریت حافظه و پردازش‌های کلی‌تر را بر عهده دارند. چنین رویکرد هیبریدی می‌تواند هزینه انرژی را کاهش دهد، پردازش بلادرنگ را تسریع کند و برنامه‌هایی مانند استنتاج روی دستگاه (on-device inference)، مزارع پردازش ویدئو و سرویس‌های مولد تصویری با مقیاس بزرگ را اقتصادی‌تر نماید. این مدل ترکیبی بین چیپ‌های فوتونیک برای کارهای ماتریسی سنگین و GPUها برای منطق کلی و مدیریت داده می‌تواند به بهبود هزینه-عملکرد در سیستم‌های بینایی مصنوعی منجر شود.

از سوی دیگر، انتشار نتایج این تیم‌های چینی در مجله Science اهمیت اعتبار علمی و بازبینیِ همتایان را نشان می‌دهد؛ یعنی ادعاها تنها در قالب یک اطلاعیه صنعتی نیستند بلکه پشتوانهٔ پژوهشی دارند. با این حال مسیر از نمونه‌های آزمایشگاهی تا تولید انبوه دشوار است: یکپارچه‌سازی با اکوسیستم نرم‌افزاری، هزینه تولید، مدل‌های برنامه‌نویسی جدید برای واجدیت عملی، و پشتیبانی از ابزارها و فریم‌ورک‌های یادگیری ماشینی از جمله موانع اصلی هستند. این موارد نیاز به سرمایه‌گذاری در ایجاد لایه‌های نرم‌افزاری، کتابخانه‌های مشتق از GPU و ابزارهای تبدیل مدل دارند تا توسعه‌دهندگان بتوانند مدل‌های بینایی را بدون بازنویسی کامل به این پلتفرم‌ها منتقل کنند.

پس آیا صنعت باید وحشت کند؟ هنوز نه. چیپ‌های فوتونیک هوش مصنوعی ظاهراً آماده‌اند که در حوزه‌های هدفمند و مشخص مکمل GPUها باشند و نه اینکه آن‌ها را به‌طور کامل جایگزین کنند. با این حال برای شرکت‌هایی که روی بینایی ماشینی در مقیاس بزرگ سرمایه‌گذاری کرده‌اند — سرویس‌های پردازش تصویر و ویدئو، تولید تصویر مولد، کنترل‌های بینایی هوشمند در لبه و سیستم‌های واقعیت افزوده یا واقعیت مجازی با نیاز به پردازش هم‌زمان زیاد — این تحولات ارزش پایش دقیق دارند. در آینده نزدیک انتظار می‌رود پژوهش‌های بیشتر، توسعه ابزارها و نمونه‌های اولیه تجاری شرایطی فراهم کنند که چیپ‌های فوتونیک در اکوسیستم سخت‌افزار هوش مصنوعی جایگاه مشخصی بیابند و هزینه-فایدهٔ عملیات بینایی را بهبود دهند.

در جمع‌بندی، چیپ‌های فوتونیک و نور-محور نوید افزایش کارایی و کاهش مصرف انرژی در وظایف ماتریسی و بینایی را می‌دهند، اما دسترسی گسترده به مزایا نیازمند حل مسائل مهندسی، اقتصادی و نرم‌افزاری است. بازاریابی هوشمند، سرمایه‌گذاری در زنجیره تأمین تولید (برای مثال همکاری با foundryهایی مانند SMIC)، و توسعه چارچوب‌های نرم‌افزاری که بتوانند مدل‌های یادگیری عمیق را برای اجرا روی معماری‌های فوتونیک آماده کنند، سه ستون اصلی گذار از آزمایشگاه به تولید انبوه خواهند بود. در نهایت این فناوری می‌تواند بخش مهمی از استراتژی صرفه‌جویی انرژی و تسریع کاربردهای بینایی ماشین و پردازش تصویر در صنایع مختلف باشد.

منبع: smarti

ارسال نظر

نظرات

ماکس_ف

ادعاها سنگینه، ولی برنامه‌پذیری محدود و مدیریت حافظه واقعا دردسرساز. بازاریابی زیادی داره؟

پمپزون

تو پروژه‌ی ویدئو روی لبه کار کردم، مصرف انرژی یه فاکتور بزرگه، اگه این چیپ‌ها عملی باشن کلی هزینه ها پایین میان اما نرم‌افزار لازمه

امیر

معقول به نظر می‌رسه مخصوصا برای لبه و ویدئو، ولی نه جایگزین GPUها. ترکیبی بهتر جواب میده.

لابکور

واقعاً 4.6 پتافلاپس با مصرف خیلی کم؟ این آمارها رو باید با بنچمارک مستقل دید، هنوز شک دارم، عجله ممنوع

رودیکس

وای، 100 برابر سرعت؟ اگر واقعی باشه، آینده پردازش تصویر رو عوض میکنه. اما امیدوارم که فقط شعاره نباشه...

مطالب مرتبط