سرفیس RTX Spark Dev Box؛ دسکتاپ هوش مصنوعی مایکروسافت

مایکروسافت با Surface RTX Spark Dev Box یک دسکتاپ فشرده برای اجرای محلی مدل‌های بزرگ هوش مصنوعی معرفی کرده است؛ دستگاهی با تراشه Blackwell، حافظه یکپارچه ۱۲۸ گیگابایت و تمرکز بر توسعه‌دهندگان.

3 نظرات
سرفیس RTX Spark Dev Box؛ دسکتاپ هوش مصنوعی مایکروسافت

5 دقیقه

تصور کنید توانایی‌های یک لپ‌تاپ پیشرفته هوش مصنوعی را داشته باشید، اما بدون محدودیت‌های باتری و ملاحظات حرارتی. Surface RTX Spark Dev Box جدید مایکروسافت دقیقا چنین دستگاهی است: یک دسکتاپ فشرده، متراکم و بی‌پرده قدرتمند که برای اجرای مدل‌های بزرگ هوش مصنوعی روی میز کار شما ساخته شده است، نه در مرکز داده.

در قلب Dev Box، سامانه روی تراشه RTX Spark قرار دارد؛ ترکیبی هیبریدی که یک پردازنده Grace مبتنی بر Arm با ۲۰ هسته، شامل ده هسته Cortex‑X925 و ده هسته Cortex‑A725، را با یک پردازنده گرافیکی در کلاس Blackwell همراه می‌کند. اعداد اصلی چشمگیرند: حدود ۱ پتافلاپ توان محاسباتی FP4 با شتاب‌دهی ماتریس‌های تنک و ۱۲۸ گیگابایت حافظه یکپارچه. اگر این مشخصات را به زبان توسعه‌دهندگان ترجمه کنیم، یعنی امکان بارگذاری و اجرای استنتاج مدل‌هایی در محدوده تقریبی ۱۲۰ میلیارد پارامتر به‌صورت محلی، بدون نیاز دائمی به ارسال درخواست به سرویس‌های ابری.

این دستگاه مستقیما مهندسانی را هدف گرفته است که برای آزمایش، تنظیم دقیق مدل‌ها و جریان‌های کاری عامل‌محور به عملکرد پایدار هوش مصنوعی محلی نیاز دارند.

آنچه این مجموعه را متفاوت می‌کند، نحوه معرفی آن از سوی مایکروسافت برای سازندگان نرم‌افزار است. Dev Box با Windows 11 Pro عرضه می‌شود که برای توسعه بهینه شده است: حالت تاریک از ابتدا فعال است، ابزارهای محبوب توسعه از پیش نصب شده‌اند و PowerShell 7 به‌عنوان پوسته پیش‌فرض تنظیم شده است. در لایه زیرین، WSL 2 با عبور مستقیم GPU و پشتیبانی پیکربندی‌شده از CUDA ارائه می‌شود. همین نکته اهمیت زیادی دارد. بسیاری از زنجیره‌های ابزار هوش مصنوعی و پشته‌های استنتاج به محیط اجرای لینوکس وابسته‌اند؛ WSL با دسترسی به GPU فاصله میان دسکتاپ ویندوزی و سرورهای هوش مصنوعی مبتنی بر لینوکس را کمتر می‌کند.

علاقه‌مندان سخت‌افزار هم‌زمان هم به جزئیات بازاریابی و هم به مصالحه‌های عملی توجه خواهند کرد. پردازنده گرافیکی Blackwell در RTX Spark از نظر تعداد هسته‌های CUDA تقریبا هم‌سطح RTX 5070 معرفی شده است و مایکروسافت حدود ۶,۱۴۴ هسته CUDA را ذکر می‌کند؛ اما تفاوت اصلی در حافظه است: این تراشه نسبت به کارت‌های مصرفی، VRAM بسیار بیشتری در اختیار می‌گذارد و RAM میان CPU و GPU یکپارچه شده تا هنگام بارگذاری وزن‌های بزرگ، گلوگاه‌ها کاهش پیدا کنند. خنک‌سازی بر عهده یک شاسی آلومینیومی چاپ سه‌بعدی است که با ۱,۰۰۰ دریچه پوشیده شده؛ اشاره‌ای بازیگوشانه به «۱,۰۰۰ ترافلاپ». با اینکه طراحی بدنه به دفع حرارت کمک می‌کند، سیستم خنک‌سازی کاملا غیرفعال نیست و دستگاه هنگام فشار کاری می‌تواند تا ۱۰۰ وات گرما را به‌صورت فعال دفع کند.

وقتی Surface Laptop Ultra نیز همین سیلیکون RTX Spark را دارد، چرا باید یک جعبه دسکتاپ ساخت؟ پاسخ ساده است: محدودیت فرم‌فاکتور. لپ‌تاپ باید میان گرما، عمر باتری و توان عملیاتی پایدار تعادل برقرار کند. دسکتاپ چنین محدودیتی ندارد. در پردازش‌های کوتاه، لپ‌تاپ و این دستگاه ممکن است عملکردی مشابه داشته باشند. اما در اجرای طولانی‌مدت آموزش یا استنتاج، Dev Box توان عملیاتی بالاتری را برای مدت بیشتری حفظ می‌کند.

درگاه‌ها ساده و کاربردی انتخاب شده‌اند: یک پورت HDMI برای نمایشگرهای محلی، دو پورت USB‑C، یک پورت USB‑A، درگاه اترنت گیگابیتی و جک صوتی ۳.۵ میلی‌متری. می‌توانید از آن به‌عنوان ایستگاه کاری اصلی توسعه، میزبان استنتاج از راه دور برای لپ‌تاپ‌های سبک‌تر، یا یک گره اختصاصی هوش مصنوعی عامل‌محور در رک اداری استفاده کنید. مایکروسافت آن را یک دستگاه توسعه معرفی می‌کند، اما فرم و ماهیت آن مقایسه با برداشت ویندوزی از Mac Studio را هم به ذهن می‌آورد: یک گره فشرده و پربازده برای تولیدکنندگان محتوا و توسعه‌دهندگانی که توان محاسباتی متراکم و محلی می‌خواهند، بدون آنکه گرفتار هزینه سرویس‌های ابری شوند.

دسترسی در زمان عرضه محدود خواهد بود: مایکروسافت می‌گوید Surface RTX Spark Dev Box اواخر امسال عرضه می‌شود و در ابتدا فقط از طریق Microsoft.com در ایالات متحده به فروش خواهد رسید. قیمت و زمان عرضه گسترده‌تر در مناطق دیگر هنوز اعلام نشده است. این شرکت همچنین قیمت Surface Laptop Ultra را فاش نکرده، اما Dev Box روی کاغذ باید ارزان‌تر باشد، چون نمایشگر و باتری ندارد.

اگر کار شما به تکرار سریع آزمایش‌ها با مدل‌های بزرگ، تست استنتاج در مقیاس بالا، یا صرفا دوری از تأخیر و هزینه نمونه‌های اولیه وابسته به ابر گره خورده باشد، این دستگاه جذابیت زیادی دارد. با این حال چند پرسش باقی می‌ماند: اکوسیستم‌های نرم‌افزاری چگونه با معماری‌های RAM یکپارچه سازگار می‌شوند و آیا توسعه‌دهندگان یک دستگاه محلی را ترجیح می‌دهند یا رویکرد ترکیبی ابر و پردازش محلی را؟ در هر صورت، مایکروسافت موضع خود را روشن کرده است: توان محاسباتی محلی هوش مصنوعی چیزی است که باید برای آن طراحی کرد، نه فقط آن را اجاره کرد.

منبع: gsmarena

ارسال نظر

نظرات

پمپزون

مایکروسافت خوب بازی کرده، ولی بنظرم اینا خیلی شبیه تبلیغ «به جای اجاره، بخرید» هست، ترکیب ابر + محلی منطقی‌تره...

آرش

اگر حافظه یکپارچه موقع بارگذاری وزن‌ها گیر کنه، کلی دردسر و پچ می‌خواد، یعنی اکوسیستم‌ها واقعا آماده نیستن؟

دیتاپالس

وای... یعنی میشه مدل ۱۲۰ میلیاردی رو روی میز اجرا کرد؟ خیلی هیجانیه ولی قیمت و عرضه‌ش رو باید دید، عجله دارم دلم می‌خواد تستش کنم!

مطالب مرتبط