همکاری سامسونگ و Nota AI برای شتاب دهی هوش مصنوعی محلی

توافق سامسونگ با Nota AI برای یکپارچه‌سازی فشرده‌سازی و بهینه‌سازی مدل‌ها در Exynos AI Studio به هدف اجرای سریع‌تر و خصوصی‌تر هوش مصنوعی روی دستگاه های مجهز به Exynos 2500 می‌پردازد.

6 نظرات
همکاری سامسونگ و Nota AI برای شتاب دهی هوش مصنوعی محلی

9 دقیقه

سامسونگ قراردادی با Nota AI امضا کرده است که می‌تواند سرعت اجرای هوش مصنوعی روی دستگاه را در تلفن‌ها و گجت‌هایی که با تراشه Exynos 2500 کار می‌کنند به‌طور محسوسی افزایش دهد. به‌جای واگذار کردن پردازش‌های سنگین هوش مصنوعی به سرورهای ابری، مدل‌های بهینه‌شده می‌توانند به‌صورت محلی اجرا شوند که نتیجه آن کاهش تأخیر، بهبود حریم خصوصی و واکنش سریع‌تر در ویژگی‌های مبتنی بر هوش مصنوعی است.

Nota AI راهکارهای فشرده‌سازی مدل و زنجیره ابزار بهینه‌سازی را می‌آورد

طبق توافق جدید، Nota AI فناوری‌های فشرده‌سازی و بهینه‌سازی مدل را در اختیار سامسونگ قرار می‌دهد تا با Exynos AI Studio یکپارچه شوند. هدف این همکاری ایجاد شرایطی است که مدل‌های پیشرفته تولیدی و استنتاجی بتوانند روی Exynos 2500 بدون وابستگی به سرورهای دوردست اجرا شوند و تجربه کاربری واقعی را بهبود بخشند.

مدیرعامل Nota AI، Myungsu Chae، این همکاری را به‌عنوان ساختن «یک چارچوب سخت و نرم افزاری همگرا» توصیف کرده است که سخت‌افزار و نرم‌افزار هوش مصنوعی را برای ارائه هوش مصنوعی تولیدی با کارایی بالا در لبه شبکه ترکیب می‌کند. در عمل این معنا را دارد که فایل‌های مدل کوچک‌تر و کارآمدتر شوند و تنظیمات زمان اجرا (runtime) به‌گونه‌ای انجام شوند که با معماری تراشه همخوانی بیشتری داشته باشند.

انتگاشته‌شده‌های فشرده‌سازی مدل مانند فشرده‌سازی ساختار، کاهش دقت هدفمند و جداسازی شبکه می‌توانند جای پای هوش مصنوعی را روی دستگاه‌های موبایل گسترش دهند. ترکیب این تکنیک‌ها با ابزارهای مدیریت حافظه و زمانبندی اجرا، باعث می‌شود Exynos 2500 بتواند بارهای کاری بزرگ‌تر یا پیچیده‌تری را با مصرف انرژی معقول پردازش کند.

آنچه Exynos 2500 ارائه می‌دهد

  • پردازنده 10 هسته‌ای با هسته اصلی Cortex-X925 در فرکانس 3.30GHz
  • دو هسته Cortex-A725 در فرکانس 2.74GHz و پنج هسته Cortex-A725 در فرکانس 2.36GHz
  • دو هسته کارآمد Cortex-A520 در فرکانس 1.80GHz
  • واحد گرافیکی Samsung Xclipse 950 مبتنی بر معماری AMD RDNA
  • NPU اختصاصی با توان 59 TOPS
  • پشتیبانی از حافظه LPDDR5X با نرخ 76.8 Gb/s

این مشخصات نشان‌دهنده پلتفرم سخت‌افزاری قابل توجهی است، اما عدد TOPS به‌تنهایی تصویر کامل عملکرد واقعی را نشان نمی‌دهد. به‌عنوان نمونه، گفته شده که NPU در Snapdragon 8 Elite Gen 5 در محدوده حدودی 100 TOPS قرار می‌گیرد، بنابراین سامسونگ از طریق بهینه‌سازی‌های نرم‌افزاری تلاش می‌کند تا از سخت‌افزار Exynos در مواردی که واقعاً اهمیت دارد یعنی برنامه‌های دنیای واقعی، بیشترین بهره را ببرد.

علاوه بر مشخصات خام، معماری حافظه، پهنای باند LPDDR5X و هماهنگی بین پردازنده مرکزی، GPU و NPU تعیین‌کننده تجربه نهایی خواهند بود. بهینه‌سازی‌هایی که توسط Nota AI ارائه می‌شود می‌تواند به کاهش نیاز به حافظه، کاهش انتقال‌های داده بین واحدها و بهبود زمان پاسخ کمک کند که این موارد در پایان به عمر باتری و پایداری عملکرد منجر می‌شوند.

چرا بهینه‌سازی از اعداد اوج مهم‌تر است

ابزارهای Nota AI را می‌توان به‌عنوان یک سرویس تیون آپ برای شبکه‌های عصبی تصور کرد؛ عملیاتی مانند pruning (هرس شبکه)، quantization (کوانتایزاسیون)، knowledge distillation (پالایش دانش) و زمانبندی اجرای وظایف که محاسبات و سربار حافظه را کاهش می‌دهند. این مجموعه روش‌ها به NPU با ظرفیت 59 TOPS در Exynos 2500 اجازه می‌دهد تا مدل‌های بزرگ‌تر یا پیچیده‌تری را نسبت به حالت پیش‌فرض اجرا کند و در عین حال مصرف انرژی را کنترل نماید.

در عمل، بهینه‌سازی شامل بررسی ساختار مدل، حذف وزن‌های غیرضروری، تبدیل اعداد با دقت بالا به قالب‌های کم‌دقت‌تر، اصلاح ترتیب عملیات و تطبیق عملیات ریاضی با دستورالعمل‌های شتاب‌دهنده سخت‌افزاری است. این فرآیندها علاوه بر کاهش حجم مدل، باعث می‌شوند عملیات ورودی-خروجی حافظه کمتر و استفاده بهتر از کش‌های تراشه حاصل شود.

برای توسعه‌دهندگان، وجود یک زنجیره ابزار بهینه‌سازی که با Exynos AI Studio یکپارچه شده باشد، به معنای کاهش پیچیدگی فرآیند بهینه‌سازی مدل و تسهیل استقرار مدل‌های تولیدی و استنتاجی روی دستگاه است. این امر می‌تواند زمان ورود به بازار را کاهش دهد و هزینه‌های توسعه را پایین بیاورد.

انتظارات کاربران از این بهبودها

  • زمان پاسخ سریع‌تر برای قابلیت‌های هوش مصنوعی اجرا شده روی دستگاه و وظایف تولیدی مانند تولید تصویر یا متن
  • کاهش تأخیر و افزایش حریم خصوصی به‌خاطر ارسال کمتر درخواست‌ها به سرویس‌های ابری
  • افزایش کارآیی باتری هنگام اجرای بارهای کاری هوش مصنوعی به‌صورت محلی

در سطح کاربری، این همکاری می‌تواند به دستیارهای محلی روان‌تر، پردازش سریع‌تر تصاویر و صدا، و کاهش وابستگی به سرویس‌های ابری در عملیات روزمره منجر شود. برای مثال، قابلیت‌هایی مانند تصحیح خودکار تصویر، فشرده‌سازی هوشمند و ترجمه آفلاین در زمان واقعی با تأخیر کمتر قابل ارائه خواهند بود.

علاوه بر بهبود تجربه کاربر، اجرای مدل‌ها به‌صورت محلی مزایای امنیتی نیز به همراه دارد. داده‌هایی که در دستگاه باقی می‌مانند کمتر در معرض خطر نشت یا سوءاستفاده قرار می‌گیرند و کنترل بیشتری بر داده‌های حساس کاربر وجود خواهد داشت. این مسئله برای برنامه‌هایی که شامل اطلاعات شخصی یا پزشکی هستند، اهمیت ویژه‌ای دارد.

تکنیک‌های کلیدی فشرده‌سازی و بهینه‌سازی

برخی از تکنیک‌های متداول که Nota AI ممکن است به کار گیرد شامل موارد زیر هستند:

  • Pruning یا هرس ساختار شبکه برای حذف وزن‌ها و نورون‌های کم‌اهمیت
  • Quantization تبدیل اعداد شناور به فرم‌های کم‌دقت‌تر مانند int8 یا int4 برای کاهش فضای حافظه و مصرف محاسباتی
  • Knowledge distillation انتقال دانش از یک مدل بزرگ به یک مدل کوچک‌تر با حفظ دقت کاربردی
  • Operator fusion و بازنویسی گراف محاسباتی برای کاهش مراحل میانی و بهبود اجرای زمان‌ واقعی
  • Runtime scheduling و مدیریت حافظه برای هم‌زمانی بهتر بین پردازنده، GPU و NPU

ترکیب این روش‌ها معمولاً بهترین نتیجه را می‌دهد. برای نمونه، ترکیب کوانتایزاسیون با پالایش دانش می‌تواند دقت مدل‌های کوچک شده را به سطحی نزدیک به مدل اصلی حفظ کند، در حالی که حجم محاسبات و مصرف انرژی به‌طور چشمگیری کاهش می‌یابد.

همچنین مهم است که فرایند بهینه‌سازی قابل اتکا و تکرارپذیر باشد. ابزارهای خودکار برای ارزیابی تراز بین کاهش اندازه و افت دقت، و نیز قابلیت‌های بازگشت به نسخه قبلی مدل، برای تیم‌های توسعه حیاتی خواهند بود.

کاربردهای واقعی و سناریوهای مصرف

اجرای مدل‌های تولیدی و استنتاجی به‌صورت محلی روی دستگاه‌های همراه می‌تواند در حوزه‌های متعددی تغییر ایجاد کند. مثال‌های قابل توجه عبارت‌اند از:

  • دستیارهای شخصی آفلاین که بدون نیاز به اتصال مداوم اینترنت پاسخ می‌دهند
  • پردازش تصویر و ویدیو در زمان واقعی برای بهبود کیفیت عکس، حذف نویز و اعمال سبک‌های هنری
  • تشخیص گفتار و ترجمه آنی که برای سفر یا محیط‌های حساس به حریم خصوصی کاربرد دارد
  • برنامه‌های سلامت و پزشکی که نیاز به تحلیل داده‌های حساس کاربر بدون ارسال به ابر دارند
  • کاربردهای تعاملی مبتنی بر هوش مصنوعی در بازی‌ها و واقعیت افزوده با تأخیر بسیار کم

برای تولیدکنندگان نرم‌افزار و سرویس‌ها، توانایی ارائه این ویژگی‌ها بدون هزینه‌های مداوم سرور و با مصرف کمتر پهنای باند، مزیت تجاری قابل توجهی خواهد بود. در فضای رقابتی امروز که کاربران به تجربه سریع و امن عادت کرده‌اند، این نوع تمایز می‌تواند عامل تعیین‌کننده‌ای برای انتخاب سخت‌افزار یا پلتفرم باشد.

چالش‌ها و ملاحظات توسعه

با وجود تمام مزایا، اجرای مدل‌های پیچیده روی دستگاه با محدودیت‌هایی همراه است. تیم‌های توسعه باید به نحوه مدیریت حافظه، سازگاری با نسخه‌های مختلف سیستم‌عامل، و تضمین عملکرد در بازه‌های دمایی و شرایط مختلف توجه کنند. همچنین تست گسترده و ابزارهای پروفایلینگ برای شناسایی گلوگاه‌های عملکردی ضروری‌اند.

علاوه بر این، به‌روزرسانی مدل‌ها و توزیع آن‌ها در بین کاربران باید به‌صورت امن و قابل اعتماد انجام شود تا از سازگاری و حفظ کیفیت مدل پس از انتشار اطمینان حاصل شود. سیستم‌های مدیریت نسخه مدل و امضای دیجیتال مدل‌ها می‌توانند در این زمینه کمک‌کننده باشند.

چشم‌انداز و اثرات رقابتی

از منظر رقابتی، تمرکز بر نرم‌افزار و زنجیره ابزار بهینه‌سازی به سامسونگ این امکان را می‌دهد تا با وجود تفاوت در اعداد سخت‌افزاری مثل TOPS، تجربه‌ای هم‌سطح یا بهتر در کاربردهای روزمره ارائه کند. در دنیای موبایل، عملکرد واقعی در وظایف روزمره و عمر باتری اغلب مهم‌تر از معیارهای مرجع مصنوعی است.

ادغام Nota AI با Exynos AI Studio می‌تواند اکوسیستمی از مدل‌های آماده، ابزارهای تبدیل و راهنمایی‌های پیاده‌سازی فراهم کند که توسعه‌دهندگان را تشویق به ساخت قابلیت‌های جدید روی پلتفرم سامسونگ کند. این رویکرد شباهت به استراتژی‌های دیگر بازیگران بازار دارد که با ترکیب سخت‌افزار و نرم‌افزار، مزیت رقابتی ایجاد می‌کنند.

در نهایت، موفقیت این همکاری بستگی به پذیرش توسعه‌دهندگان، کیفیت ابزارها و توانایی ارائه بروزرسانی‌های منظم و قابل اطمینان دارد. اگر سامسونگ و Nota AI بتوانند تجربه‌ای ساده و قابل اتکا برای انتقال مدل‌ها از محیط توسعه به اجرای محلی فراهم کنند، احتمالاً شاهد افزایش قابل توجهی در قابلیت‌های هوش مصنوعی محلی در محصولات آینده خواهیم بود.

جمع‌بندی این است که این همکاری نشان می‌دهد افزایش عملکرد هوش مصنوعی روی دستگاه دیگر فقط به قدرت خام پردازنده‌ها محدود نیست و با ترکیب تکنیک‌های پیشرفته فشرده‌سازی و بهینه‌سازی نرم‌افزاری می‌توان به تجربه‌های AI قوی، سریع و خصوصی‌تر برای کاربران نهایی دست یافت.

منبع: wccftech

ارسال نظر

نظرات

اتو_ر

منطقیش همینه: ترکیب سخت‌افزار و نرم‌افزار، نه فقط اعداد خام. اگه ابزارها ساده باشن، devها سریع میارن قابلیت‌ها رو🙂

آرمین

خوبه ولی یه کم اغراق تو تبلیغات حس میشه... 59 TOPS جذابه اما معماری حافظه و runtime واقعا تعیین‌کننده‌ان.

لابنیکس

تو پروژه قبلیم همین فشرده‌سازی باعث شد مدل‌های سنگین تو موبایل جا بشن. اما تست و مانیتورینگ زیاد می‌خواد، دردسر داره.

توربو

منصفانه؛ بنچمارک‌ها همه‌چیز نیستن، تجربه روزمره مهمه. امیدوارم devها از این ابزارها استفاده کنن

کوینتون

این ادعاها واقعی ان؟ TOPS کمتر ولی نرم‌افزار قوی، واقعا تو عمل جواب می‌ده یا صرفا بازاریابی و وعده‌ست؟

دیتاپالس

واقعا چشمگیره! اجرای مدل‌ها روی گوشی با این سطح بهینه‌سازی یعنی تاخیر کمتر و حریم خصوصی بهتر. امیدوارم مصرف باتری هم واقعی بهتر شه، نه فقط شعار.

مطالب مرتبط