8 دقیقه
تلاش اپل برای هوشمندتر کردن سیری این هفته با یک مانع غیرمنتظره مواجه شد. کی یانگ (Ke Yang)، که بهتازگی بهعنوان مسئول تیم "Answers, Knowledge and Information" یا به اختصار AKI منصوب شده بود، طبق گزارشها در حال ترک اپل و پیوستن به متا است — حرکتی که سوالات تازهای درباره چشمانداز Apple Intelligence و نقشه راه سیری مطرح میکند. این تغییر مدیریتی در نقطهای حساس از توسعه فناوری، برای تیمهای مهندسی، طراحی تجربه کاربر و سیاستگذاری حریم خصوصی اپل پیامدهای مستقیم خواهد داشت.
Why this hire matters more than it looks
مدیریت کوتاهمدت کی یانگ بر تیم AKI تنها یک جابهجایی ساده در ساختار نیروی انسانی نبود. این تیم نقش محوری در تلاش اپل برای مجهز کردن سیری به توانایی استخراج پاسخهای مبتنی بر وب بهشیوهای مشابه ChatGPT دارد؛ کاری که مستلزم تلفیق پردازش محلی (on-device) با مدلهای سروری بزرگ (LLMهای مبتنی بر سرور) است، در حالی که محوریت حفظ حریم خصوصی کاربر یکی از اصول مهم اپل باقی میماند. نبود یک مدیر با تجربه در مقطع حساسی که یکپارچهسازی مدلهای زبان بزرگ، انتخاب مدل مناسب برای هر کار، و تنظیمات مربوط به دسترسی و ذخیرهسازی دادهها باید پیش برده شود، میتواند سرعت پیشرفت پروژههای مرتبط با Apple Intelligence و بهویژه قابلیتهای پیشرفته سیری را کاهش دهد.
Apple's recent AI sprint — quick recap
با وجود این ضربه، اپل بهصورت پیوسته در حال ساختن یک پشتهٔ نرمافزاری و زیرساخت هوش مصنوعی است که بر ترکیبی از مدلهای توسعهیافته در داخل، همکاریهای استراتژیک و خریدهای هدفمند تکیه دارد. آنچه در چند ماه گذشته مشاهده شده نشان میدهد که اپل نه فقط در سطح محصول نهایی، بلکه در لایههای زیرساختی و توسعهای نیز سرمایهگذاری قابلتوجهی انجام داده است؛ از تعامل با شرکتهای پیشرو در حوزه مدلهای زبان بزرگ تا جذب استارتاپهای تخصصی و توسعه مدلهای سبک اما کارآمد برای دستگاههای موبایل.
- شراکت با OpenAI برای یکپارچهسازی مدلهای زبان بزرگ (LLM) در Apple Intelligence که هدف آن بهبود پاسخدهی طبیعی و توانمندسازی سیری است.
- خرید شرکتهایی مانند TrueMeeting و WhyLabs که بهمنظور تقویت قابلیتهای پردازش گفتار، تحلیل محتوا و پایداری دادهای انجام شد؛ این نوع ادغامها به اپل امکان میدهد تا فنآوریهای تخصصی را سریعتر وارد اکوسیستم خود کند.
- توسعهٔ یک مدل با حدود 3 میلیارد پارامتر که برای اجرا روی آیفون و آیپد بهینهسازی شده است تا پردازشهای سبک و فرامین فوری کاربر بهصورت محلی انجام شود؛ در کنار این مدل، LLMهای مبتنی بر سرور برای وظایف سنگینتر و تحلیلهای گسترده برنامهریزی شدهاند.
- راهاندازی Private Apple Intelligence که هدف آن اجرای کارهای سادهٔ هوش مصنوعی روی دستگاه و ارجاع وظایف پیچیدهتر به سرورهای ابری رمزنگاریشده و بدون حالت (stateless) است تا سطح حریم خصوصی کاربران حفظ شود و همزمان توان پردازشی لازم فراهم گردد.
- گشودن مدلهای پایهای (foundational models) به توسعهدهندگان ثالث از طریق Foundational Models Framework تا جریانهای کاری مبتنی بر هوش مصنوعی میان اپها بهتر و یکپارچهتر شود و توسعۀ قابلیتهای میانبر درونبرنامهای را تسریع کند.

What this means for Siri and Apple Intelligence
قابلیتهایی که تیم AKI روی آن کار میکرد شامل سناریوهایی مانند این بود: از سیری بخواهید یک پاراگراف مشخص از پادکستی که در یک رشته پیام شنیدهاید پیدا کند، یا دادههای بهروز وب را جمعآوری کرده و با در نظر گرفتن متن و سابقهٔ کاربر پاسخ بدهد. این ویژگیها مستلزم سه عنصر اصلی هستند: 1) امکان انجام اقدامهای دروناپ (in-app actions) از طریق رابط صوتی یا متنی، 2) درک زمینهٔ شخصی (personal context awareness) که بهصورت ایمن از دادههای محلی کاربر بهره ببرد، و 3) توانایی انتخاب مدل زبان بزرگ مناسب برای هر وظیفه بر اساس پارامترهایی مانند دقت، حریم خصوصی و هزینهٔ پردازشی.
خروج یانگ ممکن است جدول زمانی پیادهسازی این قابلیتها را تغییر دهد. اپل از اکتبر 2024 برخی قابلیتهای پایهای هوش مصنوعی را منتشر کرده، اما ویژگیهای مورد انتظار کاربران—از جمله اجرای بیوقفهٔ اقدامات دروناپ و دسترسی عمیق به زمینهٔ شخصی کاربر—هنوز در مرحلهٔ تکمیل یا آزمایش هستند. سرعت جایگزینی رهبری و تداوم روند توسعه و یکپارچهسازیهایی مانند انتخاب LLM توسط توسعهدهندگان ثالث یا اتوماسیون درونبرنامهای که تحت هدایت سیری انجام میشود، از جمله عوامل کلیدی برای حفظ شتاب پروژه خواهند بود.
Will Apple change course or double down?
از آنجا که محوریت تمایز اپل در حوزهٔ هوش مصنوعی بر حفظ حریم خصوصی و تجربهٔ یکپارچهٔ کاربری استوار است، به نظر میرسد اپل عمیقتر بر روی استراتژی «مولتیمدل و ترکیبی» خود سرمایهگذاری میکند: انجام محاسبات سبک به صورت محلی (درون دستگاه) و ارجاع کارهای سنگینتر به سرویسهای ابری رمزنگاریشده و بدون نگهداری حالت. این رویکرد ضمن کاهش نیاز به ارسال دائمی دادههای حساس به سرورهای خارجی، به اپل اجازه میدهد تا بهصورت انتخابی از مدلهای سروری برای پردازشهای پیچیده استفاده کند.
با این حال، نقل و انتقال نیروی انسانی سطح بالا - بهویژه زمانی که شرکت رقیبی مانند متا اقدام به جذب میکند - نشاندهنده شدت رقابت در بازار استخدام نیروی متخصص هوش مصنوعی است. جذب یک مدیر یا متخصص کلیدی میتواند روند پیشرفت قابلیتها را تسریع کند یا در جهت عکس، باعث توقف موقت در برخی پروژهها شود. حرکت متا برای جذب چنین افرادی نشانهای از تشدید رقابت ویژگیها و سرعت توسعه میان شرکتهای بزرگ پلتفرمساز است، که ممکن است فشار بیشتری برای شتاببخشی به عرضهٔ قابلیتهای AI در اپل ایجاد کند.
Features to watch in the coming months
- یکپارچهسازیهای هوش مصنوعی از سوی طرفهای ثالث: کاربران بهزودی ممکن است بتوانند تعیین کنند که سیری برای برخی وظایف از کدام LLM استفاده کند — مثلاً GPT از OpenAI، Gemini از گوگل یا مدلهای ارائهشده توسط توسعهدهندگان ثالث که از طریق Foundational Models Framework در دسترس قرار میگیرند. این امکان میتواند انعطافپذیری بالاتری برای توسعهدهندگان و کاربران ایجاد کند، ولی در عین حال نیازمند مدیریت دقیق حریم خصوصی و تنظیمات شفاف دسترسی به دادهها خواهد بود.
- اقدامهای دروناپ (In-app Actions): اجرای دستورهای مبتنی بر صدا یا متن در داخل اپلیکیشنهای پشتیبانیشده، مانند افزودن آیتم به فهرست خرید، ارسال پیام، یا صفبندی پخش موسیقی. این قابلیت نیازمند تعریف استانداردهایی برای تعامل بین سیری و APIهای اپلیکیشنهاست تا تجربهای روان و قابل اعتماد فراهم شود.
- درک زمینهٔ شخصی (Personal Context Awareness): سیری با استفادهای ایمن و قابل کنترل از دادههای شخصی میتواند راهنماییهای شخصیسازیشده ارائه دهد — برای مثال پیدا کردن قسمتی از یک پادکست که در پیامها ذکر شده است یا پیشنهاد پاسخهای مرتبط با مکالمات اخیر. این سطح از هوشمندی باید با مکانیزمهای محافظتی داده و شفافیت در مورد نحوهٔ استفاده از اطلاعات همراه باشد.
حرکت کی یانگ به سمت متا یادآور این نکته است که پیشرفت در حوزهٔ هوش مصنوعی تا حد زیادی وابسته به افراد است، نه صرفاً مدلها و زیرساختها. اپل در جنبههای فنی پیشرفتهای مهمی داشته — چه در توسعهٔ مدلهای سبک برای اجرا روی دستگاه و چه در طراحی معماریهای هیبریدی برای امنیت و مقیاسپذیری — اما تغییرات رهبری و بازار کار فشرده میتواند جدول زمانی عرضهٔ قابلیتها را دستخوش تغییر کند. برای کاربران و توسعهدهندگان مهم است که هم به رونماییهای محصولی و هم به تحرکات استخدامی و رقابت جذب استعداد توجه کنند، چون این عوامل در کنار هم تعیینکننده سرعت و جهتگیری نوآوریها در سیستمعاملها و اکوسیستمهای اپلیکیشنی خواهند بود.
منبع: wccftech
ارسال نظر