این رمزگشا یا رابط مغز-کامپیوتر چگونه قادر به تبدیل فکر به گفتار است؟

این سیستم از یک کاشت عصبی برای ثبت فعالیت الکتریکی قشر حرکتی استفاده میکند و الگوریتمهای یادگیری ماشین الگوهای عصبی مرتبط با فونمها را شناسایی و به کلمات و جملات تبدیل میکنند؛ بهطوری که گفتار درونی به متن یا گفتار صوتی تبدیل میشود.

نتایج بالینی چه میزان امیدوارکننده بودند و محدودیتهای اصلی چیست؟

در یک آزمایش کوچک با چهار شرکتکننده، اوج دقت تا ۷۴ درصد گزارش شد که نشاندهنده پتانسیل قابلتوجه است، اما اندازه نمونه کوچک، نیاز به کاشتهای تهاجمی، و دقت کمتر از روانی مکالمهای از محدودیتهای کلیدی هستند.

چه نگرانیهای حریم خصوصی وجود دارد و چه راهکارهایی پیشنهاد شده است؟

زیرا دستگاه میتواند گفتار درونی را ضبط کند، نگرانیهایی درباره ثبت افکار خصوصی مطرح است. پیشنهادها شامل سیگنالهای ذهنی آغاز/پایان، عبارات احراز هویت، و کنترلهای محلی روی دستگاه برای جلوگیری از ثبت مداوم است.

آیا این فناوری میتواند بهزودی برای بیماران قابل استفاده شود؟

با اینکه نتایج اولیه امیدوارکنندهاند، قبل از کاربرد بالینی گسترده به آزمونهای بزرگتر، بهبود فناوری کاشت، شخصیسازی سریعتر مدلها و حفاظتهای قوی حریم خصوصی نیاز است.

رمزگشایی گفتار درونی: تبدیل اندیشه به گفتار با رابط مغز-کامپیوتر

5 دقیقه

تبدیل اندیشه به گفتار

محققان در چندین مؤسسه در ایالات متحده یک رمزگشا (decoder) گفتار درونی — یک رابط مغز-کامپیوتر (BCI) — توسعه داده‌اند که کلمات تصورشده را به متن یا گفتار قابل شنیدن تبدیل می‌کند. در یک آزمایش بالینی کوچک با چهار داوطلب دارای فلج شدید، این سامانه در تبدیل گفتار درونی به خروجی صوتی به دقت اوج ۷۴ درصد دست یافت. داده‌های منتشرشده (Kunz et al., Cell, 2025) و تفسیر عصب‌شناسان دانشگاه استنفورد نشان می‌دهد این رویکرد رابط‌های مغز-کامپیوتر را از رمزگشایی سیگنال‌های مرتبط با تلاش برای صحبت کردن به سمت رمزگشایی مستقیم اندیشه‌ها نزدیک‌تر می‌کند.

پیش‌زمینه علمی و فناوری

این رمزگشا از یک کاشت عصبی برای ثبت فعالیت الکتریکی قشر حرکتی استفاده می‌کند؛ ناحیه‌ای از مغز که در برنامه‌ریزی و اجرای حرکات نقش دارد — از جمله حرکات لازم برای صحبت کردن. به‌جای انتظار برای رسیدن فرمان‌های حرکتی به عضلات، این کاشت الگوهای عصبی مرتبط با فونم‌ها، واحدهای صوتی پایه زبان، را تشخیص می‌دهد. سپس مدل‌های یادگیری ماشین آموزش داده می‌شوند تا آن الگوها را به فونم‌ها نگاشت کنند و آنها را به کلمات و جملات مونتاژ کنند.

این جابه‌جایی از رابط‌های مغز-کامپیوتر مبتنی بر تلاش برای گفتار به سمت رمزگشایی گفتار درونی یک محدودیت کلیدی را برای افراد مبتلا به سندرم قفل‌شدگی یا ناتوانی حرکتی شدید رفع می‌کند: ممکن است این افراد نتوانند تلاش‌های عضلانی برای صحبت کردن تولید کنند، اما هنوز می‌توانند نمایش‌های ذهنی کلمات را ایجاد کنند. همان‌طور که عصب‌شناس استنفورد، Benyamin Meschede-Krasa، اشاره می‌کند: «اگر فقط لازم باشد به گفتار فکر کنید به جای اینکه واقعاً تلاش کنید صحبت کنید، این کار برای افراد بالقوه آسان‌تر و سریع‌تر است.»

جزئیات آزمایش و نتایج کلیدی

در مطالعه گزارش‌شده، چهار شرکت‌کننده با فلج عمیق تصور کردند که کلمات و عبارات مشخصی را بیان می‌کنند، در حالی که الکترودهای کاشته‌شده فعالیت قشر حرکتی را نمونه‌برداری می‌کردند. الگوریتم‌های یادگیری ماشین روابط آماری بین الگوهای عصبی و واحدهای گفتاری را شناسایی کردند. محققان فعالیت هم‌پوشان اما قابل‌تفکیک بین تلاش برای صحبت و گفتار صرفاً درونی را یافتند؛ سیگنال‌های گفتار درونی به‌نظر می‌رسید «نسخه کوچکتری» از الگوهای تلاش برای گفتار باشند، مطابق با توضیح عصب‌شناس استنفورد Frank Willett.

با استفاده از مدل‌های زبانی احتمالاتی برای وزن‌دهی به اینکه کدام فونم‌ها و کلمات معمولاً با هم رخ می‌دهند، سامانه پتانسیل شناسایی واژگانی تا ۱۲۵٬۰۰۰ کلمه را تنها از گفتار درونی نشان داد. عملکرد اوج رمزگشایی در برخی شرایط به ۷۴ درصد رسید، هرچند دقت میانگین در سراسر آزمایش‌ها اغلب کمتر بود. مطالعه همچنین یک اقدام حفاظتی برای حریم خصوصی را آزمایش کرد: کاربران به‌صورت ذهنی یک «رمزعبور» خاص را فراخوانی کردند تا رمزگشایی را فعال یا غیرفعال کنند که در تکلیف آزمایشی ۹۸ درصد قابلیت اطمینان به‌دست آمد.

محدودیت‌ها، حریم خصوصی و چشم‌انداز بالینی

چالش‌های مهمی همچنان باقی است. اندازه نمونه کوچک بود (چهار داوطلب) و عملکرد بین شرکت‌کنندگان و کیفیت ضبط متغیر بود. دقت هنوز فاصله زیادی با روانی مکالمه‌ای در زمان واقعی دارد و فناوری در حال حاضر نیازمند کاشت‌های تهاجمی و تنظیمات شخصی‌شده مدل‌های یادگیری ماشین است. همچنین نگرانی‌های اخلاقی و حریم خصوصی مطرح است: دستگاهی که گفتار درونی را رمزگشایی می‌کند ممکن است به‌طور ناخواسته افکار خصوصی را ضبط کند. راهکارهای پیشنهادی شامل سیگنال‌های ذهنی صریح برای شروع/توقف، عبارات احراز هویت و کنترل‌های مبتنی بر دستگاه برای جلوگیری از ثبت مداوم است.

محققان خوش‌بین‌اند که پیشرفت در آرایه‌های حسگر، نقشه‌برداری وسیع‌تر قشری و الگوریتم‌های رمزگشایی بهبودیافته می‌تواند دقت را افزایش دهد و مدل‌ها را سریع‌تر از توسعه‌های قبلی BCI شخصی‌سازی کند. مطالعات مرتبط در اوایل سال نیز رمزگشایی فکر به‌صورت زمان واقعی و ویژه هر فرد را نشان داده‌اند که پیشرفت شتابان در رمزگشایی عصبی و رابط‌های گفتار-BCI را تأکید می‌کند.

دیدگاه کارشناسان

دکتر Aisha Patel، مهندس عصبی و پژوهشگر بالینی در حوزه BCI، اظهار می‌دارد: «این کار نمایانگر یک اثبات مفهوم مهم است. ترکیب ثبت‌های عصبی با وضوح بالا و یادگیری ماشین آگاه به زبان امیدوارکننده است. اما برای گذر از نمایش‌های آزمایشگاهی به استفاده بالینی روزمره، به آزمون‌های بزرگ‌تر، حفاظت‌های محکم برای حریم خصوصی و رابط‌هایی نیاز داریم که بتوانند به‌سرعت به ویژگی عصبی منحصربه‌فرد هر کاربر یاد بگیرند و سازگار شوند.»

نتیجه‌گیری

رمزگشای جدید گفتار درونی گامی مهم به‌سوی رابط‌های مغز-کامپیوتر است که می‌توانند ارتباط طبیعی را برای افراد با ناتوانی شدید در گفتار و حرکت بازگردانند. هرچند سطوح اوج عملکرد در آزمایش‌های اولیه امیدوارکننده است، اعتبارسنجی گسترده‌تر، فناوری کاشت بهبود‌یافته و حفاظت‌های قوی حریم خصوصی پیش از آنکه سیستم‌های تبدیل فکر به گفتار به ابزارهای بالینی امن و قابل‌اطمینان تبدیل شوند، ضروری هستند. کار میان‌رشته‌ای مداوم در علوم اعصاب، یادگیری ماشین و اخلاق تعیین خواهد کرد که این قابلیت با چه سرعت و مسئولیتی به بیماران برسد.

منبع: sciencealert

رمزگشایی گفتار درونی: تبدیل اندیشه به گفتار با رابط مغز-کامپیوتر

تبدیل اندیشه به گفتار

پیش‌زمینه علمی و فناوری

جزئیات آزمایش و نتایج کلیدی

محدودیت‌ها، حریم خصوصی و چشم‌انداز بالینی

دیدگاه کارشناسان

نتیجه‌گیری

ارسال نظر

نظرات

مطالب مرتبط

آزمایش بال مهاربندی شده بوئینگ و ناسا برای جت های آینده

روغن ماهی و آسیب مغزی؛ تفاوت ای پی ای و دی اچ ای

حبس نور فروسرخ در لایه ای اتمی و فوق نازک

نقش نان و کربوهیدرات ها در افزایش وزن چیست؟

بهبودی احتمالی بیمار اسلو از HIV پس از پیوند سلول های بنیادی

کشف شگفت انگیز: مایعات ساده هم می توانند بشکنند

ویتامین D؛ فواید، خطرات و دوز ایمن مصرف

گرمای کشنده را نمی بینید، اما ممکن است نزدیک باشد

رویاهای شفاف چگونه کیفیت خواب عمیق را تغییر می دهند

سیاره ممنوعه ای که قوانین تولد سیارات را به چالش کشید

فاندایو: داروی خوراکی GLP‑1 جدید الای لی برای کاهش وزن

دستکش آزمایشگاهی؛ منبع خطای اندازه گیری میکروپلاستیک