7 دقیقه
هوش مصنوعی نفوذپذیری را کمّی میکند تا معنای واریانتهای نادر DNA برای سلامت روشن شود
وقتی یک آزمایش ژنتیکی بالینی تغییر نادری در DNA گزارش میکند، پزشکان و بیمارها اغلب با عدم قطعیت روبهرو میشوند: آیا آن واریانت واقعاً بیماریزا خواهد بود؟ پژوهشگران دانشکده پزشکی آیکان در Mount Sinai ابزاری مبتنی بر یادگیری ماشین توسعه دادهاند که از نتایج معمول آزمایشگاهی و بیش از یک میلیون پرونده سلامت الکترونیک (EHR) برای قرار دادن ریسک ژنتیکی در مقیاسی پیوسته استفاده میکند. این روش که بهصورت آنلاین در Science (28 آگوست 2025) منتشر شد و توسط Mount Sinai در 30 آگوست 2025 گزارش شد، امتیاز «نفوذپذیری ML» را از 0 تا 1 تولید میکند که نشاندهنده احتمال بروز یک بیماری مرتبط در فردی با واریانت مشخص است.
این سیستم اندازهگیریهای بالینی معمول—کلسترول، شمارش سلولهای خون، شاخصهای عملکرد کلیه و غیره—را با دادههای تشخیصی تلفیق میکند تا ده بیماری شناختهشده را مدلسازی نماید. بهجای برچسب دودویی مبتلا/سالم، هوش مصنوعی شدت بیماری و ریسک را بهصورت نتایج تدریجی تخمین میزند که بهتر با نحوه بروز بیماریهایی مانند فشارخون، دیابت و بسیاری از سرطانها در مراقبتهای واقعی سازگار است.
پیشزمینه علمی و اهمیت نفوذپذیری
در ژنتیک، نفوذپذیری (penetrance) به نسبت افرادی اشاره دارد که یک واریانت خاص را حمل میکنند و واقعاً علائم بیماری مرتبط را نشان میدهند. دستهبندیهای سنتی واریانتها اغلب بر پایه گزارشهای موردی، مطالعات خانوادگی یا گروههای کوچک انجام میشود و دستههای مجزایی مانند «پاتوژنتیک»، «خنثی» یا «واریانت با اهمیت نامعلوم» (VUS) تولید میکند. این برچسبها میتوانند گمراهکننده باشند: بعضی واریانتهای «پاتوژنتیک» در جمعیتهای وسیع تأثیر محدودی نشان میدهند و بسیاری از VUSها همچنان نامشخص باقی میمانند.
یادگیری ماشین میتواند از سیگنالهای بالینی پیوستهای که پیشتر در پروندههای سلامت موجوداند برای تخمین مستقیمتر نفوذپذیری استفاده کند. با آموزش مدلها برای پیشبینی نتایج کمی و تشخیصی از روندهای آزمایشگاهی و رویدادهای کدگذاریشده در EHR، تیم Mount Sinai دادههای بالینی متنوع را به یک معیار احتمالاتی ریسک برای بیش از ۱,۶۰۰ واریانت نادر تبدیل کرد. امتیازی نزدیک به 1 نشاندهنده نفوذپذیری تخمینی بالای ML است؛ امتیازی نزدیک به 0 نشاندهنده تأثیر حداقلی در سطح جمعیت است.

روشها، مجموعهداده و طراحی مدل
پژوهشگران از بیش از یک میلیون پرونده سلامت الکترونیک بدون اطلاعات هویتی که در Mount Sinai تجمیع شده بود، برای ساخت مدلهای اختصاصی بیماری برای ده حالت شایع استفاده کردند. ویژگیهای ورودی شامل مقادیر آزمایشگاهی طولی (پانلهای چربی، کراتینین، شمارش کامل خون)، علائم حیاتی و کدهای تشخیصی بود. مدلها برای نمایش بیماری بهصورت یک طیف آموزش داده شدند—درست کردن ریزتغییرات در نشانگرهای بیماری و شدت بالینی بهجای یک برچسب تشخیصی واحد.
پس از آموزش، تیم این مدلهای بیماریمحور را روی کوهورتهایی از افرادی که مشخصاً حامل واریانتهای کدینگ نادر بودند، اعمال کرد. برای هر واریانت، سیستم امتیاز «نفوذپذیری ML» را بر پایه تطابق دادههای بالینی روزمره حاملها با الگوهای مرتبط با آن بیماری محاسبه کرد. محققان بیش از ۱,۶۰۰ واریانت را ارزیابی و سازگاری آنها را با حاشیهنویسیهای بالینی موجود بررسی کردند.
اعتبارسنجی و یافتههای شگفتآور
نتایج بازطبقهبندیهای قابلتوجهی را نشان داد: برخی واریانتهایی که بهعنوان «نامشخص» برچسب خورده بودند، در مدلهای مبتنی بر EHR سیگنالهای روشنی از افزایش ریسک نشان دادند، در حالی که برخی واریانتهایی که پیشتر بیماریزا تلقی میشدند، نفوذپذیری ML بسیار ناچیزی داشتند. این تفاوتهای دنیای واقعی نشان میدهد چگونه دادههای بالینی در مقیاس جمعیت میتوانند تفسیرهای قبلی واریانت را که از مجموعههای کوچکتر یا انتخابشده حاصل شدهاند، تصحیح یا به چالش بکشند.
Ron Do، PhD، نویسنده ارشد مطالعه و استاد Charles Bronfman در پزشکی شخصیسازیشده در Mount Sinai، نیت تیم را چنین خلاصه کرد: "با استفاده از هوش مصنوعی و دادههای آزمایشگاهی واقعی که پیشتر در اغلب پروندههای پزشکی موجوداند، میتوانیم بهتر تخمین بزنیم که در یک فرد حامل یک واریانت ژنتیکی مشخص چقدر احتمال بروز بیماری وجود دارد. این روش خیلی ظریفتر، مقیاسپذیرتر و قابلدسترستر است برای پشتیبانی از پزشکی فردمحور." نویسنده اول، Iain S. Forrest، MD, PhD، افزود که امتیازها میتوانند در تقسیمبندی اولویتهای مراقبتی کمک کنند: یک امتیاز بالای نفوذپذیری ML برای یک واریانت مرتبط با سندرم لینچ ممکن است به غربالگری زودهنگامتر سرطان منجر شود، در حالی که امتیاز پایین میتواند از مداخلات غیرضروری بکاهد.
پیامدهای بالینی، محدودیتها و مسیرهای آینده
کاربردهای بالینی بالقوه شامل اولویتبندی واریانتها برای پیگیری، راهنمایی استراتژیهای پایش و بهبود مشاوره ژنتیک از طریق انتقال ریسک بهصورت یک امتیاز احتمالاتی بهجای یک برچسب منفصل است. با این حال، نویسندگان و کارشناسان مستقل هشدار میدهند که نفوذپذیری ML یک ابزار مکمل است و جایگزین ارزیابی بالینی دقیق، تاریخچه خانوادگی و مطالعات عملکردی نیست.
محدودیتهای کلیدی: مدل فعلی منعکسکننده جمعیتشناسی و الگوهای مراقبتی جمعیت EHR منبع است؛ جمعیتهای با پیشینههای نادیدهگرفتهشده و زمینههای خاص واریانتهای نادر نیازمند دادههای چندمرکزی و متنوعتر برای عملکرد عادلانه خواهند بود. اعتبارسنجی آیندهنگر نیز ضروری است—آیا افراد با نفوذپذیری ML بالا واقعاً در طول زمان با نرخهای مورد انتظار بیماری را توسعه میدهند و آیا مداخلات زودهنگام میتوانند آن مسیر را تغییر دهند؟
تیم Mount Sinai در حال گسترش چارچوب به بیماریهای بیشتر، انواع واریانتهای اضافی و کوهورتهای متنوعتر است، در حالی که برنامهریزی ردیابی طولی برای اندازهگیری دقت پیشبینی و منفعت بالینی در محیطهای واقعی را نیز در دستور کار دارد.
دیدگاه کارشناسی
دکتر النا مارکز، ژنتیکپزشک بالینی (نمونه فرضی) با تجربه در پزشکی دقیق، اظهار میکند: "این رویکرد نشاندهنده یک پیشرفت عملی در تفسیر واریانتها است. بسیاری از آزمایشگاهها در مدیریت VUS مشکل دارند؛ استفاده از سیگنالهای استخراجشده از EHR به ما زمینهای در سطح جمعیت میدهد که میتواند گفتگو با بیماران را آگاه کند. با این حال، یکپارچهسازی در جریانهای کاری بالینی نیازمند استانداردهای روشن، اعتبارسنجی آیندهنگر و ارتباط دقیق است تا ارائهدهندگان و خانوادهها یک امتیاز منفرد را بیش از حد تفسیر نکنند."
فناوریهای مرتبط و چشمانداز گستردهتر
مفهوم نفوذپذیری ML در تقاطع چند روند قرار دارد: تحلیلهای فدرِیتد EHR، هوش مصنوعی توضیحپذیر برای مراقبت سلامت و نگاشت گسترده ژنوتیپ-فنوتیپ. هنگامی که با آزمایشهای عملکردی، مطالعات جداسازی خانوادگی و توالییابی جمعیتهای جهانی ترکیب شود، امتیازهای نفوذپذیری مبتنی بر EHR میتوانند روند بازطبقهبندی واریانتها را تسریع کنند، عدم قطعیت در گزارشهای ژنتیکی را کاهش دهند و از استراتژیهای پیشگیری هدفمند پشتیبانی نمایند.
چالشهای اخلاقی و عملی باقی میمانند—حریم خصوصی دادهها، تبعیض الگوریتمی و نیاز به گزارش شفاف امتیازها از جمله ملاحظات ضروری پیش از استقرار روتین بالینی هستند.
نتیجهگیری
مدل نفوذپذیری مبتنی بر یادگیری ماشین Mount Sinai نشان میدهد چگونه دادههای بالینی روزمره میتوانند درک ما را از اینکه کدام واریانتهای نادر واقعاً روی ریسک بیماری تأثیر میگذارند، تیزتر کنند. با تبدیل میلیونها مقدار آزمایشگاهی و رویدادهای EHR به امتیازهای احتماتی، این ابزار تفسیر واریانت را از برچسبهای قالبی به طیفی کمّی منتقل میکند. با اعتبارسنجی بیشتر، گسترش به جمعیتهای متنوع و ادغام دقیق بالینی، امتیازهای نفوذپذیری مشتقشده از ML میتوانند منبعی عملی برای مشاوره ژنتیک، دستهبندی ریسک و پیشگیریِ هدفمند شوند.
منبع: sciencedaily
.avif)
نظرات