5 دقیقه
یک مطالعه پیشگامانه از سوی Microsoft AI for Good واقعیتی مهم را درباره توانایی ما در تشخیص تفاوت میان تصاویر واقعی و تصاویر ساختهشده با هوش مصنوعی آشکار کرده است. نتایج این پژوهش که با مشارکت بیش از ۱۲,۵۰۰ نفر از سراسر جهان و ارزیابی ۲۸۷,۰۰۰ تصویر به دست آمده، نشان میدهد دقت کلی شرکتکنندگان تنها ۶۲ درصد بوده است؛ این رقم کمی بالاتر از شانس تصادفی است و ضعف قابل توجه انسانها در شناسایی تصاویر دستکاری شده با هوش مصنوعی را تأیید میکند.
متغیرهای مؤثر در موفقیت تشخیص تصویر
مطالعه مایکروسافت نشان میدهد که انسانها در شناسایی تصاویر پرتره جعلی نسبت به مناظر طبیعی یا شهری عملکرد بهتری دارند. این موضوع ناشی از توانایی ذاتی ما در تشخیص ویژگیهای چهره و جزئیات انسانی است. اما وقتی صحبت از صحنههای تولید شده توسط هوش مصنوعی مانند منظرهها یا تصاویر شهری میشود، دقت تشخیص به ۵۹ تا ۶۱ درصد کاهش مییابد. کیفیت نزدیک به واقعیت این تصاویر بهویژه در نمونههایی که فاقد نشانههای آشکار دستکاری دیجیتال هستند، شناسایی آنها را برای کاربر عادی دشوارتر میکند.
افزایش چالش تولید محتوای واقعگرایانه با هوش مصنوعی
در این مطالعه، از یک بازی تستی استفاده شد تا تجربه روبرو شدن کاربران با تصاویر در فضای دیجیتال شبیهسازی شود. تصاویر انتخابی ترکیبی تصادفی و از لحاظ بصری واقعگرایانه بودند و تنها نمونههای به شدت فریبنده حذف شدند. این موضوع بیانگر این است که با پیشرفت تکنولوژی تولید تصویر با هوش مصنوعی مانند Midjourney و DALL-E 3، تفاوت میان عکسهای واقعی و تصاویر ساخته شده توسط هوش مصنوعی برای بیشتر کاربران احتمالا به کلی از بین خواهد رفت.
نقش ابزارهای تشخیص تصویر هوش مصنوعی
در ادامه، محققان مایکروسافت عملکرد تشخیص انسان را با نرمافزار اختصاصی شناسایی تصاویر جعلی خود مقایسه کردند و نتایج قابل توجه بود؛ ابزار مبتنی بر یادگیری ماشین مایکروسافت موفق شد به دقتی بالاتر از ۹۵ درصد در شناسایی تصاویر واقعی و مصنوعی در دستهبندیهای مختلف دست یابد. این یافتهها نشان میدهند که ابزارهای هوشمند نه تنها از انسانها پیشی میگیرند، بلکه نقش اساسی در تأیید محتوای دیجیتال در آینده خواهند داشت.
محدودیتهای واترمارک و تدابیر شفافیت
با این حال، افزایش تصاویر تولید شده با هوش مصنوعی بدون ریسک نیست. مایکروسافت معتقد است ابزارهایی مانند واترمارک دیجیتال و روشهای پیشرفته تشخیص تصویر برای شفافیت ضروری هستند. اما این مطالعه اشاره میکند که ویرایش ساده یک تصویر میتواند این لایههای امنیتی را دور بزند؛ افراد خرابکار میتوانند فقط با برش یا محو کردن واترمارک، این ابزارها را بیاثر کنند و مانع مقابله کامل با انتشار اطلاعات نادرست و جعل شوند.
شناخت ظرافتها: GANها، اینپینتینگ و اصالت
مطالعه همچنین نشان داده است که تکنیکهای قدیمیتر تولید تصویر با هوش مصنوعی مانند شبکههای تخاصمی مولد (GAN) و اینپینتینگ میتوانند بسیار گمراهکننده باشند. این روشها با تولید تصاویری مشابه عکسهای آماتوری، کمتر توسط افراد عادی به عنوان تصویر جعلی شناسایی میشوند؛ در حالی که خروجی مدلهای پیشرفتهتر اغلب خیلی «کامل» به نظر میرسند. به ویژه، اینپینتینگ که بخش کوچکی از یک عکس واقعی را با محتوای ساختهشده جایگزین میکند، نشان میدهد که تشخیص چنین تغییراتی تا چه اندازه دشوار است و چگونه میتواند به تقویت کمپینهای اطلاعات غلط کمک کند.
اهمیت بازار و آینده تأیید محتوا
نتایج این تحقیق پیامدهای گستردهای برای صنعت فناوری، رسانهها و کاربران عادی دارد. با واقعیتر شدن تصاویر تولید شده توسط هوش مصنوعی، خطر فریب، انتشار اخبار کذب و روایتهای دستکاری شده به سرعت افزایش مییابد. مایکروسافت بر لزوم بهکارگیری گسترده راهکارهای قوی تشخیص تصاویر جعلی تأکید دارد، که در جهت ارتقا اعتماد دیجیتال و اصالت محتوای آنلاین برای شبکههای اجتماعی، رسانهها و نهادهای نظارتی اهمیت زیادی دارد.
کاربردها و واکنش صنعت
موارد استفاده از سیستمهای پیشرفته تشخیص تصویر هوش مصنوعی به سرعت در حال گسترش است؛ از بررسی اعتبار تصاویر شبکههای اجتماعی تا مقابله با دیپفیکها در حوزههای سیاسی، تجاری و ژورنالیستی. کمپینهای آموزشی و پژوهشی مایکروسافت نشاندهنده نیاز فوری به همکاری میان صنایع مختلف و نوآوری فناورانه برای جلوگیری از تهدیدات احتمالی ناشی از هوش مصنوعی تولیدکننده محتواست.
در جمعبندی، با پیشرفت فناوری تولید تصویر با هوش مصنوعی، اتکای جمعی ما بر راهکارهای تشخیص و تأیید پیشرفته نه تنها سودمند، بلکه برای حفاظت از سلامت فضای دیجیتال در عصر هوش مصنوعی الزامی خواهد بود.
منبع: neowin

نظرات