میهمانان صوتی هوش مصنوعی در YouTube Music: تجربه ای جدید

نظرات
میهمانان صوتی هوش مصنوعی در YouTube Music: تجربه ای جدید

8 دقیقه

YouTube Music در حال آزمایش ویژگی جدیدی با عنوان «میزبان‌های موسیقی مبتنی بر هوش مصنوعی» است — قابلیتی که به‌طور خلاصه بین قطعات موسیقی، نظرات کوتاه، اطلاعات جذاب و زمینه‌‌سازهای شخصیتیِ شبیه انسان اضافه می‌کند. این آزمایش از طریق درگاهی تازه معرفی‌شده با نام YouTube Labs پیاده‌سازی شده و هدف آن بهبود تجربه شنیداری غیرمتمرکز و افزودن مداخلات ملایم و انسانی‌نما به پخش پس‌زمینه است.

درون YouTube Labs: چه مواردی در این آزمایش گنجانده شده است

YouTube Labs به‌عنوان فضایی توصیف شده که «برای بررسی پتانسیل هوش مصنوعی در یوتیوب اختصاص یافته است.» نخستین آزمایش آشکار تحت این مجموعه، میزبان‌های موسیقی هوش مصنوعی نام دارد و فعلاً فقط برای گروه محدودی از کاربران در ایالات متحده دردسترس است. گرچه یوتیوب اطلاعات بسیار جامعی منتشر نکرده، به‌نظر می‌رسد این قابلیت بخشی از تلاش کلی شرکت برای افزودن تجربیات مبتنی بر هوش مصنوعی در سرویس‌های مختلفش باشد.

هدف این صفحه آزمایشی، بررسی ایده‌های جدید و بازخوردگیری از نمونه‌های کاربردی است؛ از تست گزینه‌های صوتی بهینه‌شده گرفته تا تنظیمات پخش و تعامل‌های مبتنی بر صدا. بنابراین میزبان‌های موسیقی هوش مصنوعی احتمالاً صرفاً یک مورد مستقل نیستند و می‌توانند بخشی از مجموعه‌ای گسترده‌تر از نوآوری‌های صوتی مبتنی بر هوش مصنوعی باشند که در آینده توسعه می‌یابند.

این آزمایش از همان صفحهٔ تجربی‌ای ظاهر می‌شود که کاربران پریمیوم قبلاً از آن استفاده کرده‌اند: www.youtube.com/new. اکنون این آدرس به عنوان نقطهٔ ورود YouTube Labs عمل می‌کند و نشان می‌دهد شرکت در حال بازبرندسازی محیط آزمایشی با تمرکز بیشتری بر هوش مصنوعی است. به‌طور تاریخی، صفحه‌های آزمایشی مشابه شامل گزینه‌هایی مثل بهبود کیفیت صدا، تنظیمات تجربه کاربری و تغییرات تدریجی در پخش بوده‌اند؛ و گاهی اوقات ویژگی‌هایی که در این صفحات تست می‌شوند، پس از اصلاح و دریافت بازخورد، برای دامنهٔ وسیع‌تری از کاربران منتشر می‌شوند.

رفتار میزبان‌های موسیقی هوش مصنوعی در اپلیکیشن

آن‌طور که آزمایش‌کنندگان اولیه از جمله اعضای تیم 9to5Google گزارش داده‌اند، میزبان‌های موسیقی هوش مصنوعی یک دکمهٔ کوچک را به صفحهٔ Now Playing اضافه می‌کنند. این دکمه در سمت راست آیکون‌های پسندیدن و نپسندیدن قرار گرفته و به شنونده اجازه می‌دهد مداخلات AI را روشن یا خاموش کند. وقتی فعال باشد، میزبان بین ترک‌ها روایت‌های کوتاه می‌گذارد — روایت‌هایی که ممکن است شامل حکایت‌های کوتاه دربارهٔ هنرمند، حقایق جالب برای طرفداران یا جمله‌های گفتگومحور و غیرمزاحم باشد که هدف‌شان عمق‌بخشی به تجربهٔ شنیداری است، نه قطع مداوم موسیقی.

جایگاه و فرکانس این مداخلات طوری طراحی شده که تجربهٔ پس‌زمینه را مختل نکند؛ اغلب به‌صورت قطعات صوتی کوتاه و موجز. مثال‌هایی از محتوای ممکن عبارت‌اند از: یادداشت‌های تاریخی در مورد ضبط یک قطعه، اشاره به همکاری‌های شناخته‌شده بین هنرمندان، یا توضیحی مختصر دربارهٔ سبک و تأثیرات موسیقی که در حال پخش است. چنین اطلاعاتی می‌تواند هم برای شنوندهٔ عادی مفید باشد و هم به کسانی که به کشف موسیقی علاقه‌مندند کمک کند تا درک بهتری از بافت هنری یک قطعه به‌دست آورند.

از مشاهدات به‌نظر می‌رسد میزبان‌ها جایگزین لیست‌های پخش یا میکس‌ها نمی‌شوند. در عوض، آنها لایه‌ای از صوتِ زمینه‌ای یا «commentary» را روی تجربهٔ موجود YouTube Music اضافه می‌کنند. این لایه می‌تواند داستان کوتاهی دربارهٔ پیشینهٔ یک قطعه، یک اطلاعات جالب و کم‌شنیده‌شده دربارهٔ یک موسیقی‌دان، یا شوخی و گفتگوی سبکِ پیونددهندهٔ بین قطعات باشد — مشابه نقش یک مجری رادیویی، اما به‌صورت خودکار و بر پایهٔ الگوریتم.

این رویکرد لایه‌ای جایگاهی مناسب برای افزوده شدن امکانات تکمیلی دارد؛ برای مثال امکان شخصی‌سازی لحن میزبان (صمیمی، حرفه‌ای، طنزآمیز)، تنظیم میزان مداخلات (نِیماری یا مفصل)، یا انتخاب قالب‌های موضوعی مثل «حقایق پشت صحنه»، «قصه‌های طرفداران» یا «تحلیل‌های کوتاه موسیقی‌شناختی» که هرکدام می‌توانند تجربهٔ شنیداری را بر اساس سلیقهٔ کاربر تغییر دهند.

مقایسه با AI DJ اسپاتیفای

این ویژگی جدید اغلب با AI DJ اسپاتیفای مقایسه می‌شود و شباهت‌های قابل توجهی بین آن‌ها وجود دارد: هر دو تلاش می‌کنند شنیدن موسیقی را به‌سمت تجربه‌ای هدایت‌شده‌تر و دارای شخصیت سوق دهند. AI DJ اسپاتیفای، که برای مشترکان پریمیوم در دسترس است، از معرفی‌های گفتگومحور و انتقال‌های با لحن مشخص برای معرفی قطعات و توضیح انتخاب‌ها استفاده می‌کند. نسخهٔ یوتیوب بیشتر بر مداخلات کوتاه و زمینه‌ای بین آهنگ‌ها تأکید دارد تا ارائهٔ توضیحات طولانی یا برنامه‌ریزی‌شده.

یکی از تفاوت‌های عملی این است که اسپاتیفای AI DJ معمولاً به‌عنوان راوی مرکزی جلسه‌ای کامل عمل می‌کند و ممکن است معرفی هر قطعه با یک بخش گفتگومحور مفصل همراه باشد. در مقابل، رویکرد یوتیوب به‌شدت فشرده و خلاصه است تا کاربرانی که از سرویس برای شنیدن پس‌زمینه یا تمرکز استفاده می‌کنند، متوجه کاهش کیفیت تجربهٔ موسیقایی‌شان نشوند. انتخاب بین این دو سبک در نهایت به ترجیح کاربر و نحوهٔ استفادهٔ او از پخش موسیقی بستگی دارد.

قابل ذکر است که پست یوتیوب شامل برچسب YouTube Premium بود، پس احتمال دارد آزمایش اولیه مختص مشترکین پرداختی باشد. در گذشته، آزمایش‌های صفحهٔ تجربی اغلب قبل از انتشار گسترده محدود به منطقه‌ها یا دستگاه‌های خاص بوده‌اند؛ بنابراین در صورت ارزیابی مثبت و دریافت بازخورد مناسب، امکان گسترش تدریجی این ویژگی وجود دارد.

چه جهتی ممکن است این قابلیت در آینده بگیرد

فراتر از روایت‌های ساده، YouTube می‌تواند آزمایش‌های YouTube Labs را توسعه دهد تا شامل ویژگی‌های تعاملی صوتی، هوش مصنوعی اجراشده روی دستگاه (on-device AI)، یا میزبان‌های فرهنگی-موضوعی مرتبط با ژانرهای مشخص شود. برای مثال، میزبان‌هایی با محوریت «راک کلاسیک»، «پاپ معاصر» یا «موسیقی محلی» می‌توانند با زبان و ارجاعات خاص خود به شنونده نزدیک‌تر شوند و کشف آگاهانه‌تری را تسهیل کنند.

علاوه بر این، دستگاه‌ها و اسپیکرهای ثالث نیز شروع به پشتیبانی از سبک‌های DJ-مانند مبتنی بر هوش مصنوعی کرده‌اند، بنابراین ممکن است یوتیوب به سمت ادغام‌هایی پیش برود که اجازهٔ درخواست‌های گفتگویی، کنترل‌های صوتی پیشرفته یا ابزارهای عمیق‌تر کشف موسیقی را فراهم کند. چنین یکپارچگی‌هایی می‌تواند تجربه را از اپلیکیشن به اکوسیستم‌های خانگی منتقل کند و قابلیت‌هایی مانند پرسش از میزبان دربارهٔ یک قطعه، دریافت لیست منابع یا درخواست پیشنهادهای مشابه را ممکن سازد.

چند مسیر توسعهٔ محتمل که منطقی به‌نظر می‌رسند عبارت‌اند از:

  • ادغام میزبان‌های مبتنی بر شخصیت‌های واقعی یا شناخته‌شدهٔ موسیقی، که از شهرت هنرمندان برای جذب کاربر استفاده می‌کنند.
  • اجرا یا مدل‌سازی صدای میزبان‌ها به‌صورت محلی روی دستگاه برای حفظ حریم خصوصی و کاهش تأخیر.
  • تخصیص گزینه‌های دقیق‌تر برای تنظیم میزان «مداخلات» و انتخاب نوع محتوای متنی — از جمله گزینه‌هایی برای غیرفعال کردن کلیِ روایت یا تنها فعال‌سازی برای ژانرهای خاص.
  • امکانات سازگاری زبانی و منطقه‌ای تا میزبان‌ها بتوانند به‌زبان‌های مختلف یا با ارجاعات بومی صحبت کنند و تجربهٔ محلی‌سازی شده‌ای ارائه دهند.

با وجود این امکانات جذاب، چالش‌هایی هم وجود دارد. برای نمونه، حفظ تعادل بین فراهم کردن اطلاعات و جلوگیری از اشباع شنونده مهم است؛ همچنین ملاحظات حقوقی و حقوق نشر دربارهٔ استفاده از صداها، محتوای هنری و اطلاعات مربوط به هنرمندان باید بررسی شود. مسئلهٔ دیگری که باید در نظر گرفته شود، کنترل کیفیت محتوا و جلوگیری از انتشار اطلاعات نادرست یا گمراه‌کننده از طریق روایت‌های خودکار است که نیازمند فیلترها و رویه‌های بازبینی خواهد بود.

نتیجه‌گیری

میزبان‌های موسیقی مبتنی بر هوش مصنوعی در YouTube Music گامی منطقی و قابل‌پیش‌بینی در مسیر تحول سرویس‌های پخش موسیقی هستند: استفاده از هوش مصنوعی برای افزودن شخصیت، بستر و زمینه به جلسات شنیداری. اگرچه این قابلیت در حال حاضر در مرحلهٔ آزمایشی و محدود است، اما نشان‌دهندهٔ آینده‌ای است که در آن گزینش الگوریتمی همراه با روایت‌های کوتاه و انسانی‌نما می‌تواند داستان‌سرایی موسیقایی را پربارتر کند و شنیدن پس‌زمینه را جذاب‌تر سازد.

در نهایت، موفقیت چنین ویژگی‌ای بستگی به دریافت بازخورد از کاربران، تنظیمات ظریف تجربهٔ صوتی، و توانایی شرکت در مدیریت جنبه‌های حقوقی و کیفیت محتوا دارد. اگر این موارد بدرستی مدیریت شوند، ترکیب هوشمندی الگوریتم‌ها با وِهِم و لحنِ روایت می‌تواند تجربهٔ کشف موسیقی را به سطحی تازه و انسانی‌تر ارتقاء دهد.

منبع: techradar

ارسال نظر

نظرات

مطالب مرتبط