0
سبد خرید شما خالی است
جیب استور > وبلاگ > لب‌خوانی هوش مصنوعی یوتیوب: تحول یا ترفند پولی؟

لب‌خوانی هوش مصنوعی یوتیوب: تحول یا ترفند پولی؟

  • واحد تولید محتوا
  • 26 مهر 1404 17:29:01
  • زمان مطالعه 1 دقیقه

مقدمه :

یوتیوب در حال آزمایش قابلیت لب‌خوانی هوش مصنوعی (AI Lip-Sync) است که حرکت لب‌ها را با صدای ترجمه‌شده هماهنگ می‌کند تا دوبله ویدیوها طبیعی‌تر شود. این فناوری بخشی از استراتژی هوش مصنوعی یوتیوب است و احتمال دارد در آینده برای سازندگان محتوا هزینه‌بر باشد.

لب‌خوانی هوش مصنوعی یوتیوب: تحول یا ترفند پولی؟

آنچه در این مقاله میخوانید

یوتیوب قرار است ویژگی دوبله خودکارش را با کمک هوش مصنوعی وارد مرحله‌ی جدیدی کند؛ قابلیتی که به گفته‌ی سازندگانش، لب‌های گوینده را با زبان ترجمه‌شده هماهنگ می‌کند تا ویدیوهای دوبله‌شده، طبیعی‌تر از همیشه به نظر برسند.
اما نکته جالب (و شاید نگران‌کننده) این است که این ویژگی احتمالاً رایگان نخواهد بود.

یوتیوب چطور لب‌ها را با صدای ترجمه‌شده هماهنگ می‌کند؟

طبق گفته‌ی «بودیکا کوتاهاتچی»، مدیر پروژه‌ی Auto-dubbing یوتیوب، این فناوری با استفاده از مدل‌های پیشرفته‌ی سه‌بعدی کار می‌کند؛ یعنی ساختار لب، دندان، فرم چهره و حتی زاویه‌ی بدن را تحلیل کرده و سپس پیکسل‌های تصویر را طوری تغییر می‌دهد که با صدای ترجمه‌شده کاملاً منطبق شود.

در حال حاضر، این سیستم فقط برای وضوح 1080p بهینه‌سازی شده و هنوز برای ویدیوهای 4K آماده نیست. تیم یوتیوب در تلاش است تا در نهایت بیش از ۲۰ زبان پشتیبانی‌شده در Auto-dub را پوشش دهد.

آیا لب‌خوانی هوش مصنوعی پولی می‌شود؟

هرچند هنوز یوتیوب به‌طور رسمی چیزی اعلام نکرده، اما طبق گزارش Digital Trends، این قابلیت ممکن است در آینده هزینه‌بر باشد.
دلیلش ساده است: فرایند هم‌زمان‌سازی لب با صدای ترجمه‌شده نیاز به پردازش سنگین و منابع محاسباتی بالایی دارد، و یوتیوب در حال ارزیابی این است که آیا سازندگان محتوا باید بابت استفاده از آن هزینه‌ای پرداخت کنند یا نه.

در حال حاضر، این قابلیت فقط در اختیار گروه محدودی از سازندگان منتخب قرار گرفته است — درست مثل زمانی که ویژگی Auto-dubbing برای نخستین بار معرفی شد.

یوتیوب و گسترش قدرت هوش مصنوعی در ویدیوها

این اقدام بخشی از استراتژی گسترده‌تر یوتیوب برای استفاده از هوش مصنوعی است.
از ساخت خودکار Shorts گرفته تا پیشنهاد زمان مناسب برای درج تبلیغات و توسعه‌ی مدل تولید ویدیو VEO 3، حالا نوبت به هماهنگی چهره و زبان رسیده است.
اگر این ویژگی موفق شود، محتوای چندزبانه جهانی طبیعی‌تر و فراگیرتر خواهد شد — هرچند شاید هزینه‌ی آن بر دوش خالقان محتوا بیفتد.

در نهایت، لب‌خوانی هوش مصنوعی می‌تواند گامی بزرگ برای جهانی‌تر شدن یوتیوب باشد؛ اما این‌که چه زمانی و با چه قیمتی در دسترس عموم قرار می‌گیرد، هنوز در هاله‌ای از ابهام است.

نظر شما چیست؟
اگر قرار باشد برای این قابلیت پول بدهید، آیا ارزشش را دارد؟

تاریخ بروزرسانی : 27 مهر 1404 01:13:18
برچسب ها :
مطالب مشابه
Unwavering Duty برگشت؛ بهترین Machine Gun فصل جدید Destiny 2
آموزش

Unwavering Duty برگشت؛ بهترین Machine Gun فصل جدید Destiny 2

سلاح Unwavering Duty در Destiny 2 با بروزرسانی جدید The Edge of Fate دوباره به صدر متا برگشته است. این Machine Gun قدرتمند با پرک‌های دقیق برای PvE و PvP، تعادلی عالی بین قدرت، کنترل و سازگاری با بیلدهای Solar ایجاد کرده و انتخابی هوشمندانه برای هر Guardian است.

27 مهر 1404
راز گم‌شدن نقاشی ۷۰۰ هزار دلاری پیکاسو در اسپانیا
آموزش

راز گم‌شدن نقاشی ۷۰۰ هزار دلاری پیکاسو در اسپانیا

تابلوی پنج‌اینچی پابلو پیکاسو با عنوان Still Life with Guitar و ارزشی حدود ۷۰۰ هزار دلار، در مسیر انتقال از مادرید به گرانادا ناپدید شد. این اثر قرار بود در نمایشگاه CajaGranada به نمایش درآید، اما بدون هیچ نشانه‌ای از سرقت یا تخریب، مرموزانه گم شده است.

27 مهر 1404
دیوید اتنبرو در ۹۹ سالگی رکورد امی را شکست
آموزش

دیوید اتنبرو در ۹۹ سالگی رکورد امی را شکست

سر دیوید اتنبرو، مستندساز و طبیعت‌دوست افسانه‌ای بریتانیایی، در سن ۹۹ سالگی با مستند Secret Lives of Orangutans برنده جایزه Daytime Emmy 2024 شد و عنوان مسن‌ترین برنده تاریخ امی را از آن خود کرد. او با این موفقیت، رکورد دیک ون دایک را شکست.

27 مهر 1404
واتساپ دیگر اجازه‌ی فعالیت ChatGPT را نمی‌دهد!
آموزش

واتساپ دیگر اجازه‌ی فعالیت ChatGPT را نمی‌دهد!

واتساپ از ژانویه ۲۰۲۶ استفاده از چت‌بات‌های هوش مصنوعی عمومی را ممنوع می‌کند. این تصمیم شامل دستیارهایی مثل ChatGPT و Perplexity می‌شود و تنها کاربردهای تجاری در واتساپ باقی می‌مانند. هدف متا، کنترل بیشتر و هم‌راستایی فعالیت‌ها با مدل درآمدی API است.

27 مهر 1404
بازگشت بتمن کلاسیک؛ نگاهی عمیق به رمان Batman: Revolution
آموزش

بازگشت بتمن کلاسیک؛ نگاهی عمیق به رمان Batman: Revolution

رمان Batman: Revolution دنباله‌ای ادبی بر دنیای تاریک و گوتیک تیم برتون است که بین فیلم‌های ۱۹۸۹ و ۱۹۹۲ جریان دارد. این اثر با معرفی نسخه جدیدی از «ریدلر» به نام نورمن پینکس، مرز میان نبوغ و جنون را بازتعریف می‌کند و روح فیلم‌های کلاسیک بتمن را زنده می‌سازد.

27 مهر 1404
Pixel Watch 2 با این آپدیت مثل روز اول شد
آموزش

Pixel Watch 2 با این آپدیت مثل روز اول شد

گوگل با آپدیت Wear OS 6 جان تازه‌ای به Pixel Watch 2 داده است. طراحی جدید Material 3، بازگشت Facer برای واچ‌فیس‌های متنوع، عملکرد سریع‌تر و عمر باتری پایدار باعث شده کاربران حس کنند ساعتشان دوباره متولد شده؛ بزرگ‌ترین جهش Wear OS در سال‌های اخیر.

27 مهر 1404

نظرات کاربران

دیدگاهتان را بنویسید

+ =

راه های ارتباطی با ما

از طریق تلگرام و یا برقراری تماس می‌توانید با تیم پشتیبانی ما در ارتباط باشید.