0
سبد خرید شما خالی است
جیب استور > وبلاگ > وقتی هوش مصنوعی ویدیو را می‌بیند، می‌شنود و تحلیل می‌کند!
وقتی هوش مصنوعی ویدیو را می‌بیند، می‌شنود و تحلیل می‌کند!

وقتی هوش مصنوعی ویدیو را می‌بیند، می‌شنود و تحلیل می‌کند!

  • واحد تولید محتوا
    واحد تولید محتوا
  • تاریخ انتشار
    28 خرداد 1404 14:50:32
  • زمان مطالعه
    زمان مطالعه 1 دقیقه

مقدمه :

گوگل با به‌روزرسانی جدید جمینی ۲.۵، امکان تحلیل ویدیو را فعال کرده است. کاربران اکنون می‌توانند کلیپ‌های ویدیویی را در Gemini آپلود کرده و از آن برای خلاصه‌سازی، شناسایی مکان و زمان ضبط، و تحلیل دقیق محتوای ویدیو استفاده کنند.

آنچه در این مقاله میخوانید

شرکت گوگل (Google) در جدیدترین به‌روزرسانی، نسخه‌های پایدار جمینی ۲.۵ پرو (Gemini 2.5 Pro) و جمینی فلش (Gemini Flash) را به‌صورت عمومی منتشر کرد. همچنین مدل جدیدی به نام جمینی ۲.۵ فلش-لایت (Gemini 2.5 Flash-Lite) نیز برای کارهای پرحجم مانند طبقه‌بندی یا خلاصه‌سازی در دسترس پیش‌نمایش قرار گرفته است. اما مهم‌ترین تحول، اضافه‌شدن قابلیت آپلود و تحلیل ویدیو به این ابزار قدرتمند هوش مصنوعی است.

 

چگونه ویدیو را در جمینی آپلود و تحلیل کنیم؟

مطابق گزارش وب‌سایت 9to5Google، کاربران اندروید (Android) اکنون می‌توانند ویدیو را مستقیماً از گالری دستگاه خود به جمینی (Gemini) ارسال کنند. فرآیند آن دقیقاً مشابه آپلود تصویر است: کافی است روی دکمه «+» بزنید و کلیپ ویدیویی موردنظر را انتخاب کنید.

پس از آپلود، می‌توانید از جمینی بخواهید محتوای ویدیو را خلاصه کند، بخش‌های خاصی را بررسی کند یا اشیاء مشخصی را شناسایی کند. در کنار پاسخ متنی، جمینی بخشی از ویدیو که تحلیل به آن مربوط می‌شود را نیز نمایش می‌دهد. بسته به مدت زمان ویدیو، تحلیل ممکن است چند لحظه طول بکشد.

این قابلیت، گسترشی از ویژگی پیشین جمینی برای خلاصه‌سازی ویدیوهای یوتیوب (YouTube) محسوب می‌شود و حالا به ویدیوهای شخصی نیز تعمیم یافته است.

 

 

تجربیات اولیه و مزیت رقابتی نسبت به ChatGPT

یکی از کاربران گزارش داده که یک کلیپ کوتاه را در جمینی آپلود کرده و از آن خواسته «چه چیزی می‌بیند». جمینی نه‌تنها محتوا را دقیق توصیف کرده، بلکه با تحلیل ترکیبی تصویر و صدا، محل ضبط ویدیو را نیز تشخیص داده است. حتی توانسته بازه زمانی نسبی ضبط کلیپ را با دقت بالا تخمین بزند.

در حال حاضر، اگرچه می‌توان ویدیو را به جمینی ارسال کرد، اما هنوز امکان ضبط مستقیم ویدیو از درون اپلیکیشن وجود ندارد. دوربین فقط برای گرفتن و ارسال عکس فعال است.

قابلیت تحلیل ویدیو یک مزیت رقابتی مهم برای جمینی نسبت به چت‌جی‌پی‌تی (ChatGPT) به شمار می‌رود. در حالی که ChatGPT از طریق قابلیت «Live» می‌تواند فید زنده دوربین را تحلیل کند و از پس تحلیل تصویر، فایل PDF و سند متنی برمی‌آید، هنوز از آپلود مستقیم و تحلیل فایل ویدیویی پشتیبانی نمی‌کند.

جمینی در حال حاضر این قابلیت را روی چند دستگاه اندرویدی و نسخه وب فعال کرده است. البته هنوز برای برخی کاربران آیفون (iPhone) این ویژگی فعال نشده است. برای بررسی فعال بودن این قابلیت در حساب خود، کافی است یک ویدیو را از گوشی یا رایانه‌تان در جمینی آپلود کنید.

 

 

پیشنهاد ویژه برای کاربران ابزارهای هوش مصنوعی

اگر قصد استفاده کامل از قابلیت‌های جمینی یا ابزارهای دیگر هوش مصنوعی (Artificial Intelligence) را دارید و نیاز به فعال‌سازی اشتراک‌های ویژه، خرید اکانت‌های پرمیوم یا انجام پرداخت بین‌المللی (International Payment) دارید، پیشنهاد می‌کنیم از فروشگاه جیب استور (Jib Store) استفاده کنید. این فروشگاه با ارائه اکانت‌های پرمیوم، گیفت کارت (Gift Card) و راهکارهای پرداخت امن و سریع، همراه مطمئن کاربران ایرانی در دنیای دیجیتال است.

تاریخ بروزرسانی : 28 خرداد 1404 14:50:32
مطالب مشابه
Gemini وارد میدان شد؛ انقلاب سامسونگ در دستیارهای هوش مصنوعی
آموزش

Gemini وارد میدان شد؛ انقلاب سامسونگ در دستیارهای هوش مصنوعی

سامسونگ با معرفی Gemini به‌عنوان دستیار هوش مصنوعی بهینه‌شده برای گلکسی، گامی مهم در تحول رابط‌های صوتی برداشت. این قابلیت جدید به تولیدکنندگان اندروید اجازه می‌دهد دستیارهای پیشنهادی خود را معرفی کنند؛ تغییری که می‌تواند آینده تعامل صوتی را بازتعریف کند.

29 خرداد 1404
هدست واقعیت ترکیبی سامسونگ رونمایی می‌شود؛ رقیب Apple Vision Pro؟
آموزش

هدست واقعیت ترکیبی سامسونگ رونمایی می‌شود؛ رقیب Apple Vision Pro؟

هدست واقعیت ترکیبی Project Moohan که به‌صورت مشترک توسط سامسونگ و گوگل توسعه یافته، پاییز ۱۴۰۳ رونمایی می‌شود. این هدست با سیستم‌عامل Android XR عرضه خواهد شد و رقیبی برای محصولات اپل و متا در دنیای واقعیت ترکیبی محسوب می‌شود.

29 خرداد 1404
فیس‌بوک امنیت را ارتقاء داد؛ Passkey در راه است
آموزش

فیس‌بوک امنیت را ارتقاء داد؛ Passkey در راه است

فیس‌بوک به‌زودی امکان ورود با Passkey را در نسخه‌های اندروید و iOS فعال می‌کند. این قابلیت با استفاده از فیس آیدی، تاچ آیدی یا پین‌کد، ورود ایمن‌تر و بدون رمز عبور را فراهم می‌کند و خطر فیشینگ و هک را به‌شدت کاهش می‌دهد.

29 خرداد 1404
چرا تماشای رایگان یوتیوب در ۲۰۲۵ تقریباً غیرممکن شده است؟
آموزش

چرا تماشای رایگان یوتیوب در ۲۰۲۵ تقریباً غیرممکن شده است؟

یوتیوب در سال ۲۰۲۵ با اجرای سیاست‌های سخت‌گیرانه‌تر، کاربران دارای AdBlock را هدف قرار داده است. از کاهش سرعت ویدیو تا تأخیر عمدی در عملکرد سایت، این اقدامات تجربه تماشای رایگان را مختل کرده و بسیاری را به اشتراک پرمیوم سوق می‌دهد.

29 خرداد 1404
Crimson Desert با گرافیکی خیره‌کننده و گیم‌پلی جادویی در راه است
آموزش

Crimson Desert با گرافیکی خیره‌کننده و گیم‌پلی جادویی در راه است

Crimson Desert با گرافیک فوق‌العاده، نبردهای پرانرژی و دنیای باز پویا، یکی از مورد انتظارترین بازی‌های سال ۲۰۲۵ است. از مبارزه‌های کلاسیک الهام‌گرفته از Devil May Cry تا جادوی عنصری و تغییرات پویا در محیط، تجربه‌ای منحصربه‌فرد انتظار بازیکنان را می‌کشد.

29 خرداد 1404
نینتندو سوییچ تبدیل به آیفون شد؟
آموزش

نینتندو سوییچ تبدیل به آیفون شد؟

یک ماد ساز خلاق موفق شد سیستم‌عامل آی‌اواس (iOS) را روی کنسول نینتندو سوییچ نسل اول نصب کند. هرچند اجرای آن بسیار کند، پر از باگ و غیرکاربردی است، اما این پروژه وایرال شده و توجه زیادی را در شبکه‌های اجتماعی جلب کرده است.

29 خرداد 1404

نظرات کاربران

دیدگاهتان را بنویسید

+ =

راه های ارتباطی با ما

از طریق تلگرام و یا برقراری تماس می‌توانید با تیم پشتیبانی ما در ارتباط باشید.