0
سبد خرید شما خالی است
جیب استور > وبلاگ > مدل‌های جدید استدلال‌گر OpenAI هنوز گرفتار توهم هستند!

مدل‌های جدید استدلال‌گر OpenAI هنوز گرفتار توهم هستند!

  • واحد تولید محتوا
  • 30 فروردین 1404 14:00:12
  • زمان مطالعه 1 دقیقه

مقدمه :

OpenAI از دو مدل جدید استدلال‌گر با نام‌های o3 و o4-mini رونمایی کرده، اما بررسی‌ها نشان می‌دهد که این مدل‌ها بیش از نسخه‌های قبلی دچار توهم می‌شوند و اطلاعات نادرست تولید می‌کنند؛ مسئله‌ای که چالشی جدی برای دقت هوش مصنوعی محسوب می‌شود.

مدل‌های جدید استدلال‌گر OpenAI هنوز گرفتار توهم هستند!

آنچه در این مقاله میخوانید

چند روز پیش، OpenAI از دو مدل هوش مصنوعی جدید خود با نام‌های o3 و o4-mini رونمایی کرد؛ مدل‌هایی که با هدف بهبود توانایی استدلال طراحی شده‌اند. اما طبق بررسی‌های انجام‌شده، این مدل‌ها با وجود برخی پیشرفت‌ها، همچنان با چالش بزرگ «توهم» مواجه‌اند.

توهم در مدل‌های o3 و o4-mini

بر اساس گزارشی از TechCrunch، این دو مدل در مقایسه با نسخه‌های قبلی OpenAI (مثل o1، o1-mini و o3-mini) حتی توهم بیشتری تولید می‌کنند. توهم در اینجا به معنای ارائه اطلاعات نادرست یا ساختگی است؛ پدیده‌ای که یکی از معضلات اصلی در حوزه هوش مصنوعی محسوب می‌شود.

به‌عنوان مثال، مدل o3 در پاسخ به 33 درصد از سؤالات PersonQA دچار توهم شده، در حالی که این نرخ برای مدل‌های قبلی تنها 14 تا 16 درصد بوده است. مدل o4-mini نیز وضعیت بدتری دارد و در 48 درصد از موارد پاسخ نادرست داده است.

چرا توهم بیشتر شده است؟

نکته جالب و البته نگران‌کننده اینجاست که OpenAI هنوز دلیل دقیق افزایش توهم در این مدل‌های جدید را نمی‌داند. در گزارش فنی منتشرشده، این شرکت عنوان کرده که «نیاز به تحقیقات بیشتر برای درک چرایی این موضوع وجود دارد».

قدرت بیشتر، اشتباهات بیشتر

مدل‌های o3 و o4-mini در حوزه‌هایی مانند برنامه‌نویسی و ریاضیات عملکرد نسبتاً بهتری دارند، اما از آنجا که «ادعاهای بیشتری ارائه می‌دهند»، به همان نسبت اشتباهات بیشتری نیز مرتکب می‌شوند.

راه‌حل چیست؟

یکی از راه‌حل‌های پیشنهادی برای کاهش توهم، استفاده از قابلیت جستجوی وب است. برای نمونه، مدل GPT-4o با امکان دسترسی به اینترنت، توانست در بنچمارک SimpleQA امتیاز دقت 90 درصدی کسب کند؛ نشانه‌ای از تأثیر مثبت اتصال به منابع واقعی.

در مجموع، اگرچه OpenAI گام‌های بزرگی در توسعه مدل‌های استدلال‌گر برداشته، اما چالش توهم همچنان یکی از بزرگ‌ترین موانع پیش‌روی آن است؛ مسئله‌ای که برای کاربران و کسب‌وکارهای وابسته به دقت بالا، بسیار حیاتی است.

تاریخ بروزرسانی : 02 اسفند 1404 19:11:41
مطالب مشابه
گوگل وارد استودیوی موسیقی شد؛ ProducerAI به Google Labs پیوست
آموزش

گوگل وارد استودیوی موسیقی شد؛ ProducerAI به Google Labs پیوست

ProducerAI، ابزار تولید موسیقی مبتنی بر هوش مصنوعی، به Google Labs پیوست تا نقش «همکار خلاق» را برای موزیسین‌ها ایفا کند. این ابزار با استفاده از مدل Lyria 3، امکان ساخت موسیقی از متن و تصویر را فراهم کرده و بحث تازه‌ای درباره آینده خلاقیت انسانی و AI به راه انداخته است.

06 اسفند 1404
Horizon آنلاین می‌شود؛ پلی‌تست اسپین‌آف جدید این آخر هفته
آموزش

Horizon آنلاین می‌شود؛ پلی‌تست اسپین‌آف جدید این آخر هفته

سونی این آخر هفته یک پلی‌تست محدود برای Horizon Hunters Gathering برگزار می‌کند؛ اسپین‌آف چندنفره و کوآپ دنیای Horizon که روی PS5 و PC در دسترس است. این بازی با تمرکز بر همکاری سه‌نفره، حالت‌های بقا و دانجن‌کراولر، قدم تازه‌ای برای گسترش آنلاین این فرنچایز محسوب می‌شود.

06 اسفند 1404
Overwatch Rush معرفی شد؛ اورواچ این‌بار روی موبایل
آموزش

Overwatch Rush معرفی شد؛ اورواچ این‌بار روی موبایل

Overwatch Rush به‌عنوان یک بازی موبایلی کاملاً جدید معرفی شد؛ اثری مستقل و Top-Down که مخصوص موبایل طراحی شده است. بلیزارد با این پروژه قصد دارد دنیای Overwatch را فراتر از PC و کنسول گسترش دهد و تجربه‌ای سریع‌تر اما موبایل‌پسند ارائه کند.

06 اسفند 1404
چرا Resident Evil Requiem نقطه عطف نینتندو سوییچ ۲ است؟
آموزش

چرا Resident Evil Requiem نقطه عطف نینتندو سوییچ ۲ است؟

کارگردان Resident Evil Requiem فاش کرد که کپکام در ابتدا به توان سخت‌افزاری نینتندو سوییچ ۲ شک داشت، اما پس از بررسی عملی، اجرای کامل بازی تیم را شگفت‌زده کرد. عرضه هم‌زمان بازی روی سوییچ ۲، نشانه اعتماد جدی کپکام به کنسول جدید نینتندو است.

06 اسفند 1404
از RPG تاریخی تا فیلم سینمایی؛ Kingdom Come چه در سر دارد؟
آموزش

از RPG تاریخی تا فیلم سینمایی؛ Kingdom Come چه در سر دارد؟

کارگردان خلاق Kingdom Come Deliverance با کنار رفتن از نقش قبلی خود در Warhorse Studios، تمرکزش را روی ساخت اقتباس سینمایی این فرنچایز گذاشته است. با حضور مستقیم خالق اصلی در نگارش فیلمنامه، پروژه لایو-اکشن Kingdom Come به‌صورت جدی وارد مرحله جدیدی شده است.

06 اسفند 1404
Canva با دو خرید مهم، وارد دنیای انیمیشن و تبلیغات هوشمند شد
آموزش

Canva با دو خرید مهم، وارد دنیای انیمیشن و تبلیغات هوشمند شد

Canva با خرید دو استارتاپ Cavalry و MangoAI، گام بزرگی به‌سوی تبدیل‌شدن به یک پلتفرم کامل خلاقیت و بازاریابی برداشت. اضافه‌شدن انیمیشن و هوش مصنوعی تبلیغات، نشان می‌دهد Canva دیگر فقط ابزار طراحی نیست، بلکه یک Creative OS جدی برای برندهاست.

06 اسفند 1404

نظرات کاربران

دیدگاهتان را بنویسید

+ =

راه های ارتباطی با ما

از طریق تلگرام و یا برقراری تماس می‌توانید با تیم پشتیبانی ما در ارتباط باشید.