0
سبد خرید شما خالی است
جیب استور > وبلاگ > مدل‌های جدید استدلال‌گر OpenAI هنوز گرفتار توهم هستند!

مدل‌های جدید استدلال‌گر OpenAI هنوز گرفتار توهم هستند!

  • واحد تولید محتوا
  • 30 فروردین 1404 14:00:12
  • زمان مطالعه 1 دقیقه

مقدمه :

OpenAI از دو مدل جدید استدلال‌گر با نام‌های o3 و o4-mini رونمایی کرده، اما بررسی‌ها نشان می‌دهد که این مدل‌ها بیش از نسخه‌های قبلی دچار توهم می‌شوند و اطلاعات نادرست تولید می‌کنند؛ مسئله‌ای که چالشی جدی برای دقت هوش مصنوعی محسوب می‌شود.

مدل‌های جدید استدلال‌گر OpenAI هنوز گرفتار توهم هستند!

آنچه در این مقاله میخوانید

چند روز پیش، OpenAI از دو مدل هوش مصنوعی جدید خود با نام‌های o3 و o4-mini رونمایی کرد؛ مدل‌هایی که با هدف بهبود توانایی استدلال طراحی شده‌اند. اما طبق بررسی‌های انجام‌شده، این مدل‌ها با وجود برخی پیشرفت‌ها، همچنان با چالش بزرگ «توهم» مواجه‌اند.

توهم در مدل‌های o3 و o4-mini

بر اساس گزارشی از TechCrunch، این دو مدل در مقایسه با نسخه‌های قبلی OpenAI (مثل o1، o1-mini و o3-mini) حتی توهم بیشتری تولید می‌کنند. توهم در اینجا به معنای ارائه اطلاعات نادرست یا ساختگی است؛ پدیده‌ای که یکی از معضلات اصلی در حوزه هوش مصنوعی محسوب می‌شود.

به‌عنوان مثال، مدل o3 در پاسخ به 33 درصد از سؤالات PersonQA دچار توهم شده، در حالی که این نرخ برای مدل‌های قبلی تنها 14 تا 16 درصد بوده است. مدل o4-mini نیز وضعیت بدتری دارد و در 48 درصد از موارد پاسخ نادرست داده است.

چرا توهم بیشتر شده است؟

نکته جالب و البته نگران‌کننده اینجاست که OpenAI هنوز دلیل دقیق افزایش توهم در این مدل‌های جدید را نمی‌داند. در گزارش فنی منتشرشده، این شرکت عنوان کرده که «نیاز به تحقیقات بیشتر برای درک چرایی این موضوع وجود دارد».

قدرت بیشتر، اشتباهات بیشتر

مدل‌های o3 و o4-mini در حوزه‌هایی مانند برنامه‌نویسی و ریاضیات عملکرد نسبتاً بهتری دارند، اما از آنجا که «ادعاهای بیشتری ارائه می‌دهند»، به همان نسبت اشتباهات بیشتری نیز مرتکب می‌شوند.

راه‌حل چیست؟

یکی از راه‌حل‌های پیشنهادی برای کاهش توهم، استفاده از قابلیت جستجوی وب است. برای نمونه، مدل GPT-4o با امکان دسترسی به اینترنت، توانست در بنچمارک SimpleQA امتیاز دقت 90 درصدی کسب کند؛ نشانه‌ای از تأثیر مثبت اتصال به منابع واقعی.

در مجموع، اگرچه OpenAI گام‌های بزرگی در توسعه مدل‌های استدلال‌گر برداشته، اما چالش توهم همچنان یکی از بزرگ‌ترین موانع پیش‌روی آن است؛ مسئله‌ای که برای کاربران و کسب‌وکارهای وابسته به دقت بالا، بسیار حیاتی است.

تاریخ بروزرسانی : 11 تیر 1404 10:18:00
مطالب مشابه
قانون ۳۰ روزه: راز داشتن گوشی سریع‌تر
آموزش

قانون ۳۰ روزه: راز داشتن گوشی سریع‌تر

پاک کردن اپلیکیشن‌هایی که طی ۳۰ روز استفاده نشده بودند، گوشی را سبک‌تر، سریع‌تر و خلوت‌تر کرد. حذف ۳۷ اپ بی‌مصرف باعث شد مصرف باتری کمتر شود، اعلان‌ها نصف شوند و تمرکز بالا برود. قانون «۳۰ روزه» حالا به یک عادت مفید تبدیل شده است.

27 مرداد 1404
معرفی یکی از خلاقانه‌ترین بازی‌های فکری موبایل ۲۰۲۵
آموزش

معرفی یکی از خلاقانه‌ترین بازی‌های فکری موبایل ۲۰۲۵

بازی موبایل ?Is This Seat Taken تجربه‌ای متفاوت در سبک پازل ارائه می‌دهد؛ شما باید با درنظر گرفتن خواسته‌های متنوع شخصیت‌ها، بهترین چینش صندلی‌ها را بسازید. طراحی مینیمال، موسیقی آرام و سناریوهای خلاقانه باعث شده این بازی به اثری آرامش‌بخش و سرگرم‌کننده برای موبایل تبدیل شود.

27 مرداد 1404
طولانی‌ترین استریک اسنپ‌چت دنیا در سال ۲۰۲۵ مشخص شد!
آموزش

طولانی‌ترین استریک اسنپ‌چت دنیا در سال ۲۰۲۵ مشخص شد!

در سال ۲۰۲۵ طولانی‌ترین استریک اسنپ‌چت به نام «کتی و ارین» با بیش از ۳۹۰۰ روز ثبت شد. این رکورد نشان می‌دهد استریک‌ها فراتر از سرگرمی، به شاخصی از صمیمیت و رقابت در میان کاربران تبدیل شده‌اند.

27 مرداد 1404
شایعه داغ: ورود به GTA Online فقط با تأیید سن!
آموزش

شایعه داغ: ورود به GTA Online فقط با تأیید سن!

شایعات اخیر درباره احراز سن در GTA 6 باعث نگرانی بعضی گیمرها شده، اما توسعه‌دهنده سابق راک‌استار تأکید کرده این موضوع تأثیر بزرگی روی فروش یا تجربه بازیکنان نخواهد داشت. با وجود قوانین سخت‌گیرانه، هیجان طرفداران نشان می‌دهد GTA 6 همچنان رکوردشکن خواهد بود.

27 مرداد 1404
ایمیل اصلی‌تان در خطر است؟ این ۳ ابزار نجاتتان می‌دهند
آموزش

ایمیل اصلی‌تان در خطر است؟ این ۳ ابزار نجاتتان می‌دهند

استفاده از یک ایمیل برای همه حساب‌ها امنیت شما را به خطر می‌اندازد. با سرویس‌های ایمیل مستعار مثل SimpleLogin، Firefox Relay و DuckDuckGo می‌توانید آدرس‌های موقت بسازید، اسپم‌ها را مسدود کنید و حریم خصوصی خود را در دنیای آنلاین حفظ کنید.

27 مرداد 1404
این کدهای Roblox را از دست ندهید!
آموزش

این کدهای Roblox را از دست ندهید!

کدهای جدید Blox Fruits در آگوست ۲۰۲۵ منتشر شدند و امکان ریست استت‌ها، دریافت بوست دوبرابر XP و حتی جوایز خاص را به بازیکنان می‌دهند. این کدها میانبری عالی برای لول‌آپ سریع‌تر و ساخت کاراکتر حرفه‌ای‌تر در دنیای Roblox هستند.

27 مرداد 1404

نظرات کاربران

دیدگاهتان را بنویسید

+ =

راه های ارتباطی با ما

از طریق تلگرام و یا برقراری تماس می‌توانید با تیم پشتیبانی ما در ارتباط باشید.