0
سبد خرید شما خالی است
جیب استور > وبلاگ > مدل‌های جدید استدلال‌گر OpenAI هنوز گرفتار توهم هستند!

مدل‌های جدید استدلال‌گر OpenAI هنوز گرفتار توهم هستند!

  • واحد تولید محتوا
  • 30 فروردین 1404 14:00:12
  • زمان مطالعه 1 دقیقه

مقدمه :

OpenAI از دو مدل جدید استدلال‌گر با نام‌های o3 و o4-mini رونمایی کرده، اما بررسی‌ها نشان می‌دهد که این مدل‌ها بیش از نسخه‌های قبلی دچار توهم می‌شوند و اطلاعات نادرست تولید می‌کنند؛ مسئله‌ای که چالشی جدی برای دقت هوش مصنوعی محسوب می‌شود.

مدل‌های جدید استدلال‌گر OpenAI هنوز گرفتار توهم هستند!

آنچه در این مقاله میخوانید

چند روز پیش، OpenAI از دو مدل هوش مصنوعی جدید خود با نام‌های o3 و o4-mini رونمایی کرد؛ مدل‌هایی که با هدف بهبود توانایی استدلال طراحی شده‌اند. اما طبق بررسی‌های انجام‌شده، این مدل‌ها با وجود برخی پیشرفت‌ها، همچنان با چالش بزرگ «توهم» مواجه‌اند.

توهم در مدل‌های o3 و o4-mini

بر اساس گزارشی از TechCrunch، این دو مدل در مقایسه با نسخه‌های قبلی OpenAI (مثل o1، o1-mini و o3-mini) حتی توهم بیشتری تولید می‌کنند. توهم در اینجا به معنای ارائه اطلاعات نادرست یا ساختگی است؛ پدیده‌ای که یکی از معضلات اصلی در حوزه هوش مصنوعی محسوب می‌شود.

به‌عنوان مثال، مدل o3 در پاسخ به 33 درصد از سؤالات PersonQA دچار توهم شده، در حالی که این نرخ برای مدل‌های قبلی تنها 14 تا 16 درصد بوده است. مدل o4-mini نیز وضعیت بدتری دارد و در 48 درصد از موارد پاسخ نادرست داده است.

چرا توهم بیشتر شده است؟

نکته جالب و البته نگران‌کننده اینجاست که OpenAI هنوز دلیل دقیق افزایش توهم در این مدل‌های جدید را نمی‌داند. در گزارش فنی منتشرشده، این شرکت عنوان کرده که «نیاز به تحقیقات بیشتر برای درک چرایی این موضوع وجود دارد».

قدرت بیشتر، اشتباهات بیشتر

مدل‌های o3 و o4-mini در حوزه‌هایی مانند برنامه‌نویسی و ریاضیات عملکرد نسبتاً بهتری دارند، اما از آنجا که «ادعاهای بیشتری ارائه می‌دهند»، به همان نسبت اشتباهات بیشتری نیز مرتکب می‌شوند.

راه‌حل چیست؟

یکی از راه‌حل‌های پیشنهادی برای کاهش توهم، استفاده از قابلیت جستجوی وب است. برای نمونه، مدل GPT-4o با امکان دسترسی به اینترنت، توانست در بنچمارک SimpleQA امتیاز دقت 90 درصدی کسب کند؛ نشانه‌ای از تأثیر مثبت اتصال به منابع واقعی.

در مجموع، اگرچه OpenAI گام‌های بزرگی در توسعه مدل‌های استدلال‌گر برداشته، اما چالش توهم همچنان یکی از بزرگ‌ترین موانع پیش‌روی آن است؛ مسئله‌ای که برای کاربران و کسب‌وکارهای وابسته به دقت بالا، بسیار حیاتی است.

تاریخ بروزرسانی : 24 آبان 1404 21:46:22
مطالب مشابه
ساعت ۴۳ میلی‌متری وان‌پلاس همه را غافلگیر کرد
آموزش

ساعت ۴۳ میلی‌متری وان‌پلاس همه را غافلگیر کرد

نسخه ۴۳ میلی‌متری OnePlus Watch 3 با وجود اندازه کوچک، ترکیبی از طراحی شیک، وزن کم، باتری قدرتمند و عملکرد روان ارائه می‌دهد. با دو تراشه هوشمند، دوام عالی و قیمت مناسب، یکی از بهترین گزینه‌های اندرویدی برای کاربران عادی تا حرفه‌ای محسوب می‌شود.

25 آبان 1404
لودویگ چطور فقط در دو روز ۱۰۴ هزار دلار جمع کرد؟
آموزش

لودویگ چطور فقط در دو روز ۱۰۴ هزار دلار جمع کرد؟

لودویگ در یک استریم احساسی و طولانی برای بزرگداشت یکی از قدیمی‌ترین بینندگانش، کانابانا، بیش از ۱۰۴ هزار دلار برای سازمان Trevor Project جمع‌آوری کرد. این رویداد با حمایت گسترده مخاطبان برگزار شد و به یکی از معنادارترین لحظات جامعه او تبدیل شد.

25 آبان 1404
آیا اندروید مسیرش را گم کرده؟ واقعیت تلخ ۲۰۲۵
آموزش

آیا اندروید مسیرش را گم کرده؟ واقعیت تلخ ۲۰۲۵

اندروید زمانی نماد آزادی و انتخاب بود، اما با حذف جک هدفون، شارژر و microSD، امروز بیش‌ازحد شبیه اپل شده آن هم بدون کیفیت و هماهنگی اکوسیستم اپل. نتیجه؟ تجربه‌ای گران‌تر، محدودتر و آشفته‌تر که کاربر باید هزینه‌اش را بدهد.

25 آبان 1404
بلک‌آپس واقعاً درباره چیست؟ راهنمایی که همه چیز را روشن می‌کند
آموزش

بلک‌آپس واقعاً درباره چیست؟ راهنمایی که همه چیز را روشن می‌کند

داستان سری Black Ops مسیری پیچیده از وورکوتا تا جنگ‌های سایبری آینده را روایت می‌کند؛ از شست‌وشوی ذهنی میسون و ظهور پرسئوس تا انتقام منندز و بازگشت بحران‌ها در Black Ops 7. این خط داستانی نمایشی عمیق از جنگ پنهان، فریب ذهن و سیاست جهانی است.

25 آبان 1404
Pixel Watch 4 تا Watch 8؛ بهترین‌های امسال کدام‌اند؟
آموزش

Pixel Watch 4 تا Watch 8؛ بهترین‌های امسال کدام‌اند؟

سال ۲۰۲۵ ثابت کرد بازار ساعت‌های هوشمند اصلاً در خطر نیست. با ورود مدل‌هایی مثل Pixel Watch 4، Galaxy Watch 8، OnePlus Watch 3 و Apple Watch SE 3، خریداران حالا با بهترین و متنوع‌ترین انتخاب‌ها روبه‌رو هستند و تقریباً انتخاب بد وجود ندارد.

25 آبان 1404
کمپینی که نمی‌شود Pause کرد! Black Ops 7 چه خبر است؟
آموزش

کمپینی که نمی‌شود Pause کرد! Black Ops 7 چه خبر است؟

کمپین Black Ops 7 برخلاف نسخه‌های قبلی کاملاً آنلاین است؛ نه چک‌پوینت دارد، نه Pause و نه یار هوش مصنوعی. بازیکن‌های solo باید مأموریت‌های طراحی‌شده برای چهار نفر را به‌تنهایی انجام دهند. بااین‌حال صحنه‌های سینمایی و ستارگان مشهور، تنوع جذابی ایجاد کرده‌اند.

25 آبان 1404

نظرات کاربران

دیدگاهتان را بنویسید

+ =

راه های ارتباطی با ما

از طریق تلگرام و یا برقراری تماس می‌توانید با تیم پشتیبانی ما در ارتباط باشید.