0
سبد خرید شما خالی است
جیب استور > وبلاگ > مدل‌های جدید استدلال‌گر OpenAI هنوز گرفتار توهم هستند!

مدل‌های جدید استدلال‌گر OpenAI هنوز گرفتار توهم هستند!

  • واحد تولید محتوا
  • 30 فروردین 1404 14:00:12
  • زمان مطالعه 1 دقیقه

مقدمه :

OpenAI از دو مدل جدید استدلال‌گر با نام‌های o3 و o4-mini رونمایی کرده، اما بررسی‌ها نشان می‌دهد که این مدل‌ها بیش از نسخه‌های قبلی دچار توهم می‌شوند و اطلاعات نادرست تولید می‌کنند؛ مسئله‌ای که چالشی جدی برای دقت هوش مصنوعی محسوب می‌شود.

مدل‌های جدید استدلال‌گر OpenAI هنوز گرفتار توهم هستند!

آنچه در این مقاله میخوانید

چند روز پیش، OpenAI از دو مدل هوش مصنوعی جدید خود با نام‌های o3 و o4-mini رونمایی کرد؛ مدل‌هایی که با هدف بهبود توانایی استدلال طراحی شده‌اند. اما طبق بررسی‌های انجام‌شده، این مدل‌ها با وجود برخی پیشرفت‌ها، همچنان با چالش بزرگ «توهم» مواجه‌اند.

توهم در مدل‌های o3 و o4-mini

بر اساس گزارشی از TechCrunch، این دو مدل در مقایسه با نسخه‌های قبلی OpenAI (مثل o1، o1-mini و o3-mini) حتی توهم بیشتری تولید می‌کنند. توهم در اینجا به معنای ارائه اطلاعات نادرست یا ساختگی است؛ پدیده‌ای که یکی از معضلات اصلی در حوزه هوش مصنوعی محسوب می‌شود.

به‌عنوان مثال، مدل o3 در پاسخ به 33 درصد از سؤالات PersonQA دچار توهم شده، در حالی که این نرخ برای مدل‌های قبلی تنها 14 تا 16 درصد بوده است. مدل o4-mini نیز وضعیت بدتری دارد و در 48 درصد از موارد پاسخ نادرست داده است.

چرا توهم بیشتر شده است؟

نکته جالب و البته نگران‌کننده اینجاست که OpenAI هنوز دلیل دقیق افزایش توهم در این مدل‌های جدید را نمی‌داند. در گزارش فنی منتشرشده، این شرکت عنوان کرده که «نیاز به تحقیقات بیشتر برای درک چرایی این موضوع وجود دارد».

قدرت بیشتر، اشتباهات بیشتر

مدل‌های o3 و o4-mini در حوزه‌هایی مانند برنامه‌نویسی و ریاضیات عملکرد نسبتاً بهتری دارند، اما از آنجا که «ادعاهای بیشتری ارائه می‌دهند»، به همان نسبت اشتباهات بیشتری نیز مرتکب می‌شوند.

راه‌حل چیست؟

یکی از راه‌حل‌های پیشنهادی برای کاهش توهم، استفاده از قابلیت جستجوی وب است. برای نمونه، مدل GPT-4o با امکان دسترسی به اینترنت، توانست در بنچمارک SimpleQA امتیاز دقت 90 درصدی کسب کند؛ نشانه‌ای از تأثیر مثبت اتصال به منابع واقعی.

در مجموع، اگرچه OpenAI گام‌های بزرگی در توسعه مدل‌های استدلال‌گر برداشته، اما چالش توهم همچنان یکی از بزرگ‌ترین موانع پیش‌روی آن است؛ مسئله‌ای که برای کاربران و کسب‌وکارهای وابسته به دقت بالا، بسیار حیاتی است.

تاریخ بروزرسانی : 19 بهمن 1404 19:32:33
مطالب مشابه
این کنترلر ۴۹ دلاری تجربه بازی موبایل را متحول می‌کند!
آموزش

این کنترلر ۴۹ دلاری تجربه بازی موبایل را متحول می‌کند!

کنترلر کوچک Abxylute M4 با قیمت ۴۹ دلار، تجربه بازی موبایل را راحت‌تر و حرفه‌ای‌تر می‌کند. این گیم‌پد مغناطیسی برای بازی‌های کلاسیک و کوتاه عالی است، اما برای جلسات طولانی یا عناوین سنگین چندان ایده‌آل نیست و بیشتر مناسب گیمرهای معمولی و قابل‌حمل است.

20 بهمن 1404
کدهای جدید Anime Card Collection منتشر شد | پک و آیتم رایگان فوریه ۲۰۲۶
آموزش

کدهای جدید Anime Card Collection منتشر شد | پک و آیتم رایگان فوریه ۲۰۲۶

کدهای جدید Anime Card Collection در فوریه ۲۰۲۶ منتشر شدند و پاداش‌هایی مثل پک کارت، پول بازی و آیتم‌های افزایش شانس ارائه می‌دهند. با ردیم سریع این کدها و استفاده در زمان رویدادهای ویژه، می‌توانید سریع‌تر دک قدرتمند بسازید و بدون گرایند طولانی پیشرفت کنید.

20 بهمن 1404
بتل نت (Battle.net) چیست؟ بررسی پلتفرم بازی‌های بلیزارد و اکتیویژن
آموزش

بتل نت (Battle.net) چیست؟ بررسی پلتفرم بازی‌های بلیزارد و اکتیویژن

بتل نت دروازه ورود به بازی‌های بلیزارد و اکتیویژن است، اما کاربران ایرانی با چالش‌هایی مانند تحریم، انتخاب ریجن، پرداخت و مشکلات اتصال روبه‌رو هستند. این راهنما مراحل نصب، ساخت اکانت، انتخاب ریجن مناسب، کاهش پینگ و استفاده از گیفت کارت را به‌صورت کامل توضیح می‌دهد.

20 بهمن 1404
چت جی پی تی چیست؟ راهنمای جامع استفاده، امکانات و انواع اکانت ChatGPT
آموزش

چت جی پی تی چیست؟ راهنمای جامع استفاده، امکانات و انواع اکانت ChatGPT

ChatGPT دستیار هوش مصنوعی قدرتمند OpenAI است که می‌تواند متن بنویسد، تصویر تولید کند، داده‌ها را تحلیل کند و در کارهای روزمره و تخصصی کمک کند. در این راهنما با نحوه عملکرد، مدل‌ها، کاربردها، روش استفاده و محدودیت‌های آن به زبان ساده آشنا می‌شوید.

20 بهمن 1404
تأخیر GTA 6 تصادفی نیست؟ تئوری عجیب ۱۷۷ روزه طرفداران!
آموزش

تأخیر GTA 6 تصادفی نیست؟ تئوری عجیب ۱۷۷ روزه طرفداران!

برخی طرفداران معتقدند تأخیر GTA 6 بخشی از برنامه اولیه راکستار بوده است. شباهت فاصله ۱۷۷ روزه با زمان‌بندی Red Dead Redemption 2 این گمانه را تقویت کرده. احتمال می‌رود تریلر بعدی در مه ۲۰۲۶ منتشر شود و عرضه نهایی برای نوامبر ۲۰۲۶ برنامه‌ریزی شده است.

20 بهمن 1404
پاناسونیک برای Resident Evil یک گجت ترسناک ساخت؛ این بار ترس را حس می‌کنید!
آموزش

پاناسونیک برای Resident Evil یک گجت ترسناک ساخت؛ این بار ترس را حس می‌کنید!

پاناسونیک با همکاری کپکام از اسپیکر گردنی مخصوص Resident Evil Requiem رونمایی کرده است. این گجت با تمرکز بر فرکانس‌های پایین و ایجاد لرزش فیزیکی، تجربه‌ای عمیق‌تر و ترسناک‌تر ارائه می‌دهد و همزمان با عرضه بازی در ۲۸ فوریه در ژاپن منتشر می‌شود.

20 بهمن 1404

نظرات کاربران

دیدگاهتان را بنویسید

+ =

راه های ارتباطی با ما

از طریق تلگرام و یا برقراری تماس می‌توانید با تیم پشتیبانی ما در ارتباط باشید.