0
سبد خرید شما خالی است
جیب استور > وبلاگ > مدل‌های جدید استدلال‌گر OpenAI هنوز گرفتار توهم هستند!

مدل‌های جدید استدلال‌گر OpenAI هنوز گرفتار توهم هستند!

  • واحد تولید محتوا
  • 30 فروردین 1404 14:00:12
  • زمان مطالعه 1 دقیقه

مقدمه :

OpenAI از دو مدل جدید استدلال‌گر با نام‌های o3 و o4-mini رونمایی کرده، اما بررسی‌ها نشان می‌دهد که این مدل‌ها بیش از نسخه‌های قبلی دچار توهم می‌شوند و اطلاعات نادرست تولید می‌کنند؛ مسئله‌ای که چالشی جدی برای دقت هوش مصنوعی محسوب می‌شود.

مدل‌های جدید استدلال‌گر OpenAI هنوز گرفتار توهم هستند!

آنچه در این مقاله میخوانید

چند روز پیش، OpenAI از دو مدل هوش مصنوعی جدید خود با نام‌های o3 و o4-mini رونمایی کرد؛ مدل‌هایی که با هدف بهبود توانایی استدلال طراحی شده‌اند. اما طبق بررسی‌های انجام‌شده، این مدل‌ها با وجود برخی پیشرفت‌ها، همچنان با چالش بزرگ «توهم» مواجه‌اند.

توهم در مدل‌های o3 و o4-mini

بر اساس گزارشی از TechCrunch، این دو مدل در مقایسه با نسخه‌های قبلی OpenAI (مثل o1، o1-mini و o3-mini) حتی توهم بیشتری تولید می‌کنند. توهم در اینجا به معنای ارائه اطلاعات نادرست یا ساختگی است؛ پدیده‌ای که یکی از معضلات اصلی در حوزه هوش مصنوعی محسوب می‌شود.

به‌عنوان مثال، مدل o3 در پاسخ به 33 درصد از سؤالات PersonQA دچار توهم شده، در حالی که این نرخ برای مدل‌های قبلی تنها 14 تا 16 درصد بوده است. مدل o4-mini نیز وضعیت بدتری دارد و در 48 درصد از موارد پاسخ نادرست داده است.

چرا توهم بیشتر شده است؟

نکته جالب و البته نگران‌کننده اینجاست که OpenAI هنوز دلیل دقیق افزایش توهم در این مدل‌های جدید را نمی‌داند. در گزارش فنی منتشرشده، این شرکت عنوان کرده که «نیاز به تحقیقات بیشتر برای درک چرایی این موضوع وجود دارد».

قدرت بیشتر، اشتباهات بیشتر

مدل‌های o3 و o4-mini در حوزه‌هایی مانند برنامه‌نویسی و ریاضیات عملکرد نسبتاً بهتری دارند، اما از آنجا که «ادعاهای بیشتری ارائه می‌دهند»، به همان نسبت اشتباهات بیشتری نیز مرتکب می‌شوند.

راه‌حل چیست؟

یکی از راه‌حل‌های پیشنهادی برای کاهش توهم، استفاده از قابلیت جستجوی وب است. برای نمونه، مدل GPT-4o با امکان دسترسی به اینترنت، توانست در بنچمارک SimpleQA امتیاز دقت 90 درصدی کسب کند؛ نشانه‌ای از تأثیر مثبت اتصال به منابع واقعی.

در مجموع، اگرچه OpenAI گام‌های بزرگی در توسعه مدل‌های استدلال‌گر برداشته، اما چالش توهم همچنان یکی از بزرگ‌ترین موانع پیش‌روی آن است؛ مسئله‌ای که برای کاربران و کسب‌وکارهای وابسته به دقت بالا، بسیار حیاتی است.

تاریخ بروزرسانی : 11 خرداد 1405 05:04:03
مطالب مشابه
آموزش بازی در مپ Rondo پابجی موبایل؛ معرفی سلاح‌ها و ویژگی‌های جدید
آموزش

آموزش بازی در مپ Rondo پابجی موبایل؛ معرفی سلاح‌ها و ویژگی‌های جدید

نقشه Rondo جدیدترین مپ پابجی موبایل است که با ترکیب محیط‌های سنتی و مدرن، مناطق متنوع برای لوت، مکانیک‌های اختصاصی، فروشگاه‌های درون بازی، سلاح JS9 و خودروی Blanc تجربه‌ای متفاوت ارائه می‌دهد. شناخت مناطق فرود و استراتژی‌های بقا، شانس رسیدن به چیکن دینر را افزایش می‌دهد.

11 خرداد 1405
آموزش کاهش پینگ در بازی کالاف دیوتی موبایل؛ بررسی بهترین راهکارهای تست شده
آموزش

آموزش کاهش پینگ در بازی کالاف دیوتی موبایل؛ بررسی بهترین راهکارهای تست شده

کاهش پینگ در کالاف دیوتی موبایل فقط به اینترنت سریع وابسته نیست. با بهینه‌سازی تنظیمات گرافیکی، استفاده از DNS مناسب، مدیریت شبکه، کاهش پکت‌لاس، فعال‌سازی گیم مود و جلوگیری از داغ شدن گوشی می‌توان لگ را کاهش داد و تجربه‌ای روان‌تر و رقابتی‌تر داشت.

11 خرداد 1405
نحوه استفاده از بالون در کلش آف کلنز؛ آموزش حمله، دفاع و ترکیب‌های برتر
آموزش

نحوه استفاده از بالون در کلش آف کلنز؛ آموزش حمله، دفاع و ترکیب‌های برتر

بالون یکی از قدرتمندترین نیروهای هوایی کلش آف کلنز است که با هدف قرار دادن ساختمان‌های دفاعی، نقش مهمی در استراتژی‌های هوایی دارد. در این راهنما با ویژگی‌ها، نقاط قوت و ضعف، ترکیب‌های محبوب مانند لاوالون، کاربرد اسپل‌ها و تکنیک‌های حرفه‌ای حمله و دفاع آشنا می‌شوید.

11 خرداد 1405
آموزش ساخت کاپر گالم در ماینکرافت؛ از نحوه کرفت تا نگهداری Copper Golem
آموزش

آموزش ساخت کاپر گالم در ماینکرافت؛ از نحوه کرفت تا نگهداری Copper Golem

کاپر گالم در نسخه رسمی ماینکرفت وجود ندارد و تنها از طریق مادها و افزونه‌ها قابل استفاده است. در این آموزش، نحوه نصب ماد، جمع‌آوری منابع، ساخت Copper Golem، عملکرد آن در ردستون، چرخه اکسیداسیون، روش‌های نگهداری و احیای این ماب محبوب را بررسی کرده‌ایم.

11 خرداد 1405
آموزش خروج از بلک لیست فری فایر؛ بررسی تفاوت‌ها با بن، دلایل و راهکارهای بازگشت
آموزش

آموزش خروج از بلک لیست فری فایر؛ بررسی تفاوت‌ها با بن، دلایل و راهکارهای بازگشت

اگر اکانت فری فایر شما وارد بلک لیست شده، هنوز همه‌چیز تمام نشده است. این راهنما نشانه‌های بلک لیست، تفاوت آن با بن دائمی، دلایل محدود شدن اکانت، روش‌های رفع محدودیت، ارسال تیکت به گارنا و راهکارهای جلوگیری از تکرار این مشکل را توضیح می‌دهد.

11 خرداد 1405
چگونه مایک کالاف را فعال کنیم؟ آموزش گام‌به‌گام و رفع مشکلات رایج
آموزش

چگونه مایک کالاف را فعال کنیم؟ آموزش گام‌به‌گام و رفع مشکلات رایج

در این مقاله روش فعال‌سازی میکروفون در کالاف دیوتی موبایل برای اندروید و آیفون، تنظیمات چت صوتی داخل بازی و راهکارهای رفع باگ مایک آموزش داده شده است. همچنین مشکلات رایج صدا، نویز، قطع شدن ارتباط صوتی و تاثیر اینترنت، DNS و هندزفری بر کیفیت مکالمه بررسی می‌شود.

11 خرداد 1405

نظرات کاربران

دیدگاهتان را بنویسید

+ =

راه های ارتباطی با ما

از طریق تلگرام و یا برقراری تماس می‌توانید با تیم پشتیبانی ما در ارتباط باشید.