0
سبد خرید شما خالی است
جیب استور > وبلاگ > مدل‌های جدید استدلال‌گر OpenAI هنوز گرفتار توهم هستند!

مدل‌های جدید استدلال‌گر OpenAI هنوز گرفتار توهم هستند!

  • واحد تولید محتوا
  • 30 فروردین 1404 14:00:12
  • زمان مطالعه 1 دقیقه

مقدمه :

OpenAI از دو مدل جدید استدلال‌گر با نام‌های o3 و o4-mini رونمایی کرده، اما بررسی‌ها نشان می‌دهد که این مدل‌ها بیش از نسخه‌های قبلی دچار توهم می‌شوند و اطلاعات نادرست تولید می‌کنند؛ مسئله‌ای که چالشی جدی برای دقت هوش مصنوعی محسوب می‌شود.

مدل‌های جدید استدلال‌گر OpenAI هنوز گرفتار توهم هستند!

آنچه در این مقاله میخوانید

چند روز پیش، OpenAI از دو مدل هوش مصنوعی جدید خود با نام‌های o3 و o4-mini رونمایی کرد؛ مدل‌هایی که با هدف بهبود توانایی استدلال طراحی شده‌اند. اما طبق بررسی‌های انجام‌شده، این مدل‌ها با وجود برخی پیشرفت‌ها، همچنان با چالش بزرگ «توهم» مواجه‌اند.

توهم در مدل‌های o3 و o4-mini

بر اساس گزارشی از TechCrunch، این دو مدل در مقایسه با نسخه‌های قبلی OpenAI (مثل o1، o1-mini و o3-mini) حتی توهم بیشتری تولید می‌کنند. توهم در اینجا به معنای ارائه اطلاعات نادرست یا ساختگی است؛ پدیده‌ای که یکی از معضلات اصلی در حوزه هوش مصنوعی محسوب می‌شود.

به‌عنوان مثال، مدل o3 در پاسخ به 33 درصد از سؤالات PersonQA دچار توهم شده، در حالی که این نرخ برای مدل‌های قبلی تنها 14 تا 16 درصد بوده است. مدل o4-mini نیز وضعیت بدتری دارد و در 48 درصد از موارد پاسخ نادرست داده است.

چرا توهم بیشتر شده است؟

نکته جالب و البته نگران‌کننده اینجاست که OpenAI هنوز دلیل دقیق افزایش توهم در این مدل‌های جدید را نمی‌داند. در گزارش فنی منتشرشده، این شرکت عنوان کرده که «نیاز به تحقیقات بیشتر برای درک چرایی این موضوع وجود دارد».

قدرت بیشتر، اشتباهات بیشتر

مدل‌های o3 و o4-mini در حوزه‌هایی مانند برنامه‌نویسی و ریاضیات عملکرد نسبتاً بهتری دارند، اما از آنجا که «ادعاهای بیشتری ارائه می‌دهند»، به همان نسبت اشتباهات بیشتری نیز مرتکب می‌شوند.

راه‌حل چیست؟

یکی از راه‌حل‌های پیشنهادی برای کاهش توهم، استفاده از قابلیت جستجوی وب است. برای نمونه، مدل GPT-4o با امکان دسترسی به اینترنت، توانست در بنچمارک SimpleQA امتیاز دقت 90 درصدی کسب کند؛ نشانه‌ای از تأثیر مثبت اتصال به منابع واقعی.

در مجموع، اگرچه OpenAI گام‌های بزرگی در توسعه مدل‌های استدلال‌گر برداشته، اما چالش توهم همچنان یکی از بزرگ‌ترین موانع پیش‌روی آن است؛ مسئله‌ای که برای کاربران و کسب‌وکارهای وابسته به دقت بالا، بسیار حیاتی است.

تاریخ بروزرسانی : 09 دی 1404 02:41:26
مطالب مشابه
بسته‌های هدیه روز پدر ایرانسل معرفی شد
آموزش

بسته‌های هدیه روز پدر ایرانسل معرفی شد

ایرانسل به مناسبت روز پدر، بسته ترکیبی ویژه‌ای شامل ۱۰ گیگابایت اینترنت پرسرعت و ۱۰ ساعت مکالمه درون‌شبکه‌ای را با قیمت ۵۰ هزار تومان برای مشترکان دائمی و اعتباری ارائه کرده است. این بسته ۱۰ روز اعتبار دارد و تا ۱۳ دی‌ماه ۱۴۰۴ قابل خرید است.

12 دی 1404
بسته‌های ویژه روز پدر همراه اول معرفی شد
آموزش

بسته‌های ویژه روز پدر همراه اول معرفی شد

همراه اول به مناسبت روز پدر، بسته‌های ترکیبی اینترنت و مکالمه سه‌روزه را با تخفیف ویژه برای مشترکان دائمی و اعتباری ارائه کرده است. این بسته‌ها شامل دو گزینه مقرون‌به‌صرفه بوده و تا ۱۵ دی ۱۴۰۴ قابل فعال‌سازی هستند.

12 دی 1404
گیفت کارت فری فایر چیست؟ آموزش خرید و شارژ فوری جم
آموزش

گیفت کارت فری فایر چیست؟ آموزش خرید و شارژ فوری جم

گیفت کارت فری فایر امن‌ترین و ساده‌ترین راه برای خرید جم و ارتقای اکانت بدون نیاز به لاگین یا پرداخت بین‌المللی است. در این راهنما با مفهوم جم، ریجن، مزایا، روش خرید در ایران و آموزش کامل ردیم کردن گیفت کارت آشنا می‌شوید.

12 دی 1404
چرا بعد از یک سال کار با Gemini، هنوز به ChatGPT برمی‌گردیم؟
آموزش

چرا بعد از یک سال کار با Gemini، هنوز به ChatGPT برمی‌گردیم؟

با وجود پیشرفت‌های Google Gemini در سال ۲۰۲۵، ChatGPT هنوز در تجربه کاربری جلوتر است. نبود اپلیکیشن بومی مک، Projects، ادغام عمیق با اپ‌ها و ضعف Gemini Live باعث شده ChatGPT انتخاب اول کاربران حرفه‌ای باقی بماند؛ هرچند فاصله در حال کمتر شدن است.

12 دی 1404
دوربین گلکسی S26 اولترا بالاخره حرفه‌ای شد؛ این‌بار با نرم‌افزار
آموزش

دوربین گلکسی S26 اولترا بالاخره حرفه‌ای شد؛ این‌بار با نرم‌افزار

سامسونگ در گلکسی S26 اولترا تمرکز دوربین را از سخت‌افزار به نرم‌افزار برده است. قابلیت‌هایی مثل Video Softening و تنظیمات پیشرفته فوکوس خودکار، تجربه عکاسی و فیلم‌برداری را طبیعی‌تر، کنترل‌پذیرتر و حرفه‌ای‌تر از همیشه می‌کنند.

12 دی 1404
زک اسنایدر با اسکین کیم کارداشیان فورتنایت بازی می‌کند!
آموزش

زک اسنایدر با اسکین کیم کارداشیان فورتنایت بازی می‌کند!

زک اسنایدر، کارگردان مشهور هالیوود، با انتشار پستی در اینستاگرام تأیید کرد که از اسکین کیم کارداشیان در فورتنایت استفاده می‌کند. او که یکی از میلیون‌ها بازیکن این اسکین است، حتی از احتمال ساخت فیلم لایو-اکشن فورتنایت هم استقبال کرده است.

12 دی 1404

نظرات کاربران

دیدگاهتان را بنویسید

+ =

راه های ارتباطی با ما

از طریق تلگرام و یا برقراری تماس می‌توانید با تیم پشتیبانی ما در ارتباط باشید.