0
سبد خرید شما خالی است
جیب استور > وبلاگ > مدل‌های جدید استدلال‌گر OpenAI هنوز گرفتار توهم هستند!
مدل‌های جدید استدلال‌گر OpenAI هنوز گرفتار توهم هستند!

مدل‌های جدید استدلال‌گر OpenAI هنوز گرفتار توهم هستند!

  • واحد تولید محتوا
    واحد تولید محتوا
  • تاریخ انتشار
    30 فروردین 1404 14:00:12
  • زمان مطالعه
    زمان مطالعه 1 دقیقه

مقدمه :

OpenAI از دو مدل جدید استدلال‌گر با نام‌های o3 و o4-mini رونمایی کرده، اما بررسی‌ها نشان می‌دهد که این مدل‌ها بیش از نسخه‌های قبلی دچار توهم می‌شوند و اطلاعات نادرست تولید می‌کنند؛ مسئله‌ای که چالشی جدی برای دقت هوش مصنوعی محسوب می‌شود.

آنچه در این مقاله میخوانید

چند روز پیش، OpenAI از دو مدل هوش مصنوعی جدید خود با نام‌های o3 و o4-mini رونمایی کرد؛ مدل‌هایی که با هدف بهبود توانایی استدلال طراحی شده‌اند. اما طبق بررسی‌های انجام‌شده، این مدل‌ها با وجود برخی پیشرفت‌ها، همچنان با چالش بزرگ «توهم» مواجه‌اند.

 

توهم در مدل‌های o3 و o4-mini

بر اساس گزارشی از TechCrunch، این دو مدل در مقایسه با نسخه‌های قبلی OpenAI (مثل o1، o1-mini و o3-mini) حتی توهم بیشتری تولید می‌کنند. توهم در اینجا به معنای ارائه اطلاعات نادرست یا ساختگی است؛ پدیده‌ای که یکی از معضلات اصلی در حوزه هوش مصنوعی محسوب می‌شود.

به‌عنوان مثال، مدل o3 در پاسخ به 33 درصد از سؤالات PersonQA دچار توهم شده، در حالی که این نرخ برای مدل‌های قبلی تنها 14 تا 16 درصد بوده است. مدل o4-mini نیز وضعیت بدتری دارد و در 48 درصد از موارد پاسخ نادرست داده است.

 

چرا توهم بیشتر شده است؟

نکته جالب و البته نگران‌کننده اینجاست که OpenAI هنوز دلیل دقیق افزایش توهم در این مدل‌های جدید را نمی‌داند. در گزارش فنی منتشرشده، این شرکت عنوان کرده که «نیاز به تحقیقات بیشتر برای درک چرایی این موضوع وجود دارد».

 

قدرت بیشتر، اشتباهات بیشتر

مدل‌های o3 و o4-mini در حوزه‌هایی مانند برنامه‌نویسی و ریاضیات عملکرد نسبتاً بهتری دارند، اما از آنجا که «ادعاهای بیشتری ارائه می‌دهند»، به همان نسبت اشتباهات بیشتری نیز مرتکب می‌شوند.

 

راه‌حل چیست؟

یکی از راه‌حل‌های پیشنهادی برای کاهش توهم، استفاده از قابلیت جستجوی وب است. برای نمونه، مدل GPT-4o با امکان دسترسی به اینترنت، توانست در بنچمارک SimpleQA امتیاز دقت 90 درصدی کسب کند؛ نشانه‌ای از تأثیر مثبت اتصال به منابع واقعی.

در مجموع، اگرچه OpenAI گام‌های بزرگی در توسعه مدل‌های استدلال‌گر برداشته، اما چالش توهم همچنان یکی از بزرگ‌ترین موانع پیش‌روی آن است؛ مسئله‌ای که برای کاربران و کسب‌وکارهای وابسته به دقت بالا، بسیار حیاتی است.

تاریخ بروزرسانی : 30 فروردین 1404 14:00:12
مطالب مشابه
نحوه ساخت و انتشار اولین پروژه در Roblox Studio (برای تازه‌کارها)
آموزش

نحوه ساخت و انتشار اولین پروژه در Roblox Studio (برای تازه‌کارها)

Roblox Studio ابزاری قدرتمند برای ساخت بازی‌های آنلاین است. در این مقاله، مراحل ساخت اولین پروژه، ابزارهای اصلی، نحوه کدنویسی، تست و انتشار بازی را به‌صورت کامل برای تازه‌کارها آموزش می‌دهیم و نکاتی برای ارتقاء تجربه بازی ارائه می‌شود.

30 فروردین 1404
تعرفه‌های جدید ترامپ هزینه تولید آیفون را به‌شدت افزایش میدهد!
آموزش

تعرفه‌های جدید ترامپ هزینه تولید آیفون را به‌شدت افزایش میدهد!

تعرفه‌های جدید ترامپ می‌تواند هزینه تولید آیفون را به‌شدت افزایش دهد. انتقال تولید به ایالات متحده با چالش‌های اقتصادی و افزایش قیمت‌ها روبرو خواهد بود، که ممکن است باعث کاهش حاشیه سود اپل شود.

30 فروردین 1404
اسپاتیفای نسخه Kids را با هوش مصنوعی شخصی‌ساز عرضه کرد
آموزش

اسپاتیفای نسخه Kids را با هوش مصنوعی شخصی‌ساز عرضه کرد

اسپاتیفای با نسخه جدید Kids تجربه‌ای امن و شخصی‌سازی‌شده برای کودکان فراهم کرده است. با هوش مصنوعی، محتوای صوتی متناسب با سن کودک پیشنهاد می‌شود و والدین نیز کنترل کامل دارند. راه‌اندازی ساده و رابط کاربری جذاب، از مزایای اصلی آن است.

30 فروردین 1404
تغییر بزرگ در تنظیمات اندروید؛ رنگ‌ها به‌روز می‌شوند!
آموزش

تغییر بزرگ در تنظیمات اندروید؛ رنگ‌ها به‌روز می‌شوند!

گوگل در نسخه بتای اندروید ۱۶ تغییرات بصری تازه‌ای را آزمایش می‌کند. یکی از این تغییرات، رنگی‌تر شدن آیکون‌های منوی تنظیمات است که تجربه کاربری زیباتر و مدرن‌تری را به رابط کاربری اندروید اضافه می‌کند.

30 فروردین 1404
دیسکورد متهم به نقض حریم کودکان شد!
آموزش

دیسکورد متهم به نقض حریم کودکان شد!

ایالت نیوجرسی از دیسکورد شکایت کرده و این پلتفرم را به نقض قوانین حفاظت از کودکان متهم کرده است. به‌گفته مقامات، تنظیمات پیش‌فرض و عدم تأیید سن کاربران، کودکان را در معرض محتوای نامناسب قرار داده‌اند.

30 فروردین 1404
تغییر اندازه آیکون‌ اپلیکیشن‌ها در One UI 7 ممکن شد!
آموزش

تغییر اندازه آیکون‌ اپلیکیشن‌ها در One UI 7 ممکن شد!

در One UI 7، کاربران سامسونگ می‌توانند بدون نیاز به اپ‌های جانبی، اندازه آیکون‌های صفحه اصلی و منوی اپلیکیشن را به دلخواه تغییر دهند. این ویژگی در منوی شخصی‌سازی رابط کاربری به‌صورت مستقیم در دسترس است.

30 فروردین 1404

نظرات کاربران

دیدگاهتان را بنویسید

+ =

راه های ارتباطی با ما

از طریق تلگرام و یا برقراری تماس می‌توانید با تیم پشتیبانی ما در ارتباط باشید.