0
سبد خرید شما خالی است
جیب استور > وبلاگ > چرا هوش مصنوعی هنوز با اعتمادبه‌نفس جواب غلط می‌دهد؟

چرا هوش مصنوعی هنوز با اعتمادبه‌نفس جواب غلط می‌دهد؟

  • واحد تولید محتوا
  • 17 شهریور 1404 11:02:28
  • زمان مطالعه 1 دقیقه

مقدمه :

توهم یا خطاهای هوش مصنوعی همچنان بزرگ‌ترین چالش مدل‌های زبانی است. پژوهش تازه OpenAI نشان می‌دهد دلیل اصلی این مشکل، نه فقط آموزش اولیه، بلکه ارزیابی‌هایی است که مدل را به حدس‌زدن تشویق می‌کنند. راه‌حل: تغییر معیارها و امتیازدهی به شک و عدم قطعیت.

چرا هوش مصنوعی هنوز با اعتمادبه‌نفس جواب غلط می‌دهد؟

آنچه در این مقاله میخوانید

آیا واقعاً «انگیزه‌های اشتباه» باعث خطاهای هوش مصنوعی می‌شوند؟

یکی از بزرگ‌ترین چالش‌هایی که هنوز سر راه هوش مصنوعی و به‌ویژه چت‌بات‌هایی مثل ChatGPT قرار دارد، خطاهای موسوم به «توهم» یا Hallucination است. منظور همان جملات شسته‌رفته و قانع‌کننده‌ای است که مدل می‌سازد، اما در واقعیت اشتباه‌اند.

چرا هوش مصنوعی مطمئن ولی اشتباه جواب می‌دهد؟

پژوهش تازه‌ی OpenAI می‌گوید ریشه‌ی این مشکل در نحوه‌ی آموزش مدل‌هاست. مدل‌ها در مرحله‌ی پیش‌آموزش (Pretraining) فقط یاد می‌گیرند «کلمه‌ی بعدی» را درست حدس بزنند؛ نه اینکه آیا جمله‌ی نهایی درست است یا نه. بنابراین وقتی پای اطلاعات کم‌تکرار مثل تاریخ تولد یک شخص خاص وسط باشد، مدل‌ها الگویی برای اتکا ندارند و به‌جای «نمی‌دانم»، یک جواب ساختگی اما قانع‌کننده می‌دهند.

به بیان ساده: جملات درست را می‌سازند چون الگو زیاد دیده‌اند، اما جملات نادرست هم به همان روانی ساخته می‌شوند چون الگویی برای "رد کردن" ندارند.

AI

آیا مقصر «ارزیابی‌ها» هستند؟

نکته‌ی جالب مقاله اینجاست: خودِ آموزش مقصر اصلی نیست، بلکه شیوه‌ی ارزیابی مدل‌ها انگیزه‌ی غلط ایجاد می‌کند.

  • وقتی مدل فقط بر اساس «درصد پاسخ‌های درست» نمره می‌گیرد، ترجیح می‌دهد حدس بزند تا اینکه جواب ندهد.

  • درست مثل آزمونی که اگر خالی بگذاری صفر می‌گیری، اما با شانسی زدن شاید امتیاز بگیری.

راه‌حل پیشنهادی پژوهشگران شبیه آزمون‌هایی مثل SAT است:

  • برای جواب اشتباه نمره منفی در نظر بگیری.

  • برای «نمی‌دانم» یا پاسخ‌های با عدم قطعیت، امتیاز جزئی یا حتی مثبت بدهی.

به این ترتیب، مدل یاد می‌گیرد به‌جای اعتمادبه‌نفس کاذب، در جای درست شک کند.

چرا این موضوع مهم است؟

اگر معیارهای ارزیابی تغییر نکنند، حتی پیشرفته‌ترین مدل‌ها هم همچنان به «حدس‌زدن» عادت می‌کنند. و این یعنی اعتماد کور به پاسخ‌های هوش مصنوعی همیشه خطرناک خواهد بود.

پژوهشگران OpenAI می‌گویند وقت آن رسیده که روش امتیازدهی و معیارهای اصلی تغییر کنند، نه اینکه فقط چند تست فرعی به‌عنوان «آزمایش عدم قطعیت» اضافه شود.

جمع‌بندی

مشکل توهم‌های هوش مصنوعی به‌طور کامل حل‌شدنی نیست، اما می‌توان با اصلاح معیارهای ارزیابی، شدت و تکرار آن را کم کرد. شاید وقتش رسیده کاربران هم در کنار سازندگان، فرهنگ «پرسیدنِ دوباره» و «اعتماد نکردن کورکورانه» را تمرین کنند.

نظر شما چیست؟ آیا حاضر هستید پاسخی نیمه‌مطمئن از یک مدل بگیرید، یا ترجیح می‌دهید همیشه جوابی قطعی اگر اشتباه باشد بشنوید؟

تاریخ بروزرسانی : 04 اسفند 1404 23:13:12
مطالب مشابه
گوگل وارد استودیوی موسیقی شد؛ ProducerAI به Google Labs پیوست
آموزش

گوگل وارد استودیوی موسیقی شد؛ ProducerAI به Google Labs پیوست

ProducerAI، ابزار تولید موسیقی مبتنی بر هوش مصنوعی، به Google Labs پیوست تا نقش «همکار خلاق» را برای موزیسین‌ها ایفا کند. این ابزار با استفاده از مدل Lyria 3، امکان ساخت موسیقی از متن و تصویر را فراهم کرده و بحث تازه‌ای درباره آینده خلاقیت انسانی و AI به راه انداخته است.

06 اسفند 1404
Horizon آنلاین می‌شود؛ پلی‌تست اسپین‌آف جدید این آخر هفته
آموزش

Horizon آنلاین می‌شود؛ پلی‌تست اسپین‌آف جدید این آخر هفته

سونی این آخر هفته یک پلی‌تست محدود برای Horizon Hunters Gathering برگزار می‌کند؛ اسپین‌آف چندنفره و کوآپ دنیای Horizon که روی PS5 و PC در دسترس است. این بازی با تمرکز بر همکاری سه‌نفره، حالت‌های بقا و دانجن‌کراولر، قدم تازه‌ای برای گسترش آنلاین این فرنچایز محسوب می‌شود.

06 اسفند 1404
Overwatch Rush معرفی شد؛ اورواچ این‌بار روی موبایل
آموزش

Overwatch Rush معرفی شد؛ اورواچ این‌بار روی موبایل

Overwatch Rush به‌عنوان یک بازی موبایلی کاملاً جدید معرفی شد؛ اثری مستقل و Top-Down که مخصوص موبایل طراحی شده است. بلیزارد با این پروژه قصد دارد دنیای Overwatch را فراتر از PC و کنسول گسترش دهد و تجربه‌ای سریع‌تر اما موبایل‌پسند ارائه کند.

06 اسفند 1404
چرا Resident Evil Requiem نقطه عطف نینتندو سوییچ ۲ است؟
آموزش

چرا Resident Evil Requiem نقطه عطف نینتندو سوییچ ۲ است؟

کارگردان Resident Evil Requiem فاش کرد که کپکام در ابتدا به توان سخت‌افزاری نینتندو سوییچ ۲ شک داشت، اما پس از بررسی عملی، اجرای کامل بازی تیم را شگفت‌زده کرد. عرضه هم‌زمان بازی روی سوییچ ۲، نشانه اعتماد جدی کپکام به کنسول جدید نینتندو است.

06 اسفند 1404
از RPG تاریخی تا فیلم سینمایی؛ Kingdom Come چه در سر دارد؟
آموزش

از RPG تاریخی تا فیلم سینمایی؛ Kingdom Come چه در سر دارد؟

کارگردان خلاق Kingdom Come Deliverance با کنار رفتن از نقش قبلی خود در Warhorse Studios، تمرکزش را روی ساخت اقتباس سینمایی این فرنچایز گذاشته است. با حضور مستقیم خالق اصلی در نگارش فیلمنامه، پروژه لایو-اکشن Kingdom Come به‌صورت جدی وارد مرحله جدیدی شده است.

06 اسفند 1404
Canva با دو خرید مهم، وارد دنیای انیمیشن و تبلیغات هوشمند شد
آموزش

Canva با دو خرید مهم، وارد دنیای انیمیشن و تبلیغات هوشمند شد

Canva با خرید دو استارتاپ Cavalry و MangoAI، گام بزرگی به‌سوی تبدیل‌شدن به یک پلتفرم کامل خلاقیت و بازاریابی برداشت. اضافه‌شدن انیمیشن و هوش مصنوعی تبلیغات، نشان می‌دهد Canva دیگر فقط ابزار طراحی نیست، بلکه یک Creative OS جدی برای برندهاست.

06 اسفند 1404

نظرات کاربران

دیدگاهتان را بنویسید

+ =

راه های ارتباطی با ما

از طریق تلگرام و یا برقراری تماس می‌توانید با تیم پشتیبانی ما در ارتباط باشید.