0
سبد خرید شما خالی است
جیب استور > وبلاگ > چرا هوش مصنوعی هنوز با اعتمادبه‌نفس جواب غلط می‌دهد؟

چرا هوش مصنوعی هنوز با اعتمادبه‌نفس جواب غلط می‌دهد؟

  • واحد تولید محتوا
  • 17 شهریور 1404 11:02:28
  • زمان مطالعه 1 دقیقه

مقدمه :

توهم یا خطاهای هوش مصنوعی همچنان بزرگ‌ترین چالش مدل‌های زبانی است. پژوهش تازه OpenAI نشان می‌دهد دلیل اصلی این مشکل، نه فقط آموزش اولیه، بلکه ارزیابی‌هایی است که مدل را به حدس‌زدن تشویق می‌کنند. راه‌حل: تغییر معیارها و امتیازدهی به شک و عدم قطعیت.

چرا هوش مصنوعی هنوز با اعتمادبه‌نفس جواب غلط می‌دهد؟

آنچه در این مقاله میخوانید

آیا واقعاً «انگیزه‌های اشتباه» باعث خطاهای هوش مصنوعی می‌شوند؟

یکی از بزرگ‌ترین چالش‌هایی که هنوز سر راه هوش مصنوعی و به‌ویژه چت‌بات‌هایی مثل ChatGPT قرار دارد، خطاهای موسوم به «توهم» یا Hallucination است. منظور همان جملات شسته‌رفته و قانع‌کننده‌ای است که مدل می‌سازد، اما در واقعیت اشتباه‌اند.

چرا هوش مصنوعی مطمئن ولی اشتباه جواب می‌دهد؟

پژوهش تازه‌ی OpenAI می‌گوید ریشه‌ی این مشکل در نحوه‌ی آموزش مدل‌هاست. مدل‌ها در مرحله‌ی پیش‌آموزش (Pretraining) فقط یاد می‌گیرند «کلمه‌ی بعدی» را درست حدس بزنند؛ نه اینکه آیا جمله‌ی نهایی درست است یا نه. بنابراین وقتی پای اطلاعات کم‌تکرار مثل تاریخ تولد یک شخص خاص وسط باشد، مدل‌ها الگویی برای اتکا ندارند و به‌جای «نمی‌دانم»، یک جواب ساختگی اما قانع‌کننده می‌دهند.

به بیان ساده: جملات درست را می‌سازند چون الگو زیاد دیده‌اند، اما جملات نادرست هم به همان روانی ساخته می‌شوند چون الگویی برای "رد کردن" ندارند.

AI

آیا مقصر «ارزیابی‌ها» هستند؟

نکته‌ی جالب مقاله اینجاست: خودِ آموزش مقصر اصلی نیست، بلکه شیوه‌ی ارزیابی مدل‌ها انگیزه‌ی غلط ایجاد می‌کند.

  • وقتی مدل فقط بر اساس «درصد پاسخ‌های درست» نمره می‌گیرد، ترجیح می‌دهد حدس بزند تا اینکه جواب ندهد.

  • درست مثل آزمونی که اگر خالی بگذاری صفر می‌گیری، اما با شانسی زدن شاید امتیاز بگیری.

راه‌حل پیشنهادی پژوهشگران شبیه آزمون‌هایی مثل SAT است:

  • برای جواب اشتباه نمره منفی در نظر بگیری.

  • برای «نمی‌دانم» یا پاسخ‌های با عدم قطعیت، امتیاز جزئی یا حتی مثبت بدهی.

به این ترتیب، مدل یاد می‌گیرد به‌جای اعتمادبه‌نفس کاذب، در جای درست شک کند.

چرا این موضوع مهم است؟

اگر معیارهای ارزیابی تغییر نکنند، حتی پیشرفته‌ترین مدل‌ها هم همچنان به «حدس‌زدن» عادت می‌کنند. و این یعنی اعتماد کور به پاسخ‌های هوش مصنوعی همیشه خطرناک خواهد بود.

پژوهشگران OpenAI می‌گویند وقت آن رسیده که روش امتیازدهی و معیارهای اصلی تغییر کنند، نه اینکه فقط چند تست فرعی به‌عنوان «آزمایش عدم قطعیت» اضافه شود.

جمع‌بندی

مشکل توهم‌های هوش مصنوعی به‌طور کامل حل‌شدنی نیست، اما می‌توان با اصلاح معیارهای ارزیابی، شدت و تکرار آن را کم کرد. شاید وقتش رسیده کاربران هم در کنار سازندگان، فرهنگ «پرسیدنِ دوباره» و «اعتماد نکردن کورکورانه» را تمرین کنند.

نظر شما چیست؟ آیا حاضر هستید پاسخی نیمه‌مطمئن از یک مدل بگیرید، یا ترجیح می‌دهید همیشه جوابی قطعی اگر اشتباه باشد بشنوید؟

تاریخ بروزرسانی : 18 شهریور 1404 00:52:52
مطالب مشابه
ایرپاد پرو ۳ با طراحی جدید در راه است
آموزش

ایرپاد پرو ۳ با طراحی جدید در راه است

اپل در رویداد سخت‌افزاری ۱۹ شهریور از خانواده آیفون ۱۷ رونمایی می‌کند؛ شامل آیفون ایر به‌عنوان باریک‌ترین آیفون تاریخ، تغییرات مهم در مدل‌های پرو، اپل واچ‌های جدید با قابلیت سنجش فشار خون و ایرپاد پرو ۳ با طراحی تازه. آینده اپل در راه است.

18 شهریور 1404
یوتیوب با پخش NFL رکوردشکنی کرد؛ ۱۷ میلیون بیننده!
آموزش

یوتیوب با پخش NFL رکوردشکنی کرد؛ ۱۷ میلیون بیننده!

یوتیوب در اولین پخش انحصاری NFL توانست بیش از ۱۷.۳ میلیون بیننده از ۲۳۰ کشور جذب کند. هرچند آمار کمی پایین‌تر از رکورد نتفلیکس بود، اما حضور یوتیوبرهای مشهور و اجرای کارول جی نشان داد یوتیوب می‌خواهد ترکیب تازه‌ای از ورزش و سرگرمی بسازد.

18 شهریور 1404
تخفیف ویژه سامسونگ گلکسی واچ اولترا؛ ۵۰ دلار ارزان‌تر شد!
آموزش

تخفیف ویژه سامسونگ گلکسی واچ اولترا؛ ۵۰ دلار ارزان‌تر شد!

سامسونگ گلکسی واچ اولترا که یکی از بهترین ساعت‌های هوشمند پریمیوم بازار محسوب می‌شود، حالا با ۵۰ دلار تخفیف از ۶۵۰ به ۶۰۰ دلار رسیده است. این مدل با طراحی مقاوم، باتری قدرتمند و قابلیت‌های متنوع ورزشی و هوش مصنوعی، گزینه‌ای ایده‌آل برای خرید است.

18 شهریور 1404
اسپاتیفای موسیقی را با حال‌وهوای شما هماهنگ می‌کند!
آموزش

اسپاتیفای موسیقی را با حال‌وهوای شما هماهنگ می‌کند!

اسپاتیفای با معرفی فیلترهای هوشمند به کاربران اجازه می‌دهد موسیقی، پادکست یا حتی کتاب صوتی را بر اساس فعالیت، ژانر یا حال‌و‌هوا فیلتر کنند. این قابلیت تجربه شنیداری را شخصی‌تر می‌کند، هرچند برخی کاربران از شلوغی رابط کاربری اسپاتیفای گلایه دارند.

18 شهریور 1404
Le Chat چیست؟ جایگزین فرانسوی ChatGPT با امکانات جدید
آموزش

Le Chat چیست؟ جایگزین فرانسوی ChatGPT با امکانات جدید

میسترال AI استارتاپ فرانسوی‌ای است که با مدل‌های متن‌باز و محصولی مثل Le Chat توانسته به رقیب جدی OpenAI تبدیل شود. این شرکت با سرمایه‌گذاری‌های میلیاردی، همکاری‌های جهانی و نوآوری‌های مداوم، آینده‌ای مهم برای اروپا در عرصه هوش مصنوعی رقم می‌زند.

18 شهریور 1404
چرا نینتندو دیگر فرنچایز تازه نمی‌سازد؟
آموزش

چرا نینتندو دیگر فرنچایز تازه نمی‌سازد؟

نینتندو برخلاف گذشته کمتر به سراغ ساخت فرنچایزهای جدید می‌رود. کارشناسان می‌گویند دلیلش واضح است: این شرکت با مجموعه‌های محبوبی مثل ماریو، زلدا و اسپلتون، تقریباً همه ژانرها را پوشش داده و ایده‌های تازه را زیر همان برندهای قدیمی عرضه می‌کند تا سریع‌تر محبوب شوند.

18 شهریور 1404

نظرات کاربران

دیدگاهتان را بنویسید

+ =

راه های ارتباطی با ما

از طریق تلگرام و یا برقراری تماس می‌توانید با تیم پشتیبانی ما در ارتباط باشید.