Other2026-04-25

שיטת RLCR של MIT CSAIL מפחיתה שגיאות hallucination ב-90% — על ידי ללמד מודלים לומר ׳אני לא בטוח׳

ניתוח AI

חוקרים מ-MIT CSAIL פיתחו שיטת אימון בשם RLCR — Reinforcement Learning with Calibration Rewards — שמלמדת language models לייצר אומדני ביטחון מכויילים לצד התשובות שלהם. השיטה מפחיתה calibration error בעד 90% תוך שמירה על דיוק — ולעיתים אף שיפורו — הן על משימות אימון והן על משימות חדשות. זהו מענה ישיר לבעיות hallucination ו-overconfidence שמגבילות את הפריסה הארגונית של AI.