Новейшие модели OpenAI стали ошибаться чаще, чем их предшественники

Руководитель компании OpenAI Сэм Альтман представил модели o3 и o4-mini / © OpenAI
Однако, как показали тесты o3 и o4-mini, по-видимому, сделали значительный шаг назад: они склонны придумывать — или «галлюцинировать» — сильнее, чем их более ранние версии.
По данным издания TechCrunch, новые модели OpenAI противоречат исторической тенденции, согласно которой каждая новая модель давала все меньше галлюцинаций, чем предыдущая, что позволяет предположить, что OpenAI теперь движется в неверном направлении.
Согласно результатам внутреннего тестирования OpenAI, o3 и o4-mini склонны к галлюцинациям чаще, чем старые модели, включая o1, o1-mini и даже o3-mini. Модель o3 выдала 33% ошибок на тесте точности компании. Это примерно вдвое больше, чем у предыдущих моделей OpenAI. Тогда, как o4-mini показала еще более худший результат — 48%.
Хуже того, специалисты компании, похоже, не до конца понимают, причины проблем. Согласно их техническому отчету, «необходимы дополнительные исследования, чтобы понять причину» этих ошибок.
Еще по теме:
ИИ теряет темп, а человеческий интеллект остается недосягаемым
10 недосягаемых качеств, или На что не способен «всемогущий ИИ»
- OpenAI,
Leave a reply
Для отправки комментария вам необходимо авторизоваться.