Статистика моделей ШІ Llama 4 вводить користувачів в оману

Нові моделі штучного інтелекту від Meta опинились в центрі скандалу

08/04/2025, 22:00:48

Для реклами публічної версії штучного інтелекту використали статистику недоступної експериментальної версії.

На вихідних Meta випустила дві нові моделі штучного інтелекту Llama 4 - легку Scout і середньоформатну Maverick, яка, за словами компанії, перевершує GPT-4o та Gemini 2.0 Flash у широкому спектрі популярних тестів. Але, як виявилося, статистика від Meta вводить користувачів в оману, повідомляє The Verge.

У пресрелізі щодо випуску моделей ШІ Meta підкреслила їхній чудовий результат у рейтингу LMArena - платформі, де користувачі порівнюють ШІ-моделі в режимі чату та голосують за найкращі. Згідно з інформацією компанії, Maverick посіла друге місце з ELO-рейтингом 1417 - вище GPT-4o від OpenAI і лише трохи позаду Gemini 2.5 Pro.

Однак користувачі помітили примітку в документації Meta, де зазначено, що тестувалася не публічна модель, а експериментальна версія, спеціально оптимізована для розмовної взаємодії. Компанія не повідомила про це одразу, а лише згодом підтвердила, що використовувався кастомізований варіант - Llama-4-Maverick-03-26-Experimental, створений для кращого враження в чаті.

У відповідь керівництво LMArena звинуватило Meta в тому, що вона не відповідає їхнім очікуванням від постачальників ШІ-моделей, і вже почали оновлювати свої правила, щоб уникнути подібних ситуацій у майбутньому. У компанії вважають, що коли постачальники можуть надавати спеціально налаштовані версії своїх моделей для тестування, одночасно випускаючи зовсім інші для громадськості, такі рейтинги, як LMArena, стають менш вагомими як індикатори реальної продуктивності.

Нагадаємо, раніше повідомлялося, що новий тест для штучного інтелекту не проходить жодна модель ШІ.

Cloudflare створила ШІ для обману ботів, що збирають інформацію для ШІ

Новини від Корреспондент.net в Telegram та WhatsApp. Підписуйтесь на наші канали https://t.me/korrespondentnet та WhatsApp

Мы в соціальних мережах

Showreel

Источники

Категории

Нові моделі штучного інтелекту від Meta опинились в центрі скандалу

США запроваджують із середи 104% мита проти Китаю

США запроваджують 104% мита проти Китаю із середи

Росіяни вдарили по Харкову, виникла пожежа

Лідер середняка Серії А - в центрі уваги клубів АПЛ

Кая Каллас: спроби розділити Боснію і Герцеговину є неприйнятними

США запровадили 104% мита проти КНР - Білий дім

Наполі має намір посилитися гравцем Шахтаря

Працівники DOGE вистежують повідомлення з критикою Трампа за допомогою ШІ – Reuters

Розвідка розшукала 39 суден "зернового флоту РФ"

В Японії за 6 годин за допомогою 3D принтера збудували залізничну станцію

ДБР провело обшуки у депутата Київради Білоцерковця

Фахівці ГУР відбили кібератаку на портал War&Sanctions

Нападник Мілана зацікавив турецькі клуби, де грають українці

ЄС обговорить збільшення поставок газу зі США для заміни російського

В Україні задекларували понад 6200 одиниць зброї - МВС

Apple втратила $638 млрд за три дні

У РФ анонсували другий раунд переговорів зі США

Україна і Швейцарія підписали Меморандум про співпрацю для розвитку громад

Гравець Шахтаря - серед десятки найкращих у світі на своїй позиції за CIES

Мінкульт дозволив побудувати 16-поверхівку на набережній Ужгорода упритул до історичного району

Уряд схвалив звіт про виконання держбюджету

Італія готується збільшити витрати на оборону до 2%

Сибіга розкрив деталі ресурсної угоди зі США

В Україні заборонили обіг восьми найменувань лікарських засобів

Активи генерала армії рф Капашина у Полтаві оцінили у майже 700 млн грн — АРМА

Reuters: Департамент Маска використовує ШІ для стеження за федеральними працівниками

На Полтавщині судитимуть шахраїв, які спустошували рахунки українців

ПАРЄ схвалила резолюцію, яка визнає іноземне втручання Росії прямою загрозою демократії

Уболівальники Атлетіко вимагатимуть від УЄФА відеозапис пенальті Альвареса

В Україні заборонила обіг восьми найменувань лікарських засобів

Клуби АПЛ зацікавилися сином відомого тренера

ЗСУ знищили військові склади росіян на Курщині

Вбивство військового в Харкові: поліція розповіла про вбивцю-агента ГРУ

В Росії оголосили вирок сімом воїнам ЗСУ, полоненим на Курщині

Трамп вимагає оплатити "військовий захист" Сеула

Статки Воррена Баффетта зросли на $11,5 млрд

Півзахисник Барселони визначився з майбутньою кар'єрою

В Польщі заявили, що допомога США Україні триває

Перший безплатний пункт прокату крісел колісних і милиць відкрили в Броварах