Meta представила свої нові найпотужніші моделі Llama 3.1 з відкритим кодом
Компанія Маска Цукерберга Meta представила нову флагманську ШІ-модель Llama 3.1 405B. У своєму блозі техногігант пише, що вона найбільша та найпотужніша з усіх моделей з відкритим кодом та може конкурувати зі своїми «закритими» аналогами, які вважаються кращими.
Meta протестувала Llama 3.1 405B та порівняла характеристики з іншими популярними моделями. Їхня оцінка показує, що оновлена Llama перевершує у деяких завданнях GPT-4 й GPT-4o від OpenAI та Claude 3.5 Sonnet від Anthropic.
Окрім 405B, Meta презентувала менші 8B and 70B. Експеримент показав, що вони конкурентоспроможні з закритими та відкритими моделями, які мають схожу кількість параметрів.
Також йдеться, що Meta внесли зміни до ліцензії та дозволивши розробникам використовувати результати роботи моделей Llama, включно з 405B, для покращення інших моделей.
Параметри машинного навчання моделей Llama доступні для завантаження. Пишуть, що розробники можуть повністю кастомізувати моделі під свої потреби та додатки, тренуватися на нових наборах даних і проводити додаткові налаштування.