Mistral запускає модель для кодингу Devstral
Французький ШІ-стартап Mistral запускає нову модель штучного інтелекту для програмування Devstral, створену у співпраці з компанією All Hands AI. Mistral заявляє, що вона перевершує всі відкриті моделі за результатами SWE-Bench Verified.
У стартапі кажуть, що хоча типові LLM чудово справляються з окремими задачами програмування, але мають труднощі із розв’язанням реальних інженерних проблем. Адже це вимагає розуміння великої кодової бази, виявлення зв’язків між різними компонентами та пошуку прихованих помилок у складних функціях.
«Devstral створено для вирішення саме таких проблем. Модель навчена вирішувати реальні проблеми з GitHub. Вона працює через агентні інтерфейси (code agent scaffolds), такі як OpenHands або SWE-Agent, які визначають зв’язок між моделлю та тестами», — йдеться у блозі.
Стартап демонструє, що його нова модель досягає результату 46,8 % на SWE-Bench Verified, що перевищує попередні відкриті моделі SoTA (state-of-the-art) більш ніж на 6%.

Зображення Mistral
Devstral досить легка, щоб працювати на одній відеокарті RTX 4090 або Mac з 32 ГБ оперативної пам’яті, тому її можна розгорнути прямо на пристрої.
Платформи кодування, як-от OpenHands, дозволяють моделі взаємодіяти з локальними кодовими базами та швидко знаходити рішення для проблем.
Devstral випускають безкоштовно під ліцензією Apache 2.0. Модель також доступна через API під назвою devstral-small-2505, за тією ж ціною, що й Mistral Small 3.1:
- $0,1 за мільйон вхідних токенів,
- $0,3 за мільйон вихідних токенів.
Також модель вже можна завантажити на таких платформах, як HuggingFace, Ollama, Kaggle, Unsloth, LM Studio.
У Mistral кажуть, що Devstral це попередній дослідницький реліз. А зараз компанія працює над більшою агентною моделлю для кодування, «яка з’явиться протягом кількох тижнів».
Нагадаємо, французький стартап вже має ШІ-модель для програмування Codestral. Але вона має ліцензію, що не дозволяє розробникам користуватися нею з комерційними цілями.