Китайський стартап DeepSeek представив прев’ю-версію нової моделі
Значок китайського додатка DeepSeek на екрані мобільного телефонуКитайський стартап DeepSeek представив прев’ю-версію моделі V4, повідомляє DW.
Ця довгоочікувана модель наступного покоління здатна опрацьовувати обсяг інформації до одного мільйона слів за раз.
DeepSeek-V4 має дві версії: професійну та дешевшу флеш-версії. V4-Pro має 1,6 трильйона параметрів, тоді як V4-Flash – 284 мільярди. Кількість параметрів визначає здатність моделі приймати рішення.
У тестах на загальні знання DeepSeek-V4-Pro значно випереджає інші доступні моделі і лише трохи поступається лідеру ринку – Gemini-Pro-3.1 від Google.
Попередній випуск потрібен компанії, щоб зібрати відгуки користувачів і доопрацювати модель перед офіційним релізом.
DeepSeek викликав ажіотаж у січні минулого року, коли компанія представила генеративний чат-бот на базі ШІ з можливостями, які конкурували з американськими продуктами, такими як ChatGPT, але для розробки якого, за інформацією компанії, знадобилося значно менше обчислювальної потужності та коштів.
Компанія також опинилася в центрі скандалу. Наприклад, чат-бот уникав запитань на політично чутливі теми, зокрема про розгін протестів на площі Тяньаньмень у 1989 році, що викликало сумніви через цензуру.
США та американські конкуренти звинуватили стартап із Ханчжоу в неналежній та незаконній поведінці. У четвер Білий дім заявив, що китайські організації проводять масштабні кампанії з викрадення американських розробок у сфері штучного інтелекту.
Пекін назвав звинувачення безпідставними додавши, що Китай “надає великого значення захисту прав інтелектуальної власності”.










