Китайська лабораторія DeepSeek презентувала дві preview-версії нової великої мовної моделі DeepSeek V4. Це очікуване оновлення після V3.2 та reasoning-моделі R1, які раніше привернули значну увагу на ринку.
Компанія випустила дві модифікації — V4 Flash і V4 Pro. Обидві моделі побудовані за архітектурою mixture-of-experts і підтримують контекст до 1 мільйон токенів, що дає можливість працювати з великими кодовими базами та документами. Такий підхід передбачає активацію лише частини параметрів для кожного запиту, що знижує вартість обчислень.
Старша модель V4 Pro має 1,6 трлн параметрів (49 млрд активних), що робить її найбільшою open-weight моделлю на ринку. Вона випереджає Moonshot AI Kimi K 2.6 (1,1 трильйона параметрів), MiniMax M1 (456 мільярдів) і більше ніж удвічі перевищує DeepSeek V3.2 (671 мільярд). Молодша V4 Flash має 284 мільярди параметрів (13 мільярдів активних).
За заявою компанії, обидві моделі демонструють вищу ефективність і продуктивність порівняно з попереднім поколінням та майже закривають розрив із провідними моделями (як відкритими, так і закритими) у тестах на логічне мислення.
У DeepSeek також стверджують, що модель V4-Pro-Max перевершує open-source конкурентів у reasoning-бенчмарках і випереджає OpenAI GPT-5.2 та Google Gemini 3.0 Pro у деяких завданнях. У задачах із програмування продуктивність моделей V4 порівнянна з GPT-5.4.
Водночас у тестах на знання моделі дещо поступаються передовим рішенням, зокрема GPT-5.4 і Gemini 3.1 Pro. За оцінкою DeepSeek, це відповідає відставанню приблизно на 3–6 місяців від найсучасніших моделей.
Обидві версії підтримують лише текст, на відміну від багатьох конкурентів, які працюють із аудіо, відео та зображеннями.
Однією з переваг DeepSeek V4 є ціна. V4 Flash коштує $0,14 за 1 мільйон вхідних токенів і $0,28 за 1 мільйон вихідних, що дешевше за GPT-5.4 Nano, Gemini 3.1 Flash та Claude Haiku 4.5. Модель V4 Pro ($0,145 за вхідні та $3,48 за вихідні токени) також дешевша за Gemini 3.1 Pro, GPT-5.5 і Claude Opus 4.7.
Запуск відбувся на тлі звинувачень з боку США щодо масштабного використання Китаєм проксі-акаунтів для отримання доступу до інтелектуальної власності американських AI-лабораторій. Раніше Anthropic та OpenAI також звинувачували DeepSeek у дистиляції їхніх моделей.
Раніше ми повідомляли, що Китай переходить на власні AI-чипи.
Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!