DeepSeek
Чому всі говорять про AGI й що це таке насправді
Після появи ChatGPT технологічні компанії США та Китаю інвестували сотні мільярдів доларів у дата-центри, чипи й таланти, намагаючись перевершити одна...
Читати
DeepSeek презентувала open-source модель, яка стискає документи у 10× при збереженні змісту
DeepSeek оприлюднила DeepSeek-OCR — відкриту модель, яка перевертає уявлення про те, як великі мовні моделі мають обробляти інформацію. Дослідники показали, що...
Читати
DeepSeek представив нову експериментальну модель V3.1-Exp
Китайський стартап DeepSeek анонсував експериментальну модель V3.1-Exp, яку позиціонує як «проміжний етап на шляху до архітектури наступного покоління». Про...
Читати
DeepSeek запровадила обов’язкове маркування ШІ-контенту в Китаї
Компанія DeepSeek оголосила про впровадження обов’язкового маркування всього контенту, створеного за допомогою її платформи. Вимога поширюється на тексти, аудіо...
Читати
LLM-навігатор: що вміють великі мовні моделі і яка підійде вам у 2025 році
Спектр завдань, які виконують LLM (великі мовні моделі) постійно розширюється, так само як і моделі покращують свої здібності з кожним...
Читати
Лайфхаки: як додати ШІ-функції в будь-який Chromium-браузер за допомогою DeepSeek Assistant
Після гучного дебюту минулого року DeepSeek став доступним прямо у Chrome й інших Chromium-браузерах. Тепер його можна встановити як безоплатне...
Читати
Moonshot AI презентувала відкриту модель Kimi K2, яка випереджає GPT-4 в основних тестах
Китайський стартап Moonshot AI, відомий завдяки популярному чатботу Kimi, презентував мовну модель із відкритим кодом, яка напряму конкурує з пропрієтарними...
Читати
Німецький варіант DeepSeek: модель R1T2 Chimera стала удвічі швидшою
Минув лише місяць відтоді, як китайський стартап DeepSeek (підрозділ High-Flyer Capital з Гонконгу) випустив свою нову відкриту LLM-модель DeepSeek R1-0528....
Читати
Розроблення DeepSeek R2 блокує дефіцит графічних процесорів NVIDIA
Найбільша китайська компанія у сфері штучного інтелекту DeepSeek Ltd. змушена відкласти запуск своєї нової моделі R2 для логічного міркування через...
Читати
Google оновила Gemini 2.5 Pro: нова модель перевершує DeepSeek R1 і Grok 3 Beta у продуктивності під час кодування
Google представила оновлену версію попереднього перегляду моделі Gemini 2.5 Pro — найрозумнішої в лінійці, як зазначає компанія. Модель уперше анонсували...
Читати
DeepSeek-R1-0528: китайська відповідь на OpenAI o3 і Google Gemini у форматі open source
Китайський стартап DeepSeek представив нову версію своєї моделі відкритого ШІ — DeepSeek-R1-0528. Це оновлення значно підвищує здатність моделі до логічних міркувань...
Читати
Microsoft заборонила співробітникам користуватися китайським застосунком DeepSeek
Компанія Microsoft заборонила своїм співробітникам використовувати китайський застосунок зі штучним інтелектом DeepSeek. Як повідомляє TechCrunch, про це під час слухань...
Читати
ШІ пропонує вигадані бібліотеки: дослідники попереджають про загрозу
Галюцинації штучного інтелекту — тенденція великих мовних моделей (LLM) давати помилкові, неточні або вигадані відповіді залишаються серйозною проблемою, оскільки використання генеративного...
Читати
Meta презентувала Llama 4 з мультимодальністю і reasoning-first дизайном
У січні 2025 року китайський стартап DeepSeek вивів на ринок відкриту мовну модель DeepSeek R1. Вона не лише перевершила за...
Читати
Alibaba планує випустити Qwen 3 — нову версію свого флагманського ШІ вже цього місяця
Китайський гігант у сфері технологій та e-commerce Alibaba Group готується до випуску Qwen 3 — оновленої версії своєї флагманської моделі штучного...
Читати
Китайський стартап представив безкоштовного ШІ-агента — конкурента DeepSeek
Китайський стартап Zhipu AI представив нового безкоштовного ШІ-агента AutoGLM Rumination, приєднавшись до хвилі запусків агентів в умовах зростання конкуренції на...
Читати
DeepSeek оновила мовну модель: що нового у V3-0324?
Китайський стартап у сфері штучного інтелекту DeepSeek випустив нову велику мовну модель, яка вже сколихнула галузь. Модель обсягом 641 ГБ...
Читати
DeepSeek R1 на Mac Studio? M3 Ultra справляється, але коштує $10 тисяч
YouTube блогер Dave Lee (канал Dave2D) продемонстрував, що новий Mac Studio з чипом M3 Ultra може локально запускати масштабну AI-модель...
Читати
Qwen 2.5: огляд штучного інтелекту від техногіганта Alibaba
Штучний інтелект продовжує стрімко розвиватися, і одним з основних гравців у цій сфері нещодавно став китайський техногігант Alibaba. Його мовні...
Читати
Baidu vs. DeepSeek: китайська боротьба за лідерство в ШІ
Китайський технологічний гігант Baidu Inc. зміцнює свої позиції у сфері штучного інтелекту, представивши дві найпотужніші на сьогодні ШІ-моделі. Серед них...
Читати
Google представила Gemma 3 — велику мовну модель, яка працює на одному GPU
Google представила Gemma 3 — нову версію великої мовної моделі (LLM) із відкритим кодом, розроблену на основі технологій Gemini 2.0....
Читати