Microsoft представила Phi-4 — AI-модель для розв’язання складних задач

Microsoft оголосила про випуск Phi-4 — нової ШІ-моделі із 14 мільярдами параметрів, призначеної для виконання складних завдань у сфері математики та STEM. Phi-4 демонструє високі показники у відповідях на питання та вирішенні складних проблем, перевершуючи аналогічні моделі за продуктивністю, повідомляє Computer World.

Phi-4 належить до серії малих мовних моделей (SLMs) Phi. Зараз модель доступна через Azure AI Foundry за ліцензійною угодою Microsoft Research і буде представлена на платформі Hugging Face наступного тижня.

Основні переваги Phi-4

Phi-4 була створена з акцентом на ефективність і точність завдяки вдосконаленим методам тренування та ретельному добору даних. Для порівняння: великі мовні моделі (LLMs), такі як ChatGPT 4 і Google Gemini Ultra, працюють із сотнями мільярдів параметрів.

«Phi-4 перевершує порівнювані й навіть більші моделі у завданнях, пов’язаних із математичними розрахунками, завдяки процесу тренування, що включає синтетичні набори даних, органічно відібрані дані та інноваційні post-training», — зазначено в оголошенні Microsoft.

Конкуренція з іншими моделями

Phi-4 використовує новий підхід до тренування, який інтегрує багатозадачні підказки й інновації, орієнтовані на дані, для покращення ефективності міркувань. У технічному звіті Microsoft зазначено, що модель досягла 80,4 бала за MATH-бенчмарком і перевершила інші системи в оцінках розв’язання задач і міркувань.

Phi-4 напряму конкурує з такими моделями:

GPT-4o Mini (OpenAI): оптимізована для економного обслуговування клієнтів.
Claude 3 Haiku (Anthropic): спеціалізується на узагальненні й аналізі юридичних або неструктурованих документів.
Gemini 1.5 Flash (Google): ефективна у мультимодальних застосунках, включно з аналізом відео, аудіо й великих текстових наборів.

Етичний акцент Microsoft

Microsoft наголосила на своєму прагненні до етичної розробки AI, впровадивши розширені функції безпеки у Phi-4. Модель оснащена такими функціями Azure AI Content Safety:

захист від шкідливих підказок;
виявлення захищених матеріалів;
моніторинг у реальному часі.

Крім того, платформа Azure AI Foundry дає змогу розробникам оцінювати та вдосконалювати моделі завдяки вбудованим метрикам і спеціальним оцінкам безпеки.

Вплив на індустрію

Ефективність і потужні аналітичні можливості Phi-4 можуть змусити компанії переглянути взаємозв’язок між розміром моделі та продуктивністю. Очікується, що Phi-4 знайде застосування у наукових обчисленнях, STEM-дослідженнях і корпоративній автоматизації, де важливі точність і безпека.

«Phi-4 є прикладом того, як менші моделі можуть забезпечувати високу продуктивність і точність, залишаючись ефективними», — зазначено у технічній документації.

Раніше ми повідомляли, що Meta представила найновішу і найпотужнішу ШІ-модель Llama 3.1.

Читайте також на ProIT, що нові моделі Microsoft Phi 3.5 LLM перевершують Meta та Google.

Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!