Microsoft оголосила про випуск Phi-4 — нової ШІ-моделі із 14 мільярдами параметрів, призначеної для виконання складних завдань у сфері математики та STEM. Phi-4 демонструє високі показники у відповідях на питання та вирішенні складних проблем, перевершуючи аналогічні моделі за продуктивністю, повідомляє Computer World.
Phi-4 належить до серії малих мовних моделей (SLMs) Phi. Зараз модель доступна через Azure AI Foundry за ліцензійною угодою Microsoft Research і буде представлена на платформі Hugging Face наступного тижня.
Основні переваги Phi-4
Phi-4 була створена з акцентом на ефективність і точність завдяки вдосконаленим методам тренування та ретельному добору даних. Для порівняння: великі мовні моделі (LLMs), такі як ChatGPT 4 і Google Gemini Ultra, працюють із сотнями мільярдів параметрів.
«Phi-4 перевершує порівнювані й навіть більші моделі у завданнях, пов’язаних із математичними розрахунками, завдяки процесу тренування, що включає синтетичні набори даних, органічно відібрані дані та інноваційні post-training», — зазначено в оголошенні Microsoft.
Конкуренція з іншими моделями
Phi-4 використовує новий підхід до тренування, який інтегрує багатозадачні підказки й інновації, орієнтовані на дані, для покращення ефективності міркувань. У технічному звіті Microsoft зазначено, що модель досягла 80,4 бала за MATH-бенчмарком і перевершила інші системи в оцінках розв’язання задач і міркувань.
Phi-4 напряму конкурує з такими моделями:
- GPT-4o Mini (OpenAI): оптимізована для економного обслуговування клієнтів.
- Claude 3 Haiku (Anthropic): спеціалізується на узагальненні й аналізі юридичних або неструктурованих документів.
- Gemini 1.5 Flash (Google): ефективна у мультимодальних застосунках, включно з аналізом відео, аудіо й великих текстових наборів.
Етичний акцент Microsoft
Microsoft наголосила на своєму прагненні до етичної розробки AI, впровадивши розширені функції безпеки у Phi-4. Модель оснащена такими функціями Azure AI Content Safety:
- захист від шкідливих підказок;
- виявлення захищених матеріалів;
- моніторинг у реальному часі.
Крім того, платформа Azure AI Foundry дає змогу розробникам оцінювати та вдосконалювати моделі завдяки вбудованим метрикам і спеціальним оцінкам безпеки.
Вплив на індустрію
Ефективність і потужні аналітичні можливості Phi-4 можуть змусити компанії переглянути взаємозв’язок між розміром моделі та продуктивністю. Очікується, що Phi-4 знайде застосування у наукових обчисленнях, STEM-дослідженнях і корпоративній автоматизації, де важливі точність і безпека.
«Phi-4 є прикладом того, як менші моделі можуть забезпечувати високу продуктивність і точність, залишаючись ефективними», — зазначено у технічній документації.
Раніше ми повідомляли, що Meta представила найновішу і найпотужнішу ШІ-модель Llama 3.1.
Читайте також на ProIT, що нові моделі Microsoft Phi 3.5 LLM перевершують Meta та Google.
Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!