Стартап Nous Research, відомий своєю прихильністю до руху open-source, оголосив про реліз Hermes 4 — сімейства великих мовних моделей, які, за заявами фахівців компанії, не поступаються закритим системам і дають користувачам безпрецедентний рівень контролю. Про це повідомляє Venture Beat.
Головна відмінність Hermes 4 — мінімальні обмеження контенту. На відміну від OpenAI, Google чи Anthropic, моделі Nous відповідають практично на будь-які запити без стандартних захисних бар’єрів.
Hybrid reasoning: прозорість мислення
Hermes 4 запроваджує режим hybrid reasoning, який дасть можливість перемикатися між швидкими відповідями та детальними покроковими міркуваннями. У reasoning-режимі модель генерує власні ланцюжки думок у тегах <think>
, перш ніж видати підсумкову відповідь.
Результати тестів:
• модель на 405 мільярдів параметрів показала 96,3% на MATH-500;
• отримала 81,9% на AIME’24 — рівень, що перевищує багато комерційних систем;
• на бенчмарку RefusalBench Hermes 4 відмовлялася відповідати лише у 57,1% випадків, тоді як GPT-4o — у 17,67%, Claude Sonnet 4 — у 17%.
DataForge й Atropos: нова архітектура навчання
Hermes 4 створено на основі таких систем:
• DataForge — генератор синтетичних даних, який перетворює звичайні тексти на складні приклади (наприклад, стаття з Wikipedia → реп-пісня → питання-відповіді);
• Atropos — open-source RL-фреймворк із сотнями спеціалізованих середовищ, де моделі тренуються у математиці, коді, креативному письмі тощо.
Навчання найбільшої моделі потребувало 192 GPU NVIDIA B200 та 71 616 GPU-годин.
«Без цензури»: філософія Nous Research
Компанія позиціонує Hermes 4 як керовані моделі, які можна налаштовувати без обмежень.
«Hermes 4 не обтяжений відмовками та правилами, які гальмують інновації», — написав інвестор Томмі Шонессі.
Цей підхід робить Nous Research популярним серед дослідників і девелоперів, хоча й ставить компанію у центр дискусій про баланс між безпекою і свободою користувачів.
Де спробувати Hermes 4
• Модельні ваги доступні на Hugging Face;
• API інтегровано у Nous Chat із підтримкою пам’яті та паралельних взаємодій;
• партнери для інференсу: Chutes, Nebius, Luminal.
Hermes 4 орієнтований на ентерпрайз-користувачів і дослідників, яким потрібна кастомізація або робота з чутливим контентом.
Hermes 4 — це не просто ще одна модель, а виклик Big Tech. Попри відсутність мільярдних бюджетів, Nous Research демонструє, що невеликий стартап може створювати конкурентоспроможні системи.
Компанія ставить під сумнів концепцію безпечних бар’єрів, наполягаючи на прозорості та контролі користувача. Її підхід може або відкрити нову еру відкритих інновацій, або створити ризики через відсутність фільтрів.
Читайте також на ProIT: AWS, Microsoft і Google створюють відкриту альтернативу MongoDB під егідою Linux Foundation.
Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!