Anthropic представила гібридну ШІ-модель для вдосконаленого логічного аналізу

Anthropic запустила нову гібридну ШІ-модель, яка може генерувати відповіді в реальному часі або покроково пояснювати свої розрахунки. Як повідомляє Silicon Angle, це має надати Anthropic конкурентну перевагу у сфері генеративного штучного інтелекту.

Випуск Claude 3.7 Sonnet відбувається на тлі жорсткої конкуренції між американськими та китайськими ШІ-компаніями, такими як DeepSeek та Alibaba.

Нові можливості Claude 3.7 Sonnet

Ця модель є найдосконалішою серед усіх ШІ-рішень Anthropic і вже доступна на всіх тарифних планах: Free, Pro, Team та Enterprise. Однак функція режиму розширеного мислення доступна лише для платних підписників.

Що нового в режимі розширеного мислення:

Модель сама аналізує питання перед тим, як відповісти.
Покращена точність у математиці, фізиці, кодуванні та виконанні інструкцій.
Вища ефективність під час вирішення складних завдань.

Компанія наголошує, що цей ШІ більше орієнтований на реальні бізнес-завдання, а не лише на обчислення та наукові проблеми.

Claude Code: AI-асистент для розробників

Разом із новою моделлю Anthropic презентувала Claude Code — AI-інструмент для автоматизованої допомоги у програмуванні. Він допомагає розробникам у таких завданнях:

Аналіз проєктної структури.
Модифікація кодової бази на основі текстових запитів.
Автоматичне тестування змін та інтеграція з GitHub.

Claude Code поки доступний у тестовому режимі для обмеженої кількості користувачів.

Claude 3.7 Sonnet коштує $3 за 1 мільйон вхідних токенів і $15 за 1 мільйон вихідних токенів.

Для порівняння, аналогічні моделі OpenAI та DeepSeek значно дешевші, проте користувачі Anthropic отримують розширені можливості без додаткових витрат порівняно із попереднім поколінням Claude 3.5 Sonnet.

Конкурентні переваги Anthropic

Claude 3.7 Sonnet працює за методом поетапного аналізу. Він розбиває запит на кілька частин, аналізує кожну з них окремо, а потім формує відповідь.

Згідно з результатами тестування:

У реальних сценаріях програмування SWE-Bench модель Claude 3.7 Sonnet набрала 62,3%, що перевищує показники OpenAI o3-mini (49,3%) та DeepSeek R1 (49,2%).
У тесті TAU-Bench, що оцінює інтеграцію з API та симульованими користувачами, Claude 3.7 Sonnet досяг 81,2% проти 73,5% в OpenAI o1.

Крім того, Claude 3.7 Sonnet відхиляє менше запитів. Він краще розрізняє шкідливі та нейтральні запити, що знижує кількість необґрунтованих відмов у відповідях.

За даними Wall Street Journal, Anthropic веде переговори про залучення $3,5 мільярдів інвестицій, що значно перевищує початкову мету у $2 мільярди. У результаті оцінка компанії може зрости до $61,5 мільярдів.

Очікується, що провідним інвестором стане Lightspeed Venture Partners. Також участь візьмуть General Catalyst й інші фонди.

Раніше ми повідомляли, що компанії Snowflake та Anthropic оголосили про стратегічне партнерство з метою інтеграції агентів штучного інтелекту безпосередньо у корпоративні середовища даних.

Це дасть можливість підприємствам аналізувати великі обсяги інформації з використанням як структурованих даних із баз даних, так і неструктурованого контенту (документів тощо) у межах наявних систем безпеки.

Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!