Meta, власник Facebook, оголосила про випуск нових ШІ-моделей, зокрема Self-Taught Evaluator, який може стати важливим етапом у зменшенні людської участі у процесі розробки штучного інтелекту. Ця нова модель була вперше представлена у серпневій науковій статті компанії, яка детально описувала, як Self-Taught Evaluator використовує метод «ланцюга міркувань» для ухвалення надійних рішень щодо відповідей інших моделей, повідомляє Reuters.
Метод, який полягає у розбитті складних проблем на менші логічні кроки, покращує точність відповідей на складні питання у таких сферах, як наука, програмування та математика. Дослідники Meta використали повністю згенеровані штучним інтелектом дані для навчання цієї моделі, повністю усунувши людський вплив на цій стадії.
Майбутнє самоадаптивних ШІ-агентів
Можливість використання штучного інтелекту для перевірки роботи інших моделей відкриває шлях до створення автономних AI-агентів, які можуть навчатися на власних помилках. Це може усунути необхідність у поточних методах навчання, таких як Reinforcement Learning from Human Feedback, який часто потребує спеціалістів для анотації та перевірки відповідей на складні запити.
«Ми сподіваємося, що зі зростанням можливостей штучного інтелекту він ставатиме все кращим у перевірці власної роботи, навіть краще, ніж середній людський користувач», — зазначив Джейсон Вестон, один із дослідників проєкту.
Конкуренція на ринку AI
Інші компанії, такі як Google та Anthropic, також досліджують концепцію Reinforcement Learning from AI Feedback. Проте на відміну від Meta, більшість цих компаній не випускають свої моделі для публічного використання.
Крім того, Meta випустила й інші ШІ-інструменти, включно з оновленням для моделі сегментації зображень Segment Anything, інструменти для прискорення генерації відповідей великими мовними моделями (LLM) та набори даних для допомоги у відкритті нових неорганічних матеріалів.
Цей прорив може стати важливим етапом на шляху до створення самовдосконалювальних AI-моделей, здатних виконувати широке коло завдань без втручання людини.
Нашадаємо, нещодавно Meta анонсувала Movie Gen — генератор відео на основі штучного інтелекту.
Читайте також на ProIT: OpenAI запустила ChatGPT для Windows — і він змінює офісні програми.
Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!