Аналітики схвально сприймають спроби Oracle застосувати можливості векторного пошуку на природній мові до реляційних даних у бізнес-системах, повідомляє TheRegister.
Минулого тижня на виставці CloudWorld у Лас-Вегасі гігант бізнес-застосунків і баз даних оголосив, що додає AI Vector Search у базу даних 23c, яка має стати наступним довгостроковим релізом.
Векторний пошук є ключовим для використання великих мовних моделей у базі даних. Він став характерною особливістю сучасних NoSQL-баз даних, таких як MongoDB і Cassandra, а PostgreSQL і SingleStore додали його до своїх можливостей. Також існує окрема категорія векторних баз даних від виробників, зокрема Pinecone.
Oracle заявила, що додає до Oracle Database 23c нативний тип даних Vector та «оптимізоване» індексування пошуку за схожістю векторів, спрямоване на покращення продуктивності.
Нові функції та оператори SQL розроблені для полегшення створення, обробки та запитів векторів у поєднанні з іншими моделями даних, які вже підтримуються в Oracle Database, зокрема JSON, просторові та графічні дані.
Big Red повідомили, що нові функції також підтримують Retrieval Augmented Generation (RAG), спосіб поєднання великих мовних моделей (LLM) і приватних бізнес-даних для надання відповідей на питання природної мови.
Компанія стверджує, що RAG забезпечує більш високу точність і дозволяє уникати потреби у розголошенні конфіденційних даних завдяки включенню їх у навчальні дані LLM.
Ці функції включено до Oracle Database 23c як послугу бази даних Oracle Cloud Infrastructure. Релізи заплановані для Oracle Database On-premises, Exadata, Exadata Database Service, Exadata Cloud@Customer та Autonomous Database (ADB).
Аарон Розенбаум, старший директор-аналітик Gartner, говорить:
«Векторні типи даних та індекси стануть стандартом для всіх баз даних. Відмінність, яку Oracle виводить на ринок, полягає у тому, як ці нові функції взаємодіють зі всіма іншими можливостями їхніх продуктів. Наприклад, векторний пошук буде поєднаний з реляційними запитами та графових запитів «Знайди мені книги, схожі на ту, яку я щойно читав, що є в наявності, доступні англійською, які сподобалися моїм друзям або їхнім друзям. Oracle має глибші функції, ніж багато згаданих вище баз даних, тому вони мають більше способів комбінувати та використовувати векторний пошук у всьому продукті».
Векторний пошук покращить алгоритми пошуку в галузях обслуговування клієнтів, боротьбі з шахрайством, у національній безпеці та багатьох інших сферах. Інтеграція цієї функції у загальнопризначену базу даних також дасть змогу уникнути видобування даних для завдань Gen AI, зауважив Розенбаум.
«Обидва підходи використовуються сьогодні для створення прикладних програм Generative AI на основі бізнес-даних. Існуватиме група користувачів та програм, для яких найкраще зберігати вбудовані дані в тій самій базі даних, що і вихідні дані. Хоча це не буде у 100% випадків застосуванням Generative AI, але якщо це зручно і потужно, воно буде частиною стратегії багатьох клієнтів Oracle з управління даними», – сказав він.
Карл Олофсон, віцепрезидент IDC із досліджень, сказав, що Oracle був одним із перших лідерів у запровадженні векторного пошуку в системах бізнес-даних.
«Вектори є частиною більшого рішення AI/ML, і хоча існує кілька таких рішень для неструктурованих даних (тексту, зображень, аудіо), наскільки мені відомо, немає жодного, що стосується структурованих даних, особливо реляційних даних. Ми бачили ранні демонстрації їхньої можливості GenAI, яка стане частиною версії 23c, у створенні SQL та відповіді на SQL-розширення для проведення проксимальних пошуків. Інтеграція Oracle цієї функціональності в Oracle Database робить її більш ефективною та операційно ефективною, ніж інші можливі ШІ-підходи, спрямовані на структуровану базу даних», – сказав Олофсон.
AI Vector Search став «великим анонсом» Oracle в області баз даних, оскільки він дозволяє підтримку векторних вбудовань у системі баз даних, говорить Ноель Юханна, віцепрезидент і головний аналітик з досліджень у Forrester Research.
«Це все ще відносно нове для всіх, включно з Oracle, щодо підтримки векторних вбудовань у базу даних. Цінна пропозиція Oracle полягає у підтримці векторних і невекторних даних разом в одній базі даних для підтримки семантично керованих LLM. Крім того, вони оголосили про підтримку Generative AI для баз даних Oracle з генерацією SQL через LLM і генерацію додатків APEX. APEX став ключовою відмінністю для Oracle, low-code інструментом, який дозволяє організаціям швидко створювати застосунки. Генерація застосунків APEX виводить цей інструмент на новий рівень, пропонуючи розробку застосунків без коду, що, безперечно, допоможе прискорити використання», –додав Юханна.
Pаніше ми розповідали про 6 ключових ШІ-оновлень Oracle.
Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!