Можливість пошуку в Інтернеті та перегляду вбудованих цитат значно покращує чат-боти з ШІ, адже вебпошук може зменшити так звані галюцинації (тобто, коли генеративний ШІ видає невірну інформацію). Ось чому французький стартап Linkup створює API, який дозволяє розробникам отримувати доступ до вебконтенту із надійних джерел преміум-класу та передавати результати до великої мовної моделі (LLM), щоб збагатити її відповіді. Багато розробників ШІ називають цей робочий процес Retrieval-Augmented Generation (або RAG), повідомляє TechCrunch.
Однак майбутнє таких ботів невизначене. Якщо між видавцями контенту та організаціями, які збирають вебсторінки, немає попередньої фінансової угоди, ці боти витягають контент із відкритої мережі без оплати, і багато людей не в захваті від цього, що посилює регулятивний контроль навколо навчання ШІ.
Зараз також триває судовий процес між OpenAI, виробником ChatGPT, і New York Times, тому ситуація навколо вебзбирання може змінитися найближчим часом. Ось чому OpenAI підписав багаторічні ліцензійні угоди щодо контенту з великими видавцями, такими як AP, Axel Springer, Condé Nast, El País, Financial Times, Le Monde та іншими.
«Ми заснували компанію приблизно в той час, коли OpenAI укладав угоди з джерелами новин… для навчання чи висновків, щоб розширити відповіді з моделей OpenAI та їхніх продуктів. І ми подумали: «Добре, це чудово, тому що нарешті у нас є компанії штучного інтелекту, які оплачують свої джерела», — сказав TechCrunch співзасновник і генеральний директор Linkup Філіп Мізрахі, розповідаючи, що спонукало засновників створити бізнес, щоб об’єднати розробників штучного інтелекту із постачальники контенту для, сподіваємося, їхньої взаємної вигоди.
Наразі видавці контенту стикаються з важкими рішеннями щодо того, що робити щодо жаги GenAI до даних. Вони можуть блокувати його за допомогою необов’язкового файлу метаданих robots.txt, який вказує, чи можна використовувати вебсайт для навчання моделі штучного інтелекту чи ні.
Також вони можуть подати до суду на компанії ШІ, які, на їхню думку, порушили їхні авторські права. Крім того, вони можуть дозволити ботам вільно індексувати свій контент або зможуть ліцензувати контент розробникам ШІ, щоб отримати певну винагороду за свою інтелектуальну власність.
Але є тисячі технологічних компаній, які використовують ШІ, але не мають такого масштабу та охоплення, як OpenAI. Чудовим в Інтернеті є те, що існує довгий хвіст видавців контенту. Це означає, що невеликий видавець контенту зазвичай не має достатньо фінансових ресурсів, щоб подати позов. Це також означає, що для мільйонів вебсайтів буде важко перейти від моделі копіювання до моделі ліцензування.
Ось чому Linkup — це не просто технічне рішення. Це ринок — посередник між видавцями контенту та компаніями, які хочуть розширити відповіді LLM своїм вебконтентом.
Linkup підписує ліцензійні угоди щодо контенту з видавцями та інтегрується з їхньою CMS, щоб отримувати контент від видавців без будь-якого копіювання. Потім Linkup платить контент-партнерам залежно від того, як часто клієнти Linkup переглядають їхній контент.
Спочатку Linkup вирішив зосередитися на корпоративній та бізнес-інформації. Окрім новинних вебсайтів, стартап працює із базами даних знань — Statista, Xerfi та інші ресурси в тому ж дусі.
Це не єдиний стартап, який працює над наданням преміум-контенту LLM за допомогою ліцензійних контрактів. Найпомітнішим конкурентом є ScalePost — стартап, який співпрацює із Perplexity, щоб прискорити свої ліцензійні угоди з видавцями.
Кілька місяців тому Linkup залучив початковий раунд у розмірі €3 мільйонів ($3,2 мільйона) від Axeleo Capital, Motier Ventures, Seedcamp і сотні бізнес-ангелів. Зараз у стартапі працює близько 10 людей, і протягом наступного року він планує найняти ще 10 співробітників.
Читайте також на ProIT, як ШІ-стартап Metaphysic допомагає голлівудським режисерам знімати кіно.
Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!