Найбільш креативні та значущі ідеї у світі програмного забезпечення часто з'являються у форматі відкритого коду. Спільне використання коду дає можливість глобальній спільноті розробників працювати разом і просувати проєкт вперед. Штучний інтелект не є винятком.
Info World пропонує розглянути 11 проєктів із відкритим кодом, які полегшують роботу розробників. Деякі з них оптимізують процес навчання моделей, інші допомагають знайти або отримати доступ до необхідних джерел даних. Це продуктивні хитрощі, оптимізатори продуктивності, SQL-інструменти тощо.
Upscayl
Іноді зображення потребує трохи більше деталей, щоб виглядати краще на сторінці. Upscayl (проєкт можна знайти на GitHub) підвищує роздільну здатність зображень, додаючи чіткість і деталі. Якщо у вас є відповідне обладнання, це чудовий спосіб покращити цифрове мистецтво або додати деталей до фотографії. Однак варто пам’ятати, що ШІ фактично «винаходить» ці деталі. Це означає, що Upscayl ідеально підходить для покращення вигаданих зображень, створених цифровими художниками, але не настільки ефективний для зображень, які потребують абсолютної точності, наприклад, при документуванні доказів на місці злочину.
Nyro
Розробники часто взаємодіють із операційною системою через командний рядок. Хоча ці дії здаються дріб’язковими, час, витрачений на них, швидко накопичується. Nyro — це проєкт із відкритим кодом, створений на основі Electron, який автоматизує повсякденні завдання, такі як створення скріншотів, зміна розмірів вікон та синхронізація даних між додатками. Автоматизація подібних завдань допомагає заощадити безліч невеликих фрагментів часу, що в підсумку призводить до значного підвищення продуктивності.
Geppetto
Деякі команди розробників працюють переважно у Slack-каналах, тож їхні пости стають хорошою основою для першого покоління документації. Geppetto — це Slackbot, який підключає ваші канали до кількох мовних моделей (OpenAI, Anthropic і Gemini), що здатні очистити й удосконалити ваші думки. Geppetto також може надіслати запит на DALL-E, якщо вам потрібні зображення для доповнення вашої документації.
E2B sandboxes
Найперші мовні моделі (LLM) відповідали на питання та, можливо, створювали трохи мистецтва, використовуючи всі знання з їхнього навчального набору. Але що, якби вони могли вільно подорожувати Інтернетом і користуватися тими ж інструментами, що й люди? E2B — це агент-пісочниця, яка дозволяє LLM підключатися до багатьох інструментів, що ми використовуємо щодня: веббраузерів, GitHub-репозиторіїв та командних інструментів, таких як лінтери. Тепер LLM можуть використовувати потужність цих інструментів для виконання корисних завдань, як-от управління хмарною інфраструктурою, щоб люди не мали цього робити.
Dataline
Не кожен хоче завантажувати всі свої дані в далекий GPU для навчання ШІ. Dataline використовує мовну модель для генерування SQL-запитів, що витягують дані з бази. Потім код створює звіт з науки про дані, використовуючи локальне підключення до місцевих даних. Це гібридний підхід, що поєднує класичні алгоритми аналізу даних із LLM, які їх спрямовують.
Swirl Connect
Іноді потрібно почати працювати з набором даних, але не хочеться витрачати час на їх вилучення та переформатування. Якщо набір даних великий, ці процеси можуть бути дуже трудомісткими. Swirl Connect (проєкт можна знайти на GitHub) пов'язує багато стандартних баз даних із більшістю стандартних мовних моделей і систем RAG-пошуку. Усі потрібні дані зібрані в одному місці, і ви можете зосередитися лише на навчанні.
DSPy
З появою мовних моделей виникла нова спеціалізація — інженерія запитів. На відміну від алгоритмів, які використовують розробники, інженери запитів працюють з формулюваннями та пишуть довгі інструкції, щоб отримати від LLM саме те, що потрібно. Це робота, яка вимагає вміння вести діалоги та маніпулювати LLM. DSPy — це інструмент, що прагне впровадити більш систематичний підхід до навчання мовних моделей. Замість слів і фраз DSPy поєднує модулі та оптимізатори, розміщуючи їх у конвеєр для LLM. Розробники, які використовують DSPy, можуть витрачати менше часу на лінгвістичні нюанси й більше — на роботу з кодом.
Guardrails
Одним із викликів генеративного ШІ є збереження правильного курсу роботи системи. Інженери Portkey Gateway знайшли спосіб додати більше контролю до конвеєра генеративного ШІ. Асинхронні функції, відомі як «запобіжники» (guardrails), можуть відстежувати розвиток відповідей, створених ШІ, та голосувати на різних етапах конвеєра. Кожне голосування уточнює відповідь, що має призвести до зменшення кількості помилок і досягнення більшої точності.
Unsloth
Навчання базової мовної моделі на новому наборі даних зазвичай коштує дорого. Unsloth — це інструмент, розроблений для оптимізації такого навчання для деяких найбільш поширених відкритих моделей. За деякими даними, версія цього інструменту з відкритим кодом працює у 2-5 разів швидше, ніж без Unsloth, а професійна версія — у 30 разів швидше. Ретельно написаний код ядра зменшує використання пам'яті, зберігаючи або навіть підвищуючи точність.
Wren AI для SQL
Більшість даних у світі зберігається у величезних таблицях, часто доступних через SQL. На жаль, мало хто вміє писати чудові SQL-запити. Навіть досвідчені програмісти іноді мають труднощі з написанням швидких і ефективних SQL-запитів. Wren AI — це інтерфейс на основі природної мови для SQL. Ви ставите питання звичайною мовою, і ШІ перекладає їх на SQL, заощаджуючи всім трохи часу та нервів.
AnythingLLM
У багатьох людей сьогодні є величезна кількість цифрових документів, збережених на майбутнє. Проблема в тому, щоб знайти потрібну цитату або дані, коли це необхідно. AnythingLLM організовує вашу купу документів у щось корисне. Ви просто завантажуєте документи в будь-яку мовну модель або систему пошуку RAG, а потім запитуєте її, щоб отримати потрібні відповіді. Інструмент працює на Linux, macOS або Windows, і відповіді можуть надаватися у різних форматах, включаючи розпізнавання мовлення.
Читайте також на ProIT: Deno 2.0 готовий до конкуренції з Node.js.
Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!