ChatGPT та Google Bard: розумний пошук інформації

На відміну від більшості сервісів, які швидше використовували прості алгоритми та називали це ШІ, ChatGPT (https://chat.openai.com) та Google Bard (https://bard.google.com) вийшли справді розумними. Обидві моделі навчили на величезних об'ємах тексту, що в мільйон разів перевищують об'єм всіх творів Шекспіра, що суттєво розширило сферу знань, а самі ШІ розуміють контекст розмови та можуть вести осмислений діалог. Що ще крутіше, помічник може допомагати з оформленням документів та презентацій, перекладати тексти з інших мов, перевіряти код на помилки, допомагати зі складанням юридичних запитів, читати замість вас тексти, роблячи для вас короткі резюме написаного та ще багато чого. Тобто це далеко не ті примітивні алгоритми машинного навчання, які натаскали на виконання якогось єдиного завдання та назвали це ШІ, щоб вибити більше грошей з інвесторів.

Стартова сторінка для діалогу з ChatGPT.

У цьому матеріалі ми поговоримо про ChatGPT та Google Bard у контексті пошуку інформації. Обидва сервіси працюють у схожому ключі ― це просто рядок чату, в який можна написати «привіт, як справи?», дізнатися про результати півфіналів Ліги Чемпіонів або отримати короткий переказ лекції з термодинаміки. Що особливо важливо, ШІ-бот краще розуміє суть запиту та пам'ятає контекст розмови. Тобто можна створити кілька різних чатів, присвячених різним темам (наприклад, медицині та юриспруденції) і спілкуватися з ботом навіть за допомогою навідних складних питань, які поставлять в глухий кут звичайну пошукову систему Google. Наприклад, на питання «чи можливе повалення авторитарного режиму без застосування сили» Google видасть посилання на вікі-статтю про авторитаризим і якісь посилання на пости в соцмережах, які частково відповідають запиту. ChatGPT і Bard швидко проведуть невелике історичне дослідження і видадуть невелике резюме фактів, які потім можна з ним же і обговорити.

І необов'язково все ускладнювати, обидва ШІ можуть допомогти порадами, як обрати міський велосипед https://ek.ua/list/161/pr-9366/, смачно посмажити картоплю, згадати видатних німецьких композиторів тощо. При цьому він нічого не вигадує сам, а фактично збирає доступну в мережі інформацію та компілює її у зрозумілому форматі. Інформація зазвичай видається узагальненою, але в більшості випадків це набагато зручніше за звичайний запит у Google, який на першій сторінці показує купу реклами та посилання на малокорисні СЕО-статті. Єдиний мінус, що публічна версія ChatGPT поки що використовує мовну модель третього покоління, натреновану в 2021 році, тому події 2022 і 2023 року для нього оповиті туманом, про що він сам чесно повідомить. Але це лише питання часу, доки не вийшов ChatGPT4. Другий нюанс пов'язаний із самою природою запитів – зазвичай, щоб отримати відповідь на складне запитання, швидше за все, знадобляться додаткові запити, які ще й потрібно грамотно скласти. Третій мінус ― в інтернеті можуть написати неправду, а ШІ, як і звичайна людина, може її підхопити і ввести в оману. Тому критичне мислення та додаткові перевірки, на жаль, не скасовуються.

Google Duet AI: персональний органайзер для сервісів Google

Google Duet AI (https://cloud.google.com/blog/products/application-modernization/introducing-duet-ai-for-google-cloud) ― це комплекс розумних помічників для всіх програм Google, об'єднаних у пакеті Workspace. Їх можна використовувати для генерації ідей для статей, автоматичного створення текстів у Google Docs, оформлення листів у Gmail, генерації зображень для презентацій у Slides тощо. Особливий акцент розробники роблять саме на допомогу в написанні листів зі смартфона ― на думку Google, ШІ зможе здорово спростити та автоматизувати цей не найзручніший для смартфона процес, допомагаючи написати сам текст чи придумати план листа. Також дуже зручною виглядає функція створення автоматичної стенограми під час переговорів чи мозкових штурмів. ШІ може записувати мову, конвертувати її в текст, робити резюме найважливішого і потім відправляти його усім учасникам зустрічі.


Для взаємодії з помічником був розроблений новий інтерфейс Sidekick – окрема бокова панель, на яку виводиться результат ШІ-аналізу документів, що проглядаються користувачем, підказки в роботі, нагадування з органайзера тощо. У коментарях під трансляцією з конференції Google I/O кілька разів зазначали, що так могла б виглядати перша версія ШІ Джарвіса із «Залізної людини», який допомагав Тоні Старку з рутинними задачами. Відразу слід зазначити, що на момент публікації цього матеріалу більшість функцій ШІ в Workspace поки що перебувають у стадії бета-тестування. Подати заявку на участь можна за посиланням у шапці.

Perplexity: академічний пошук інформації з цитуванням та першоджерелами

Perplexity (https://www.perplexity.ai/) є частиною зростаючої хвилі стартапів, які прагнуть використовувати штучний інтелект, щоб послабити контроль Google над онлайн-пошуком. Серед його інвесторів велика кількість дослідників штучного інтелекту, включаючи нинішніх та колишніх керівників з Google та Microsoft. На відміну від ChatGPT і Google Bard, які вміють все потроху, Perplexity заточений саме під пошук інформації. На умовний запит «якого зросту був Ісус» ChatGPT і Bard видадуть щось на цю тему – немає точних даних, історики сперечаються, всієї правди ми не знаємо. Perplexity спробує копнути глибше, видасть кілька теорій, що Ісус був нормального зросту або навпаки коротуном, потім видасть кілька джерел, з яких він почерпнув цю інформацію і закінчить декількома схожими запитами від інших користувачів. Такий формат особливо зручний для академічної роботи.

Gamma: генератор PDF презентацій, документів та веб-сайтів

Gamma (https://gamma.app/) — веб-додаток, здатний створювати презентації за секунди. З його допомогою ви можете легко генерувати документи, презентації та веб-сторінки, використовуючи потужний ШІ-генератор, який дає змогу доопрацьовувати і налаштовувати отриманий результат. Цей сервіс підходить як для новачків, так і для досвідчених користувачів, пропонуючи зручні інструменти для створення яскравих та ефективних проєктів, включаючи текст і зображення. Потрібно відзначити надзвичайно зручну організацію сервісу, особливо доброзичливу до казуальних користувачів, які не мають особливого досвіду з графічними редакторами та програмним забезпеченням для створення презентацій. Для початку Gamma пропонує вибрати формат (документ, презентація, веб-сторінка) та загальну тему ― наприклад, рекламу нового барбершопу чи турів до Бурятії.


Потім він запропонує план документа та один із численних візуальних стилів. Після цього ШІ на ваших очах починає роботу: спочатку вигадує назву та слоган для барбершопа, робить слайди «про нас» та «про послуги» з тематичними фотографіями, текстами та взятими навмання цінами. Потім на наших очах з'являються слайди з представленням неіснуючої команди перукарів та менеджерів, слайди з геолокацією та графіком роботи, а також остання сторінка з посиланнями на неіснуючі профілі у соцмережах та Gmail. Звичайно, замість цих холдерів потрібно вписати актуальну інформацію, після чого можна погратися зі шрифтами та фінальним візуальним оформленням. Сервіс оформлений як звичайний PDF-редактор, редагувати все можна на льоту за допомогою веб-інтерфейсу, а весь процес не займає більше 15 хвилин.

Lovo: генератор мови

Lovo (https://lovo.ai/) ― це вкрай цікавий та корисний сервіс для творців відеороликів, що дає можливість натурально озвучити написаний текст без професійного диктора, якісного мікрофона та звуковика, який почистить запис від шиплячих, прибере зайвий бас та скомпресує звук, щоб все звучало красиво та професійно. Ми бачили десятки різних перетворювачів тексту на мову і більшість із них звучать саме так, як і має звучати робот. На відміну від них Lovo працює на зовсім іншому рівні, даючи змогу користувачеві вибрати один з безлічі доступних голосів, вибрати емоційне забарвлення, що підходить для ролика, і за допомогою вбудованого аналога автотюна поправити окремі слова або літери, щоб мова звучала більш натурально. Загалом той випадок, коли краще почути самому.

Популярною альтернативою Lovo є інший генератор мови Murf (https://murf.ai/).

Chat PDF: перетворює будь-який PDF документ на балакучого співрозмовника

Цікавий сервіс для учнів і не тільки, який дає змогу працювати з конкретним PDF документом, чи то нонфікшн книга з нейробіології, наукова стаття з квантової фізики або зведення юридичних законів. Теоретично це може робити і ChatGPT, якому також можна згодувати будь-який текст, проте Chat PDF (https://www.chatpdf.com/) завжди відповідатиме саме в контексті цього документа, у той час як ChatGPT або Bard з часом можуть почати плутатися у відповідях і забувати, з чого почалася розмова. Інший важливий плюс сервісу полягає в тому, що в Chat PDF можна завантажити документ будь-якою мовою, але спілкуватися бот буде зручною вам мовою. Тобто це фактично суміш розумного академічного пошуку та перекладача.

Eightify: освітній сервіс, який робить короткий опис та ключові висновки з будь-якого відео на Youtube

Eightify може подивитися замість вас ролик з YouTube, а потім переказати найважливішу та найкориснішу інформацію.

Сервіс Eightify (https://eightify.app/) багато в чому нагадує згадуваний вище Chat PDF з тією різницею, що він працює не з PDF документами, а з відеороликами. Наприклад, йому можна згодувати ролики Тімоті Снайдера з історії України, цикл лекцій Річарда Фейнмана з фізики або подкаст про догляд за котами і миттєво отримати коротке резюме, про що сам ролик, що там важливого говорили і які висновки з цього можна зробити. По суті, це безкоштовний автоматизований аналог сервісів а-ля Retell і Instaread, тільки для відеороликів, а не книг. Загалом ще один вкрай корисний інструмент для учнів, який до того ж працює у форматі зручного розширення для браузера.

Stockimg.ai: генератор зображень та логотипів для брендів

Сервіси Dall-E і Midjourney підірвали мережу ще до виходу ChatGPT, даючи змогу генерувати реалістичні зображення, картини та фотографії в різних стилях. На відміну від них, сервіс Stockimg.ai скоріше створений для потреб підприємців, невеликих стартапів та творців цифрового контенту. Зокрема він заточений під генерацію постерів, обкладинок книг, логотипів, лендингів, ілюстрацій, стокових фотографій та багато іншого. Stockimg (https://stockimg.ai/) оснащений фільтрами для більш точної генерації, даючи можливість встановити стиль зображення або певні обмеження на кшталт використання агресивного червоного кольору при створенні логотипу для умовного благодійного фонду чи ветеринарної клініки.

Для початку сервіс запропонує вибрати необхідний вам формат – постер, обкладинку, листівку, логотип тощо. Далі з'явиться вікно редактора та генератора, в якому користувачеві потрібно ввести запит для генерації зображення як Dall-E або Midjourney. Наприклад, «жаба їде верхи на собаці», «Доналд Трамп танцює гопак» або щось складніше в дусі «дерев'яна вітальня, великий розпалений камін, ялинка, реалістичне освітлення, кінематографічний рендер у 4K». Після цього потрібно вибрати найбільш підходящу для запиту модель генератора (disco diffusiuon, analog diffusion, real photo тощо), виставити фінальні вимоги для зображення і можна запускати генератор. Коли знайдете щось до душі, це зображення можна відредагувати та завантажити з сервера.

Gyre: всесильний графічний редактор

Gyre (https://gyre.ai/docs/install/gyre-installer) ― це безкоштовний додаток для редагування зображень з відкритим вихідним кодом, який здатний застосовувати силу ШІ для комплексної обробки фотографій. Завдяки використанню бази Stable Diffusion та інших навчальних моделей можливості сервісу в деяких аспектах навіть перевершують великий та жахливий Фотошоп. Перевага Gyre полягає в тому, що редагування відбувається за допомогою текстових запитів, тому користувачу не потрібно мати досвід обробки фотографій і знання інструментів фоторедактора. За допомогою звичайного запиту Gyro може прибрати колишню дівчину із загальної фотографії, стерти заднє тло та замінити його на нове, домалювати настінний килим на сімейній фотографії та навіть повністю змінити стиль зображення, залишивши недоторканими ключові об'єкти тощо. Загалом штука дуже вражаюча. Мінус, що доведеться трохи повозитися з установкою оскільки сервіс не має звичного інсталятора, веб-версії та мобільних додатків.


Бонус: Promptbox – база даних запитів для ChatGPT, Midjourney та Dall-e

Можливо ви здивуєтеся, але з розвитком ШІ з'явилася і нова сфера діяльності ― такий собі оператор ШІ (https://www.promptbox.ai/), який вміє складати грамотні запити для ШІ, що зводять до мінімуму непотрібну інформацію. Це особливо корисно у виконанні якихось нетривіальних задач на кшталт генерації тексту на специфічну тему у певному літературному стилі чи генерація чорно-білого зображення кота Степана у стилі раннього Босха. Деякі користувачі настільки звеличилися у своєму вмінні складати запити, що навіть почали їх продавати, а самі себе почали називати AI Artist. Якщо у вас немає бажання самому копатися в цій темі або комусь платити, то в мережі вже є спеціальний сервіс з базою різних комплексних запитів-алгоритмів для ChatGPT, Stable Diffusion, Dall-e і десятків інших ШІ-сервісів.

Замість висновку

Потенціал роботи ШІ в автоматизації бізнес-процесів безмежний і його варто використовувати в робочих процесах вже зараз. А які ви знаєте послуги з використанням штучного інтелекту і як вони вам допомагають?