11 інструментів для виявлення ШІ генерованого контенту

Великі мовні моделі штучного інтелекту на кшталт ChatGPT можуть бути ефективними помічниками для представників багатьох професій. Копірайтери, маркетологи та власники бізнесу використовують нейромережу для написання текстів. Наразі штучно згенерований контент часто публікують у соціальних мережах і на сайтах. За допомогою ШІ можна навіть створити книгу чи розробити повноцінну маркетингову стратегію. Та чи будуть такі матеріали якісними?

План статті

Як ідентифікувати машинний контент?
Ставлення Google до текстів, написаних ШІ
Чому генерований ШІ контент може бути проблемним?
Інструменти для перевірки текстів на використання нейромережі
Висновки

Як ідентифікувати машинний контент?

Безумовно, штучний інтелект є хорошим інструментом для економії часу та генерування ідей. З його допомогою можна безперервно створювати інформативний і розважальний контент для своєї цільової аудиторії. Однак на сьогоднішній день існує багато способів перевірки текстів на використання ChatGPT та інших нейромереж.

📌 Читайте в блозі: ChatGPT: як користуватися і чого побоюватися: розглянемо альтернативи, порівняємо з іншими ситемами генерації тексту: Bard та Bing

Машинні тексти можуть виглядати штучно, не сприйматися читачами або ж заважати ранжуванню сторінок в інтернет-видачі. Щоб уникнути цього, слід розібратися із особливостями такого контенту та навчитися покращувати його вручну перед публікацією. Людський фактор тут дуже важливий, оскільки лише автор-людина може висловити свою думку в контексті кожної конкретної ситуації, підкреслити важливе та навести приклади з власного бізнесу чи з життя.

Необхідним є вміння надавати чіткі команди і підказки, тобто створювати промпти. Також вам знадобиться постійно редагувати тексти для збереження потрібного tone of voice бренду, уникати плагіату або порушень авторських прав, забезпечувати відповідність кожного матеріалу бізнес-цілям компанії чи особистим планам автора.

📌 Читайте в блозі: Промпти для ChatGPT

Існує багато інструментів перевірки текстів на використання ШІ, і підбіркою таких сервісів ми поділимося далі у цій статті. Та ідентифікувати штучно згенерований контент реально навіть без сканування матеріалів на спеціалізованих сайтах. Неприродність визначається зарядом типових ознак.

Мовним моделям важко даються складні теми та біографічні матеріали. Вони можуть видавати не дуже якісні тексти з вигаданими фактами, фіктивними цитатами та дещо безглуздими фрагментами.
Зазвичай автоматично згенерований контент виглядає шаблонним. Типовими ознаками є часті повтори слів та словосполучень, однакові фрази на початку пунктів списку і т. д.
ШІ створює тексти загального характеру, яким не вистачає орієнтації на цільову аудиторію та врахування контексту. Навіть якщо прописати дуже детальну інструкцію для чат-бота, певні нюанси можна упустити, а самостійно мовна модель покращити результати не здатна.
Відсутність креативу та емоцій робить машинні тексти нудними, а некоректність статистичних даних та нестача аргументації написаного позбавляє їх переконливості. У деяких випадках такі тексти можуть підійти для особистого блогу в соцмережі, однак у читачів експертного онлайн-видання можуть виникнути питання.
Невелика кількість рядків у кожному абзаці та короткі речення — характерні для ШІ ознаки. У машинних текстах можна зустріти значно менше розділових знаків, ніж у авторських. Люди частіше використовують знаки питання, двокрапки, крапки з комами та знаки оклику.

Навіть якщо вам вдасться отримати емоційно забарвлений текст без фактичних помилок, стиль написання все одно буде відрізнятися від вашого. Тобто якщо раніше ви писали для свого блогу самостійно, і раптом вирішили делегувати це завдання ChatGPT, постійні читачі можуть щось запідозрити. Професійний копірайтер, який досконало ознайомлений з попередніми текстами, з більшою ймовірністю відтворить потрібний стиль.

Це можна порівняти зі службою інформаційної підтримки: якщо клієнти регулярно спілкуються по телефону чи в чаті зі справжніми менеджерами, а згодом їх зв’язують виключно з чат-ботами та голосовими ботами, лояльність ЦА може різко знизитися.

Ставлення Google до текстів, написаних ШІ

Відомо, що Google може ідентифікувати вміст, створений штучним інтелектом. Попри це такий якісний контент все одно буде ранжуватися. Видалення загрожує у тому випадку, якщо порушена політика щодо спаму. Також санкції загрожують веб-ресурсам, статті на сторінках яких не відповідають принципам E-E-A-T:

експертиза;
досвід;
авторитетність;
достовірність.

Посилання на авторитетні джерела та фото авторів з інформацією про них є доказами експертизи та авторитетності. Слід зазначати досвід і повноваження, досягнення творців контенту. Достовірність підтверджується тими ж джерелами, а також конкретною інформацією без зайвої «води».

Штучно створений контент повинен бути читабельним, зрозумілим і цінним для читачів. Тексти, які не відповідають вимогам пошукової системи, можуть бути як штучно створеними, так і написаними копірайтером чи власником бізнесу, тож ключовим фактором тут є ретельна перевірка редактором-експертом.

З розвитком ШІ ідентифікувати контент, створений ним, стає дедалі складніше. Зростає попит на промпт-інженерів та редакторів, здатних вдосконалити штучний текст, «олюднити» його.

Використовувати контент зі штучним інтелектом не завжди доречно. Наприклад, для написання новин краще взагалі не звертатися до мовних моделей. Інакше ви ризикуєте репутацією бренду, поширивши неправдиву інформацію. А от підсумовування за допомогою ШІ може заощадити час і ресурси. Чат GPT вміє перетворювати великі обсяги тексту на стислі резюме. Це дуже корисно в рамках різних досліджень, розробки планів і стратегій.

Також штучний інтелект може обробляти великі обсяги даних і перетворювати їх на таблиці, графіки та діаграми. Інструменти ШІ здатні допомагати у нарощування органічного трафіку. Наприклад, за допомогою GPT можна підбирати релевантні ключові слова та рівномірно розподіляти їх по тексту. Google не забороняє робити це, якщо всі вимоги до SEO (частотність ключових фраз, структура статті, наявність підзаголовків і ін.) будуть враховані.

Існує кілька сфер, зокрема медицина та фінанси, де ШІ може негативно вплинути як на дотримання принципів E-E-A-T, так і на довіру потенційних клієнтів. Ймовірність неточності інформації у таких статтях може завдати читачам шкоди, негативно вплинути на їхню безпеку чи здоров’я. Штучно згенеровані медичні поради вважаються неетичними, як і поради стосовно вирішення психологічних проблем.

📌 Читайте в блозі: Тест EEAT: як Google оцінює ваш сайт

Сюди ж можна віднести тексти на політичну тематику, де чат-бот може видати упереджений контент. Автор враховує нюанси політичної ситуації на сьогоднішній день, настрій потенційних читачів, їхні погляди та очікування. Якщо це незалежне джерело, яке читає вся країна, будь-яка агітація чи критика може викликати масу негативу та непорозумінь. Автор, обізнаний в тематиці, зуміє уникнути подібних неприємних ситуацій та написати більш доречну і об’єктивну статтю чи новинний пост.

В оновленій політиці Google йдеться про те, що публікувати автоматично згенеровані тексти на веб-ресурсах не заборонено. На жаль, контент, написаний ШІ, часто є недостатньо якісним, що знижує рейтинги навіть оптимізованих та розкручених сайтів.

Чому генерований ШІ контент може бути проблемним?

Згідно з результатами досліджень Корнельського університету показали, що 66% опитаних користувачів інтернету не можуть ідентифікувати фейкові новини, згенеровані штучним інтелектом. Адже копірайтери також активно використовують повтори ключових слів, внаслідок чого тексти можуть здаватися неприродніми. Особливо це стосується тих випадків, коли більше уваги зосереджується навколо SEO (пошукової оптимізації сайту), а не LSI (латентно-семантичного аналізу).

📌 Читайте в блозі: Що таке LSI-копірайтинг і як він допоможе в просуванні сайту

Автоматично згенерований контент вважається проблемним, оскільки він перебуває у «сірій зоні» уваги пошукових систем. За відсутності належного редагування перед публікацією його використання наражає сайти на ризик попасти під санкції. Ключова причина ховається не у відсутності авторства чи низькій унікальності, а в імовірності ігнорування формули E-E-A-T.

Варто враховувати також і юридичні моменти. Оскільки Україна планує вступати у ЄС, важливо вже на даному етапі слідувати європейській законодавчій базі, а саме орієнтуватися на GDPR («Загальний регламент про захист персональних даних»). На сьогоднішній день цей документ є стандартом щодо захисту персональних даних, зокрема для матеріалів ШІ.

📌 Читайте в блозі: Що таке GDPR, персональні дані та cookie

Ставлення до захисту авторського права та до контенту, створеного мовними моделями, залежить від конкретного регіону. Наприклад, в Італії ChatGTP офіційно заборонений у зв’язку з порушенням вимоги GDPR щодо конфіденційності розмов користувачів платної версії.

Китай не забороняє створювати матеріали за допомогою ШІ, однак ретельно перевіряє кожен сервіс перед наданням дозволу на його використання. А у США письменники та інші представники творчої сфери закликають конгрес заборонити захищати авторські права на твори мистецтва, згенеровані штучним інтелектом. Натомість Великобританія захищає результати роботи ШІ авторським правом.

Згідно з оновленим Законом України «Про авторське право і суміжні права», об’єкти, що cтворені за допомогою ШІ, не вважаються оригінальними, але підлягають охороні.

«…на Всесвітньо економічному форумі в Женеві (WEF) зазначали про ризики втрати роботи для 26 млн людей, у разі подальшого розвитку технологій. Для цього дослідження WEF було залучено більше 800 корпорацій з різних країн, а це штат у розмірі 11,3 млн людей». «Застосування штучного інтелекту у бізнес-процесах: правовий аспект», — Юлія Рябець, юристка практики Супроводу бізнесу в Juscutum

Основним приводом для хвилювання творців авторського контенту та витворів мистецтва є те, що технології штучного інтелекту навчаються на творах людей. Вони можуть частково копіювати чужі зображення (як Midjorney) або наслідувати стиль мовлення чи запозичувати і переробляти фрагменти текстів (це характерно для ChatGPT). Штучний інтелект може видати результат, який містить твори, захищені авторським правом. Тож ризик порушення прав інтелектуальної власності є досить високим.

Ще однією проблемою є дезінформація користувачів інтернету внаслідок недостовірності штучно згенерованих матеріалів. Це може бути як зображення, створення якого займе значно менше часу, ніж за допомогою фоторедактора, так і текст, особливо новинний чи біографічний.

В ідеалі про використання штучного інтелекту слід зазначати при публікації. Якщо мова йде про текст інформаційного чи розважального характеру, після отримання тексту ШІ необхідно передати його на перевірку людині, яка обізнана у даній сфері та може виправити фактичні помилки, надати матеріалам потрібних характеристик (наприклад, спростити термінологію чи, навпаки, зробити статтю більш офіційно-діловою).

Європейський парламент постійно працює над нормами стосовно використання ШІ. Зокрема, відповідальність за неправомірне використання програм ШІ на думку депутатів Європарламенту має лягати на розробників OpenAI та ін., а не на невеликі компанії, котрі, по суті, є клієнтами корпорації.

«Згідно з пропозиціями Європарламенту, розробники генеративних моделей ШІ, таких як ChatGPT, повинні будуть помічати контент, створений ШІ, та публікувати зведення захищених авторським правом даних, які використовуються з навчальною метою, щоб творці могли отримувати винагороду за використання своєї роботи». «Європарламент підготував жорсткі правила щодо використання ШІ», — Аніта Прасад

Мовні моделі є досить «хитрими»: вони вміють спотворювати фактичну інформацію, цифри та елементи біографії відомих людей. Були зафіксовані випадки розміщення сфабрикованих посилань на фальшиві першоджерела. Працювати з ШІ зможе не кожен спеціаліст, адже для цього потрібен ряд навичок та обізнаність у різноманітних темах. Якщо перед вами стоїть завдання оцінити готовність штучного тексту до публікації, скористайтеся спеціальними сервісами.

Інструменти для перевірки текстів на використання AI

Існує безліч інструментів, за допомогою яких можна перевірити текст на використання штучного інтелекту. Однак варто розуміти той факт, що не всі вони є ефективними. Як і сервіси для перевірки унікальності, детектори ШІ-контенту відрізняються між собою рівнем точності.

Щоб вибрати найкращі способи оцінки штучно згенерованого контенту, ми створили текст за допомогою ChatGPT та просканували його у кожному з інструментів.

Запит звучав як «write a post about the benefits of native advertising» («напиши пост про переваги нативної реклами»). Вказівки, написані англійською, зазвичай дають кращі результати, оскільки ШІ у такому випадку видає текст з мінімальною кількістю семантичних і орфографічних помилок.

Інструменти для перевірки текстів на використання AI

найкращі способи оцінки штучно згенерованого контенту

ZeroGPT

Серед переваг, зазначених на сайті, вказана обробка пакетних файлів у фоновому режимі, пакетне завантаження файлів, високоточна модель виявлення ШІ в тексті, автоматично згенерований звіт у форматі PDF та виявлення плагіату всіма мовами.

Із поставленим завданням програма справилася, показавши 95,98% вмісту ШІ. З невідомої причини як унікальні були позначені лише останні назви пунктів списку, але це не вплинуло на загальну оцінку суттєво.

Сервіси для перевірки текстів ШІ ZeroGPT

GPTZero

«Більше, ніж детектор штучного інтелекту» — саме так позиціонує себе сервіс, який, за описом на сайті, створений для вчителів, учнів та письменників. Користувачеві пропонується кілька продуктів: розширення для Chrome Origin, звіти про людський почерк, про рукописний текст та про Документ Google, інтеграція з API та з Canvas, а також розширення для Microsoft Word. Вражаючим є опис технологій, котрі використовуються для перевірки текстів. Серед них — аналіз схожості з шаблонами написання ШІ, пошук матеріалів в інтернеті та модель класифікації речень, яка дозволяє виділяти змішаний текст.

Після простого та дуже швидкого сканування ми отримали результат: «Цей текст, ймовірно, був написаний штучним інтелектом. Існує 98% ймовірність того, що цей текст був повністю написаний ШІ. Речення, які, ймовірно, написані ШІ, виділені. 30/30 речень, ймовірно, згенеровані ШІ».

GPTZero як перевірити текст на ШІ онлайн

AI Content Detector

Доступний аналіз різних форматів тексту, не лише великої за обсягом прози. Текст може бути виділений різними відтінками залежно від співвідношення речень, цілковито написаних штучним інтелектом, та вкрапленнями контенту, створеного людиною.

Сервіс пропонує встановити розширення для Chrome. Розробники інструменту зазначають, що протестували понад 20 тис. документів, написаних людиною, і рівень помилкових спрацьовувань склав 0,2%, що є найнижчим показником серед усіх аналогів. Доступні й інші продукти, наприклад, перевірка програмного коду, виявлення граматичних помилок і ін.

Текст був виділений червоним кольором, однак відсутність конкретної оцінки та коментаря трохи розчаровує.

AI Content Detector перевіряє текст на співпадіння ШІ

GPTRadar

Алгоритм використовує таку метрику як ймовірність токенів і аналізує окремо кожне речення, виводячи оцінки на діаграмі. Однак це не дозволяє сканеру розпізнати штучний вміст, адже отриманий нами результат не є достовірним: «Ймовірно, створено людиною. 81% точності». Текст отримав 6 балів за шкалою заплутаності.

Hive Moderation

Інструмент призначений для перевірки і текстів, і зображень. Безкоштовна демо-версія демонструє, який сегмент тексту має найбільш штучний вміст. Існує також розширення Hive AI Detector для Google Chrome. Майже весь текст виділений як штучно створений, що свідчить про точність роботи сервісу.

Illuminarty

Алгоритми NLP допомагають розпізнавати згенеровані нейромережами тексти, а комп’ютерний зір виявляє цифрові зображення, створені за участю штучного інтелекту. Та згідно з аналізом нейромережі, ймовірність вмісту ШІ у досліджуваному тексті становить 1,5%, що є дуже далеким від правди.

Crossplag

Для використання сервісу потрібно зареєструватися на сайті. Залогінитися можна за допомогою акаунта Google чи LinkedIn. Для дослідження ми використали безкоштовну версію інструменту.

«Цей текст в основному написаний штучним інтелектом», — відповідь детектора також нас цілком влаштовує. Поряд із оцінкою користувач бачить шкалу, яка гарно візуалізує рівень «штучності» (AI Content Index). Цікавими особливостями сервісу є зручний особистий кабінет та наявність онлайн-консультанта.

AI Text Classifier

Абсолютно безкоштовний і цілком безкорисний онлайн-інструмент. За словами розробників, він допомагає розпізнавати текст і показує, скільки відсотків тексту написано штучним інтелектом, а скільки — людиною. Однак при перевірці нашого тексту лише 3% контенту було ідентифіковано як штучно згенеровані.

Writefull GPT Detector

Інструменту є безкоштовним, однак встановлений ліміт кількості використань на добу. Сервіс можна застосовувати для написання та редагування академічних текстів, створення анотацій, перефразування текстів і ін. Якщо говорити про сканування тексту на наявність штучно згенерованого вмісту, ми не рекомендуємо Writefull GPT Detector, оскільки наш текст визначений детектором як такий, що написаний людиною: тільки 1% видався схожим на штучний.

AI Plagiarism Checker

Сервіс поєднує в собі перевірку плагіату та чат GPT із детектором штучного інтелекту. ШІ-чекер використовує аналізує співвідношення креативності та передбачуваності, щоб виявити ШІ-контент.

Потенційно штучний контент у аналізованому тексті був виявлений у обсязі 53,7%. Краще, ніж 0%, однак не ідеально.

AI Plagiarism Checker для виявлення ШІ генерованого контенту

GPTKit

Щоб обійти обмеження по обсягу тексту, який аналізується, потрібно зареєструватися на сайті. Та лише перші 2 048 символів у кожному запиті будуть безкоштовними. Чекер використовує 6 різних методів виявлення ШІ-контенту, формує звіти про його автентичність.

67% тексту про нативну рекламу ідентифіковано як реальний контент, тобто не створений штучно. І тільки 33% сервіс позначив як фейковий.

GPTKit 6 різних методів виявлення ШІ-контенту

Відповіді на часті питання

Чи можна перевірити текст на ChatGPT?

Будь-який текст можна перевірити на наявність вмісту, створеного ChatGPT чи іншим інструментом штучного інтелекту. Пошукова система Google також здатна ідентифікувати ШІ-контент.

Як визначити, що текст був написаний нейромережею?

Щоб визначити, чи написаний текст нейромережею, потрібно прочитати його та оцінити за достовірністю фактичного матеріалу, шаблонністю, орієнтацією на цільову аудиторію і емоційністю, дотриманням tone of voice бренду та іншими ознаками, притаманними авторським, експертним статтям.

Чи можна перевірити текст на нейромережу?

Перевірити текст на використання нейромережі можна за допомогою спеціальних інструментів, зокрема ZeroGPT, GPTZero, Hive Moderation та Crossplag.

Як перевірити, чи текст написав ChatGPT?

Щоб перевірити, чи текст написав ChatGPT, потрібно оцінити його з точки зору редактора та просканувати у надійному чекері вмісту ШІ-контенту.

Висновки

Лише 4 із 11 проаналізованих інструментів для виявлення ШІ генерованого контенту ми можемо щиро рекомендувати. Це ZeroGPT, GPTZero, Hive Moderation та Crossplag. Ці сервіси чітко розрізняють природній, авторський контент від штучно згенерованого. Іншими чекерами слід користуватися з обережністю. Існує також велика кількість платних детекторів, які мають ширший функціонал.

Якщо у вас немає часу чи натхнення створювати власний контент, використовуйте ШІ, проте не довіряйте йому всю роботу. Знайдіть можливість ретельно перевіряти кожен текст та доповнювати його власними думками, ідеями, цитатами. Ви можете делегувати написання текстів копірайтерам або найняти промпт-інженера та редактора.

Пам’ятайте, що у деяких сферах, зокрема, в галузях медицини, політичних новин, фінансових порад, використання штучного інтелекту є недоречним і навіть ризикованим. У інших випадках публікувати на сайті штучно створені тексти є цілком допустимо, при цьому вони повинні відповідати принципам E-E-A-T.

Проте незалежно від напрямку вашого бізнесу та цілей контент-маркетингу, великі мовні моделі можуть бути корисними для виконання інших завдань, наприклад, для створення контент-планів, розробки маркетингових стратегій чи пошуку і кластеризації ключових слів для просування сайту.

Recent Posts

Tags