11 инструментов для выявления ИИ генерируемого контента

Крупные языковые модели искусственного интеллекта, такие как ChatGPT, могут быть эффективными помощниками для представителей многих профессий. Копирайтеры, маркетологи и владельцы бизнеса используют нейросети для написания текстов. Сейчас искусственно созданный контент часто публикуют в социальных сетях и на сайтах. С помощью ИИ можно даже создать книгу или разработать полноценную маркетинговую стратегию. Но будут ли такие материалы качественными?

План статьи

Как идентифицировать машинный контент?
Отношение Google к текстам, написанным ИИ
Почему контент, сгенерированный ИИ, может быть проблемным?
Инструменты для проверки текстов на использование нейросети
Выводы

Как идентифицировать машинный контент?

Несомненно, искусственный интеллект — отличный инструмент для экономии времени и генерации идей. С его помощью можно непрерывно создавать информационный и развлекательный контент для своей целевой аудитории. Однако на сегодняшний день существует множество способов проверки текстов на использование ChatGPT и других нейросетей.

📌 Читайте в блоге: ChatGPT: как пользоваться и чего опасаться; рассмотрим альтернативы, сравним с другими системами генерации текста: Bard и Bing

Машинные тексты могут выглядеть искусственно, не восприниматься читателями или мешать ранжированию страниц в интернет-выдаче. Чтобы избежать этого, следует разобраться с особенностями такого контента и научиться улучшать его вручную перед публикацией. Человеческий фактор здесь очень важен, так как только автор-человек может выразить своё мнение в контексте каждой конкретной ситуации, подчеркнуть важное и привести примеры из собственного бизнеса или жизни.

Важно уметь давать чёткие команды и подсказки, то есть создавать промпты. Также вам понадобится постоянно редактировать тексты для сохранения нужного tone of voice бренда, избегать плагиата или нарушений авторских прав, обеспечивать соответствие каждого материала бизнес-целям компании или личным планам автора.

📌 Читайте в блоге: Промпты для ChatGPT

Существует множество инструментов для проверки текстов на использование ИИ, и подборкой таких сервисов мы поделимся дальше в этой статье. Но идентифицировать искусственно сгенерированный контент возможно даже без сканирования материалов на специализированных сайтах. Неестественность определяется рядом типичных признаков.

Языковым моделям сложно давать сложные темы и биографические материалы. Они могут выдавать не очень качественные тексты с выдуманными фактами, фиктивными цитатами и несколько бессмысленными фрагментами.
Обычно автоматически сгенерированный контент выглядит шаблонным. Типичными признаками являются частые повторы слов и фраз, одинаковые конструкции в начале пунктов списка и т. д.
ИИ создаёт тексты общего характера, которым не хватает ориентации на целевую аудиторию и учета контекста. Даже если прописать детальную инструкцию для чат-бота, некоторые нюансы могут быть упущены, и модель не сможет самостоятельно улучшить результат.
Недостаток креатива и эмоций делает машинные тексты скучными, а некорректность статистических данных и нехватка аргументации лишают их убедительности. В некоторых случаях такие тексты могут подойти для личного блога в соцсети, но у читателей экспертного онлайн-издания могут возникнуть вопросы.
Небольшое количество строк в каждом абзаце и короткие предложения характерны для текстов, написанных ИИ. В таких текстах можно встретить меньше знаков препинания, чем в авторских, так как люди чаще используют знаки вопроса, двоеточия, точки с запятой и восклицательные знаки.

Даже если вам удастся получить эмоционально окрашенный текст без фактических ошибок, стиль написания все равно будет отличаться от вашего. То есть если раньше вы писали для своего блога самостоятельно, и вдруг решили делегировать эту задачу ChatGPT, постоянные читатели могут что-то заподозрить. Профессиональный копирайтер, который в совершенстве ознакомлен с предыдущими текстами, с большей вероятностью воссоздаст нужный стиль.

Это можно сравнить со службой информационной поддержки: если клиенты регулярно общаются по телефону или в чате с настоящими менеджерами, а потом их связывают исключительно с чат-ботами и голосовыми ботами, лояльность ЦА может резко снизиться.

Отношение Google к текстам, написанным ИИ

Известно, что Google может идентифицировать содержимое, созданное искусственным интеллектом. Несмотря на это такой качественный контент все равно будет ранжироваться. Удаление грозит в том случае, если нарушена политика в отношении спама. Также санкции грозят веб-ресурсам, статьи на страницах которых не соответствуют принципам E-E-A-T:

експертиза;
досвід;
авторитетність;
достовірність.

Ссылки на авторитетные источники и фото авторов с информацией о них являются доказательствами экспертизы и авторитетности. Следует указывать опыт и полномочия, достижения создателей контента. Достоверность подтверждается теми же источниками, а также конкретной информацией без лишней «воды».

Искусственно созданный контент должен быть читабельным, понятным и ценным для читателей. Тексты, которые не соответствуют требованиям поисковой системы, могут быть как искусственно созданными, так и написанными копирайтером или владельцем бизнеса, поэтому ключевым фактором здесь является тщательная проверка редактором-экспертом.

С развитием ИИ идентифицировать контент, созданный им, становится все сложнее. Растет спрос на промпт-инженеров и редакторов, способных усовершенствовать искусственный текст, «очеловечить» его.

Использовать контент с искусственным интеллектом не всегда уместно. Например, для написания новостей лучше вообще не обращаться к языковым моделям. Иначе вы рискуете репутацией бренда, распространив ложную информацию. А вот суммирование с помощью ИИ может сэкономить время и ресурсы. Чат GPT умеет превращать большие объемы текста в сжатые резюме. Это очень полезно в рамках различных исследований, разработки планов и стратегий.

Также искусственный интеллект может обрабатывать большие объемы данных и превращать их в таблицы, графики и диаграммы. Инструменты ИИ способны помогать в наращивании органического трафика. Например, с помощью GPT можно подбирать релевантные ключевые слова и равномерно распределять их по тексту. Google не запрещает делать это, если все требования к SEO (частотность ключевых фраз, структура статьи, наличие подзаголовков и др.) будут учтены.

Существует несколько сфер, в частности медицина и финансы, где ИИ может негативно повлиять как на соблюдение принципов E-E-A-T, так и на доверие потенциальных клиентов. Вероятность неточности информации в таких статьях может нанести читателям вред, негативно повлиять на их безопасность или здоровье. Искусственно сгенерированные медицинские советы считаются неэтичными, как и советы по решению психологических проблем.

📌 Читайте в блоге: Тест E-E-A-T: как Google оценивает ваш сайт

Сюда же можно отнести тексты на политическую тематику, где чат-бот может выдать предвзятый контент. Автор учитывает нюансы политической ситуации на сегодняшний день, настроение потенциальных читателей, их взгляды и ожидания. Если это независимый источник, который читает вся страна, любая агитация или критика может вызвать массу негатива и недоразумений. Автор, осведомленный в тематике, сумеет избежать подобных неприятных ситуаций и написать более уместную и объективную статью или новостной пост.

В обновленной политике Google говорится о том, что публиковать автоматически сгенерированные тексты на веб-ресурсах не запрещено. К сожалению, контент, написанный ИИ, часто недостаточно качественный, что снижает рейтинги даже оптимизированных и раскрученных сайтов.

Почему генерируемый ИИ контент может быть проблемным?

Согласно результатам исследований Корнельского университета показали, что 66% опрошенных пользователей интернета не могут идентифицировать фейковые новости, сгенерированные искусственным интеллектом. Ведь копирайтеры также активно используют повторы ключевых слов, вследствие чего тексты могут казаться неестественными. Особенно это касается тех случаев, когда больше внимания сосредотачивается вокруг SEO (поисковой оптимизации сайта), а не LSI (латентно-семантического анализа).

📌 Читайте в блоге: Что такое LSI-копирайтинг и как он поможет в продвижении сайта

Автоматически сгенерированный контент считается проблемным, поскольку он находится в “серой зоне” внимания поисковых систем. При отсутствии надлежащего редактирования перед публикацией его использование подвергает сайты риску попасть под санкции. Ключевая причина кроется не в отсутствии авторства или низкой уникальности, а в вероятности игнорирования формулы E-E-A-T.

Стоит учитывать также и юридические моменты. Поскольку Украина планирует вступать в ЕС, важно уже на данном этапе следовать европейской законодательной базе, а именно ориентироваться на GDPR (“Общий регламент о защите персональных данных”). На сегодняшний день этот документ является стандартом по защите персональных данных, в частности для материалов ИИ.

📌 Читайте в блоге: Что такое GDPR, персональные данные и cookie

Отношение к защите авторского права и к контенту, созданному языковыми моделями, зависит от конкретного региона. Например, в Италии ChatGTP официально запрещен в связи с нарушением требования GDPR о конфиденциальности разговоров пользователей платной версии.

Китай не запрещает создавать материалы с помощью ИИ, однако тщательно проверяет каждый сервис перед предоставлением разрешения на его использование. А в США писатели и другие представители творческой сферы призывают конгресс запретить защищать авторские права на произведения искусства, сгенерированные искусственным интеллектом. Зато Великобритания защищает результаты работы ИИ авторским правом.

Согласно обновленному Закону Украины «Об авторском праве и смежных правах», объекты, созданные с помощью ИИ, не считаются оригинальными, но подлежат охране.

«…на Всемирно экономическом форуме в Женеве (WEF) отмечали о рисках потери работы для 26 млн человек, в случае дальнейшего развития технологий. Для этого исследования WEF было привлечено более 800 корпораций из разных стран, а это штат в размере 11,3 млн человек». «Применение искусственного интеллекта в бизнес-процессах: правовой аспект», — Юлия Рябец, юристка практики Супроводу бізнесу в Juscutum

Основным поводом для волнения создателей авторского контента и произведений искусства является то, что технологии искусственного интеллекта учатся на произведениях людей. Они могут частично копировать чужие изображения (как Midjorney) или подражать стилю речи или заимствовать и переделывать фрагменты текстов (это характерно для ChatGPT). Искусственный интеллект может выдать результат, который содержит произведения, защищенные авторским правом. Поэтому риск нарушения прав интеллектуальной собственности является достаточно высоким.

Еще одной проблемой является дезинформация пользователей интернета вследствие недостоверности искусственно сгенерированных материалов. Это может быть как изображение, создание которого займет значительно меньше времени, чем с помощью фоторедактора, так и текст, особенно новостной или биографический.

В идеале об использовании искусственного интеллекта следует указывать при публикации. Если речь идет о тексте информационного или развлекательного характера, после получения текста ИИ необходимо передать его на проверку человеку, который осведомлен в данной сфере и может исправить фактические ошибки, придать материалам нужных характеристик (например, упростить терминологию или, наоборот, сделать статью более официально-деловой).

Европейский парламент постоянно работает над нормами относительно использования ИИ. В частности, ответственность за неправомерное использование программ ИИ по мнению депутатов Европарламента должна ложиться на разработчиков OpenAI и др. а не на небольшие компании, которые, по сути, являются клиентами корпорации.

«Согласно предложениям Европарламента, разработчики генеративных моделей ИИ, таких как ChatGPT, должны будут замечать контент, созданный ИИ, и публиковать сводку защищенных авторским правом данных, используемых в учебных целях, чтобы создатели могли получать вознаграждение за использование своей работы». «Европарламент подготовил жесткие правила по использованию ИИ», — Анита Прасад

Языковые модели достаточно «хитрые»: они умеют искажать фактическую информацию, цифры и элементы биографии известных людей. Были зафиксированы случаи размещения сфабрикованных ссылок на фальшивые первоисточники. Работать с ИИ сможет не каждый специалист, ведь для этого нужен ряд навыков и осведомленность в различных темах. Если перед вами стоит задача оценить готовность искусственного текста к публикации, воспользуйтесь специальными сервисами.

Инструменты для проверки текстов на использование AI

Существует множество инструментов, с помощью которых можно проверить текст на использование искусственного интеллекта. Однако стоит понимать тот факт, что не все они являются эффективными. Как и сервисы для проверки уникальности, детекторы ИИ-контента отличаются между собой уровнем точности.

Чтобы выбрать лучшие способы оценки искусственно сгенерированного контента, мы создали текст с помощью ChatGPT и просканировали его в каждом из инструментов.

Запрос звучал как “write a post about the benefits of native advertising” (“напиши пост о преимуществах нативной рекламы”). Указания, написанные на английском, обычно дают лучшие результаты, поскольку ИИ в таком случае выдает текст с минимальным количеством семантических и орфографических ошибок.

Инструменты для проверки текстов на использование AI

лучшие способы оценки искусственно сгенерированного контента

ZeroGPT

Среди преимуществ, указанных на сайте, указана обработка пакетных файлов в фоновом режиме, пакетная загрузка файлов, высокоточная модель обнаружения ИИ в тексте, автоматически сгенерированный отчет в формате PDF и обнаружение плагиата на всех языках.

С поставленной задачей программа справилась, показав 95,98% содержания ИИ. По неизвестной причине как уникальные были обозначены только последние названия пунктов списка, но это не повлияло на общую оценку существенно.

GPTZero

«Больше, чем детектор искусственного интеллекта» — именно так позиционирует себя сервис, который, по описанию на сайте, создан для учителей, учеников и писателей. Пользователю предлагается несколько продуктов: расширение для Chrome Origin, отчеты о человеческом почерке, о рукописном тексте и о Документе Google, интеграция с API и с Canvas, а также расширение для Microsoft Word. Впечатляет описание технологий, которые используются для проверки текстов. Среди них — анализ схожести с шаблонами написания ИИ, поиск материалов в интернете и модель классификации предложений, которая позволяет выделять смешанный текст.

После простого и очень быстрого сканирования мы получили результат: «Этот текст, вероятно, был написан искусственным интеллектом. Существует 98% вероятность того, что этот текст был полностью написан ИИ. Предложения, которые, вероятно, написаны ИИ, выделены. 30/30 предложений, вероятно, сгенерированы ИИ».

GPTZero как проверить текст на ИИ онлайн

AI Content Detector

Доступен анализ различных форматов текста, не только большой по объему прозы. Текст может быть выделен различными оттенками в зависимости от соотношения предложений, полностью написанных искусственным интеллектом, и вкраплениями контента, созданного человеком.

Сервис предлагает установить расширение для Chrome. Разработчики инструмента отмечают, что протестировали более 20 тыс. документов, написанных человеком, и уровень ложных срабатываний составил 0,2%, что является самым низким показателем среди всех аналогов. Доступны и другие продукты, например, проверка программного кода, выявление грамматических ошибок и др.

Текст был выделен красным цветом, однако отсутствие конкретной оценки и комментария немного разочаровывает.

AI Content Detector проверяет текст на совпадение ИИ

GPTRadar

Алгоритм использует такую метрику как вероятность токенов и анализирует отдельно каждое предложение, выводя оценки на диаграмме. Однако это не позволяет сканеру распознать искусственный контент, ведь полученный нами результат не является достоверным: “Вероятно, создано человеком. 81% точности”. Текст получил 6 баллов по шкале запутанности.

Hive Moderation

Инструмент предназначен для проверки и текстов, и изображений. Бесплатная демо-версия демонстрирует, какой сегмент текста имеет наиболее искусственное содержимое. Существует также расширение Hive AI Detector для Google Chrome. Почти весь текст выделен как искусственно созданный, что свидетельствует о точности работы сервиса.

Illuminarty

Алгоритмы NLP помогают распознавать сгенерированные нейросетью тексты, а компьютерное зрение обнаруживает цифровые изображения, созданные с участием искусственного интеллекта. Но согласно анализу нейросети, вероятность содержания ИИ в исследуемом тексте составляет 1,5%, что очень далеко от правды.

Crossplag

Для использования сервиса нужно зарегистрироваться на сайте. Залогиниться можно с помощью аккаунта Google или LinkedIn. Для исследования мы использовали бесплатную версию инструмента.

«Этот текст в основном написан искусственным интеллектом», — ответ детектора также нас вполне устраивает. Наряду с оценкой пользователь видит шкалу, которая хорошо визуализирует уровень «искусственности» (AI Content Index). Интересными особенностями сервиса является удобный личный кабинет и наличие онлайн-консультанта.

AI Text Classifier

Абсолютно бесплатный и вполне бесполезный онлайн-инструмент. По словам разработчиков, он помогает распознавать текст и показывает, сколько процентов текста написано искусственным интеллектом, а сколько — человеком. Однако при проверке нашего текста только 3% контента было идентифицировано как искусственно сгенерированные.

Writefull GPT Detector

Инструмент является бесплатным, однако установлен лимит количества использований в сутки. Сервис можно применять для написания и редактирования академических текстов, создания аннотаций, перефразирования текстов и др. Если говорить о сканировании текста на наличие искусственно сгенерированного содержимого, мы не рекомендуем Writefull GPT Detector, поскольку наш текст определен детектором как написанный человеком: только 1% показался похожим на искусственный.

AI Plagiarism Checker

Сервис сочетает в себе проверку плагиата и чат GPT с детектором искусственного интеллекта. ИИ-чекер использует анализирует соотношение креативности и предсказуемости, чтобы выявить ИИ-контент.

Потенциально искусственный контент в анализируемом тексте был обнаружен в объеме 53,7%. Лучше, чем 0%, однако не идеально.

AI Plagiarism Checker для определения ШИ сгенерированного контента

GPTKit

Чтобы обойти ограничения по объему анализируемого текста, нужно зарегистрироваться на сайте. Но только первые 2 048 символов в каждом запросе будут бесплатными. Чекер использует 6 различных методов выявления ИИ-контента, формирует отчеты о его подлинности.

67% текста о нативной рекламе идентифицировано как реальный контент, то есть не созданный искусственно. И только 33% сервис обозначил как фейковый.

GPTKit 6 различных методов обнаружения ИИ-контента

Ответы на часто задаваемые вопросы

Можно ли проверить текст на ChatGPT?

Любой текст можно проверить на наличие содержимого, созданного ChatGPT или другим инструментом искусственного интеллекта. Поисковая система Google также способна идентифицировать ИИ-контент.

Как определить, что текст был написан нейросетью?

Чтобы определить, написан ли текст нейросетью, нужно прочитать его и оценить по достоверности фактического материала, шаблонности, ориентации на целевую аудиторию и эмоциональности, соблюдению tone of voice бренда и другим признакам, присущим авторским, экспертным статьям.

Можно ли проверить текст на нейросеть?

Проверить текст на использование нейросети можно с помощью специальных инструментов, в частности ZeroGPT, GPTZero, Hive Moderation и Crossplag.

Как проверить, написал ли текст ChatGPT?

Чтобы проверить, написал ли текст ChatGPT, нужно оценить его с точки зрения редактора и просканировать в надежном чекере содержимого ИИ-контента.

Висновки

Только 4 из 11 проанализированных инструментов для выявления ИИ генерируемого контента мы можем искренне рекомендовать. Это ZeroGPT, GPTZero, Hive Moderation и Crossplag. Эти сервисы четко различают естественный, авторский контент от искусственно сгенерированного. Другими чекерами следует пользоваться с осторожностью. Существует также большое количество платных детекторов, которые имеют более широкий функционал.

Если у вас нет времени или вдохновения создавать собственный контент, используйте ИИ, однако не доверяйте ему всю работу. Найдите возможность тщательно проверять каждый текст и дополнять его собственными мыслями, идеями, цитатами. Вы можете делегировать написание текстов копирайтерам или нанять промпт-инженера и редактора.

Помните, что в некоторых сферах, в частности, в области медицины, политических новостей, финансовых советов, использование искусственного интеллекта является неуместным и даже рискованным. В других случаях публиковать на сайте искусственно созданные тексты вполне допустимо, при этом они должны соответствовать принципам E-E-A-T.

Однако независимо от направления вашего бизнеса и целей контент-маркетинга, большие языковые модели могут быть полезными для выполнения других задач, например, для создания контент-планов, разработки маркетинговых стратегий или поиска и кластеризации ключевых слов для продвижения сайта.

Recent Posts

Tags