Эксперты предлагают подсказки, помогающие идентифицировать поддельные новости

Изучение April Fools hoax news stories может предложить подсказки для обнаружения статей «поддельных новостей», как показывают новые исследования.

Академические эксперты по обработке естественного языка из Университета Ланкастера сравнили язык, используемый в письменных первоапрельских мистификациях и поддельных новостях.

Они обнаружили, что есть сходство в письменной структуре юмористических первоапрельских мистификаций - поддельных статей, публикуемых СМИ каждый 1 апреля, и злонамеренных поддельных новостных историй.

Исследователи составили новый набор данных, или корпус, из более чем 500 статей April Fools, полученных из более чем 370 веб-сайтов и написанных в течение 14 лет.

По словам исследователей, первоапрельские мистификации очень полезны, потому что они предоставляют поддающийся проверке корпус обманчивых текстов, которые дают возможность узнать о лингвистических методах, используемых, когда автор пишет что-то фиктивное, замаскированное под фактический отчет.

Эдвард Диарден из Ланкастерского университета и ведущий автор исследования сказал, что глядя на язык, используемый в апрельских шутках, и сравнивая их с поддельными новостными историями, можно получить лучшую картину языков, используемых авторами дезинформации.

Сравнение текстов первоапрельских розыгрышей с подлинными новостными статьями, написанными в тот же период, но не опубликованными 1 апреля, выявило стилистические различия. Исследователи сосредоточились на конкретных особенностях внутри текстов, таких как количество используемых деталей, расплывчатость, формальность стиля письма и сложность языка.

Затем они сравнили апрельские истории с набором данных «поддельных новостей», ранее составленным другой командой исследователей. Хотя не все функции, найденные в April Fools hoaxes, были признаны полезными для обнаружения поддельных новостей, в обоих случаях был обнаружен ряд аналогичных характеристик.

Эксперты обнаружили, что первоапрельские розыгрыши и поддельные новостные статьи, как правило, содержат менее сложный язык, более легкое чтение и более длинные предложения, чем в настоящих новостях.

Важные детали для новостных историй, такие как имена, места, даты и время реже использовались в апрельских мистификациях и поддельных новостях. Однако собственные существительные, такие как имена известных политиков, более распространены в поддельных новостях, чем в подлинных новостных статьях.

Местоимения от первого лица, такие как мы, также являются заметной особенностью, как апрельских розыгрышей, так и поддельных новостей. Это противоречит традиционному мышлению в обнаружении обмана, которое предполагает, что лжецы используют меньше местоимений от первого лица.

Исследователи обнаружили, что апрельские розыгрыши мистифицируют истории по сравнению с подлинными новостями. Они также создали «классификатор» машинного обучения, чтобы определить, являются ли статьи первоапрельскими мистификациями, поддельными новостями или подлинными новостями. Классификатор достиг точности 75 процентов при идентификации статей April Fools и 72 процента для идентификации поддельных новостей. Когда классификатор был обучен на первоапрельские мистификации, он добился точности более 65 процентов.

По словам экспертов, рассмотрение деталей и сложностей в тексте имеет решающее значение при попытке определить, является ли статья мистификацией. Хотя есть много различий, результаты показывают, что апрельские розыгрыши и поддельные новостные статьи имеют некоторые сходные черты, в основном связанные со структурной сложностью.

Выводы предполагают, что существуют определенные общие черты между различными формами дезинформации, изучение этих сходств может дать важные идеи для будущих исследований обманчивых новостей.

Исследование было изложено в статье «дурацкое поручение: смотреть на первоапрельские розыгрыши как на дезинформацию через призму обмана и юмора», которая будет представлена на 20-й Международной конференции по вычислительной лингвистике и интеллектуальной обработке текста. Она состоится в Ла-Рошели в апреле.

Автор: Хотгео