Автора текста можно идентифицировать по нескольким словам

Автор неподписанного текста может быть идентифицирован путем анализа связи между всего несколькими словами текста, как показали физики-статистики из Института ядерной физики Польской академии наук в Кракове.

Люди оригинальнее, чем они думают. Об этом говорит метод стилометрии анализа художественного текста. Индивидуальность автора можно увидеть в связях между не более чем десятка слов в английском тексте. В славянских языках отождествление авторства требует еще меньшего количества слов и является более определенным.

Исследователи искали решение проблемы верификации авторства исторических текстов, известных только по фрагментам, выявления плагиата и аналогичных проблем. Во многих случаях традиционные стилометрические методы не дают или не приводят к достаточно надежным выводам.

В области информационных наук ученые теперь представляют свой собственный статистический инструмент для стилометрического анализа. Построенный с использованием графиков, он качественно по-новому анализирует структуру текстов.

Стилометрия - наука, занимающаяся статистическими характеристиками стиля текстов, основана на наблюдении, что каждый человек использует один и тот же язык несколько по-разному. Некоторые имеют более широкий словарный запас, другие более узкий, некоторые предпочитают определенные фразы и делают ошибки, другие избегают повторения и являются лингвистическими пуристами. И в письменном тексте они также отличаются тем, как они используют пунктуацию. Пунктуация играет роль в языке не менее важную, чем сами слова.

Автор: Хотгео