Искусственный интеллект анализирует литературные тексты

  • Редакция журнала
  • 5 апр. 2023 г.

По словам исследователей, система успешно распознала свыше 880 наименованных сущностей в книгах Джона Рональда Руэла Толкина.

Исследователи из России разработали подход, позволяющий применять искусственный интеллект для автоматического анализа литературных произведений. Система может определить тип персонажей по репликам и описанию, а также раскрыть характер их взаимоотношений. «Метод можно использовать для обучения цифровых помощников и решения других задач», – сообщила 5 апреля пресс-служба Института искусственного интеллекта AIRI.

«Содержащийся в исследовании набор шагов можно использовать для извлечения именованных сущностей и их взаимосвязей из других текстов. С помощью описанных методов можно выполнять ряд практических задач. Например, проводить анализ нормативной документации и суммаризацию юридических текстов, чтобы переписывать сложные документы простым и понятным обычному человеку языком», – говорится в сообщении.

Группа исследователей под руководством старшего научного сотрудника Института искусственного интеллекта AIRI (Москва) Ильи Макарова приспособила уже существующие нейросетевые алгоритмы для литературного анализа текстов, а также распознавания персонажей и определения характера их взаимоотношений. Для этого учёные применили теорию графов и так называемые NER-алгоритмы, одну из форм компьютерной обработки естественного языка.

Исследователи проверили работу подхода на «Властелине колец» и других произведениях Джона Рональда Руэла Толкина. После обучения система ИИ успешно распознала то, в каких отношениях находились свыше 880 наименованных сущностей в книгах британского писателя, а также научилась узнавать их по репликам.

Аналогичным образом, как отмечают Макаров и его коллеги, можно анализировать любые другие сложные и объёмные литературные произведения, а также другие типы текстов, в том числе имеющие важное историческое или юридическое значение. Это позволит использовать системы ИИ для подготовки кратких и удобочитаемых изложений подобных документов, а также глубокого анализа правовых норм, подытожили ученые.