Новостной портал ЦТЭП ИДУ
Центр технологий электронного правительства Института дизайна и урбанистики
Национальный исследовательский Университет ИТМО

Ученые МГУ предложили алгоритм поиска ключевых слов в рукописных документах

Поиск по рукописным текстам остается сложной задачей: качество автоматического распознавания почерка до сих пор ограничено, а важная информация часто содержится не только в тексте, но и в структуре письма, особенностях почерка и расположении слов на странице. Поэтому исследователи продолжают развивать методы, которые позволяют работать с изображениями рукописей напрямую, без их полного перевода в текст.

В предложенном подходе рукописный текст рассматривается как последовательность отдельных штрихов — базовых элементов письма, формируемых движением пера. Алгоритм включает сегментацию изображения на штрихи, их нормализацию и классификацию с использованием математических описаний формы. Далее выполняется сопоставление последовательностей штрихов запроса и документа, что позволяет находить совпадения и оценивать их точность.

Авторы показали, что такой метод обеспечивает устойчивый поиск ключевых слов в рукописных материалах и позволяет ранжировать найденные фрагменты по степени соответствия запросу. В экспериментах алгоритм продемонстрировал высокую точность при работе с реальными рукописными текстами.

«Мы предлагаем рассматривать рукописный текст как структурированный набор штрихов, отражающих сам процесс письма. Такой подход позволяет обойти ограничения классического распознавания и работать напрямую с изображениями рукописей. Это особенно важно для архивов и исторических документов, где сохранение визуальных особенностей текста имеет принципиальное значение», — сказал Леонид Местецкий, профессор кафедры математического прогнозирования ВМК МГУ.
Разработанный алгоритм может применяться при создании поисковых систем для архивов, библиотек и музейных коллекций, а также в исследованиях культурного и научного наследия. Авторы отмечают, что дальнейшее развитие метода связано с расширением наборов данных и адаптацией алгоритма к различным стилям письма.

Результаты исследования опубликованы в сборнике The International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences.


Источник: https://cnews.ru/link/n686650
Дата: 28.04.2026

Последние новости:

04.05.2026

Треть жителей Крыма использует нелегальное оборудование спутникового ТВ

В Крыму более трети населения используют нелицензионные спутниковые приемники типа «Горыныч», позволяющие принимать сигнал сразу с нескольких спутников, включая ...

04.05.2026

Всероссийский опрос о кадровой потребности

Опрос работодателей о перспективной потребности в кадрах проводится в период до 1 июня 2026 года на цифровой платформе ФГБУ «ВНИИ труда» Минтруда России. ...