Как работает синонимайзер
23.06.2008 Комментариев нет »
Принцип работы синонимайзера предельно прост и может быть выражен с помощью простого алгоритма.
- Загружаем исходный текст.
- Разбиваем его на слова
- Для каждого слова ищем его нормальную форму - для существительных - форму именительного падежа единственного числа, для прилагательных - форму именительного падежа единственного числа мужского рода
- Для каждой из нормальных форм ищем синонимы. Для существительных синонимы должны быть того же рода, что и само слово. Кроме того, синонимы должны быть из того же тематического словаря, что и исходное слово. Таким образом синонимы вроде “среда”-”окружение” будут доступны только для текстов по программированию, но не для общеупотребительной тематики, где для слова “среда” более подходящим синонимом будет сочетание “день недели” (хоть оно и мужского рода)
- В результирующем тексте используется один из синонимов, выбранный случайным образом, а в статье для размножения все синонимы должны быть перечислены в виде {syn1|syn2|syn3}.
- При необходимости для каждого из синонимов пользователь может выбрать альтернативу (при наличии более одного синонима для измененного слова).
В случае пакетной обработки файлов цикл повторяется столько раз, сколько файлов попало в поле зрения программы. Естественно, что шестой пункт становится недоступным из-за отсутствия интерактивности.

Последние комментарии