Как работает синонимайзер

Принцип работы синонимайзера предельно прост и может быть выражен с помощью простого алгоритма.

  1. Загружаем исходный текст.
  2. Разбиваем его на слова
  3. Для каждого слова ищем его нормальную форму - для существительных - форму именительного падежа единственного числа, для прилагательных - форму именительного падежа единственного числа мужского рода
  4. Для каждой из нормальных форм ищем синонимы. Для существительных синонимы должны быть того же рода, что и само слово. Кроме того, синонимы должны быть из того же тематического словаря, что и исходное слово. Таким образом синонимы вроде “среда”-”окружение” будут доступны только для текстов по программированию, но не для общеупотребительной тематики, где для слова “среда” более подходящим синонимом будет сочетание “день недели” (хоть оно и мужского рода)
  5. В результирующем тексте используется один из синонимов, выбранный случайным образом, а в статье для размножения все синонимы должны быть перечислены в виде {syn1|syn2|syn3}.
  6. При необходимости для каждого из синонимов пользователь может выбрать альтернативу (при наличии более одного синонима для измененного слова).

В случае пакетной обработки файлов цикл повторяется столько раз, сколько файлов попало в поле зрения программы. Естественно, что шестой пункт становится недоступным из-за отсутствия интерактивности.