Синонимайзер: предварительные итоги

В настоящий момент я уже успел сделать следующее:

  • обработчик одиночного текста с учетом морфологии. текст представлен в виде веб-странички с выпадающим списком на месте слов, для которых найден хотя бы один синоним.
  • редактор словаря. Для каждого слова из словаря может быть добавлен новый синоним или удален уже существующий

Continue reading »

Результат оптимизации

Итак, после того, как все приготовления были произведены, можно приступать к тестированию производительности. Возьмем наш текст про мышонка Феликса и прогоним его через наш синонимайзер. В результате получилось следующее:

  • символов с пробелами: 3239
  • символов без пробелов: 2706
  • всего русских слов: 539
  • неповторяющихся слов: 372
  • неповторяющихся слов, имеющих хотя бы один синоним: 275
  • всего найдено синонимов: 11868
  • неповторяющихся синонимов: 5372
  • время выполнения: 38.2 секунды (320 слов в секунду)

Continue reading »