В настоящий момент я уже успел сделать следующее:
- обработчик одиночного текста с учетом морфологии. текст представлен в виде веб-странички с выпадающим списком на месте слов, для которых найден хотя бы один синоним.
- редактор словаря. Для каждого слова из словаря может быть добавлен новый синоним или удален уже существующий
Continue reading »
Итак, после того, как все приготовления были произведены, можно приступать к тестированию производительности. Возьмем наш текст про мышонка Феликса и прогоним его через наш синонимайзер. В результате получилось следующее:
- символов с пробелами: 3239
- символов без пробелов: 2706
- всего русских слов: 539
- неповторяющихся слов: 372
- неповторяющихся слов, имеющих хотя бы один синоним: 275
- всего найдено синонимов: 11868
- неповторяющихся синонимов: 5372
- время выполнения: 38.2 секунды (320 слов в секунду)
Continue reading »
Последние комментарии