WordSyn 5: предрелизная подготовка WordSyn 5: работа со словарями

WordSyn 5: о скорости работы программы

Написал предыдущий пост и тут же решил испытать скорость работы программы.

Для начала был синонимизирован мой предыдущий пост. Он содержит 2482 символа (с пробелами), 372 слова (367 неповторяющихся). Обработка этого текста заняла 8 секунд, в результате чего 167 слов (45.5%) было заменено на синонимы. Похожесть текстов: 0%.

Вторым был синонимизирован детектив размером 44439 символов (с пробелами), в котором было 6379 слов, из которых только 2784 слова были уникальными. Вся обработка текста заняла 1 минуту и 53 секунды. В результате получилась следующая картина: 2511 слов (39.4%) было заменено на синонимы, что дало нулевую похожесть по методу десятисловных шинглов.

Синонимизация полуторамегабайтного текста (109 000 слов всего, 23 000 неповторяющихся слов) показала скорость обработки примерно 2000 слов в минуту, так что на 23 тысячи слов ушло бы чуть мнее 12 минут. Правда, после синонимизации программа должна распределять полученные синонимы по тексту и создать текст для отображения, что заняло бы еще минут 40. Так что я не стал ждать и остановил проект, понимая, что не стоит тратить время только для того, чтобы посмотреть статистику. Надеюсь, вы тоже не занимаетесь такой ерундой, как синонимизация гигантских текстов в ручном режиме - для этого более эффективно использовать автоматический режим. Все равно просмотреть и исправить такой текст вручную достаточно проблематично.

Таким образом все три проверки показали одинаковый результат: скрость обработки составляет примерно 2000 слов в минуту. И это с использованием морфологии. Если же использовать простой поиск по словарю, то скорость обработки должна еще возрасти. Это я проверю чуть позже, когда будет возможность отключать морфологический движок в настройках программы.

google.com bobrdobr.ru del.icio.us technorati.com linkstore.ru news2.ru rumarkz.ru memori.ru moemesto.ru

Комментарии (8) на запись “WordSyn 5: о скорости работы программы”

  1. михаил пишет:

    Здравствуйте.
    Уже наверно надоел этот вопрос, но все же когда примерно ожидать выхода обновленной программы? И еще вопрос: я владелец комерческой лицензии, на что мне расчитывать в плане обновления программы, а то читая информацию на этом блоге, совсем запутался что ждет меня в плане обновления.
    С уважением.

  2. Faster пишет:

    ты получишь лицензию WS2. Или доплатив 1$, можешь получить лицензию WS3-максимальную. Но есть одно НО, то что заложено в WS3, не будет реализовано в так сильно ожидаемом нами всеми релизе. Кстати, Мастер, в какой срок нужно заплатить 1$ владельцам бывшей “коммерческой” лицензии чтобы застолбить за собой право когда-нибудь в будущем воспользоваться благами возможностей WS3?

  3. Мастер пишет:

    2Михаил: программа уже отдана на тестирование, так что версия 5.0.1 выйдет уже в следующий понедельник. О том, что нужно сделать для того, чтобы получить обновление, и что вы можете ожидать в будущих обновлениях я напишу в следующем посте.

  4. GTAlex пишет:

    ещё бы выложил почитать - что получилось то из твоего предыдущего поста в результате работы проги ?

  5. Мастер пишет:

    2GTAlex: на самом деле это в настоящий момент значения не имеет. Результат обработки текста в разных вариантах программы появится чуть позже. Для этого я выделю отдельный пост и вывешу результаты обработки на сайте программы.

  6. михаил пишет:

    спасибо за ответ!

  7. dungan пишет:

    и поддержку английского не забудьте, как обежали

  8. Мастер пишет:

    Поддержка английского включена. Правда, из-за того, что уровень моего английского оставляет желать лучшего, словари для этого языка придется составлять самостоятельно.

Оставить комментарий