WordSyn: версия 5.0.2

Наконец-то это произошло: выложил для скачивания первый релиз пятой версии синонимайзера.

Для того, чтобы установить новую версию вам нужно сделать следующие шаги:

  1. Скачать архив с программой
  2. Установить программу с дефолтными установками
  3. Скачать архив со словарями
  4. Установить словари с дефолтными установками

Внимание!!! Программа не работает без установленных словарей!
Continue reading »

WordSyn 5: работа со словарями

Как я уже писал раньше, в новой версии используется совершенно новый подход к работе со словарями. Теперь они компилируются в бинарный вид и полностью загружаются в память компьютера во время запуска программы. В результате этого нововведения программа стала работать быстрее, но при этом в ее работе появились некоторые ошибки, исправлением которых я и занимаюсь последнее время.
Continue reading »

WordSyn 5: о скорости работы программы

Написал предыдущий пост и тут же решил испытать скорость работы программы.

Для начала был синонимизирован мой предыдущий пост. Он содержит 2482 символа (с пробелами), 372 слова (367 неповторяющихся). Обработка этого текста заняла 8 секунд, в результате чего 167 слов (45.5%) было заменено на синонимы. Похожесть текстов: 0%.
Continue reading »

WordSyn 5: предрелизная подготовка

Итак, словари побеждены. Теперь они хранятся не в базе, а в файле, по одному файлу на словарь. При этом словари загружаются в оперативную память, и программа работает с хешированным списком. В зависимости от размера словаря скорость поиска синонимов для слов увеличилась от 20 до 5 раз (чем больше словарь, тем ниже скорость поиска). В любом случае скорость поиска слов увеличена. Кроме всего прочего, увеличилась скорость импорта словарей: словарь на 5к слов импортируется со средней скоростью 750 строк в секунду, так что импорт этого словаря занимает около не более 10 секунд. Словарь на 30к слов импортируется чуть медленней - со средней скоростью 650 строк в секунду, так что импорт проходит чуть меньше минуты. Все измерения производились на компьютере с процессором Intel Core 2 Duo 2.66GHz, 2MB RAM и дисковой подсистемой на базе двух SCSI дисков Fujitsu 74GB 10K RPM, подключенных через SCSI-контроллер с пропускной способностью шины 160 мегабайт в секунду. Чуть позже я сделаю замеры скоростей на своем ноутбуке, но уже сейчас можно предположить, что скорость работы будет меньше не более чем в четыре раза.
Continue reading »

WordSyn 5: вести с полей

Последние две недели усиленно занимался доработкой подсистемы словарей. Это потребовало больших усилий, чем я ожидал, так что выпуск новой версии пришлось снова отложить. Это еще усугубилось тем, что в компьютере сгорел SCSI контроллер вместе с дисками, из-за чего неделя работы ушла коту под хвост. Бекап спас, но неделя работы была потеряна.
Continue reading »

WordSyn 5: разделение функционала по версиям

Начиная с пятой версии будет применена новая лицензионная модель, и, следовательно, возможность более четкого разделения функционала по версиям лицензий.

В настоящий момент определено четыре типа лицензий: WS0, WS1, WS2 и WS3. Все они будут содержать определенные ограничения функционала соответственно стоимости лицензии - чем ниже стоимость, тем больше ограничений. Ниже приведены функциональные возможности каждой из версий.
Continue reading »

WordSyn: работа с n-граммами

Только что закончил кусок кода, который будет получать синонимы для указанной пары слов. Эти синонимы будут формироваться на основе статистических данных о встречаемости слов в русскоязычной литературе. Для примера приведу результат поиска синонимов для двухсловника “толстый живот”. В таблице ниже представлены все пары синонимов для этого двухсловника. В скобках указывается количество раз, сколько данная пара встречалась во время обработки текстов, что можно принимать за вес данной пары синонимов, что, в свою очередь, позволит выбрать наиболее подходящие синонимы. Пары синонимов идут в порядке возрастания весов, так что последние 5 пар можно считать наиболее удачными.
Continue reading »

WordSyn 5.0 уже на подходе

Заканчиваю тестирование новой версии синонимайзера. Надеюсь, что к концу недели все баги будут выловлены, и новая версия увидит свет.

Кстати, практически все серьезные недочеты были исправлены. Особенно это относится к морфологии, так что проблем со склонением глаголов уже не будет.
Continue reading »

WordSyn: версия 5.х

Наконец-то у меня дошли руки и до моего синонимайзера, и я полным ходом принялся за реализацию новых фич.

В новой версии следует ждать таких нововведений:

  • будет изменена лицензионная модель
  • будет добавлена возможность работы с многословниками
  • будет добавлена работа с тематическими словарями
  • будет реализована возможность генерации (размножения) статей
  • будет улучшена работа с одним текстом
  • будет улучшен сам текстовый редактор
  • будет введена функция уточнения синонимов на основе базы n-грамм (только версия W3)

Continue reading »

Синонимайзеру - год!

22 июля моему синонимайзеру исполнится год. В связи с этим объявляется акция - одна лицензия за полцены, или три лицензии по цене одной! В первом случае вы можете приобрести лицензию за половину ее текущей стоимости. Во втором случае вы оплачиваете одну, а получаете три лицензии на синонимайзер.
Continue reading »