Наконец-то это произошло: выложил для скачивания первый релиз пятой версии синонимайзера.
Для того, чтобы установить новую версию вам нужно сделать следующие шаги:
- Скачать архив с программой
- Установить программу с дефолтными установками
- Скачать архив со словарями
- Установить словари с дефолтными установками
Внимание!!! Программа не работает без установленных словарей!
Continue reading »
Как я уже писал раньше, в новой версии используется совершенно новый подход к работе со словарями. Теперь они компилируются в бинарный вид и полностью загружаются в память компьютера во время запуска программы. В результате этого нововведения программа стала работать быстрее, но при этом в ее работе появились некоторые ошибки, исправлением которых я и занимаюсь последнее время.
Continue reading »
Написал предыдущий пост и тут же решил испытать скорость работы программы.
Для начала был синонимизирован мой предыдущий пост. Он содержит 2482 символа (с пробелами), 372 слова (367 неповторяющихся). Обработка этого текста заняла 8 секунд, в результате чего 167 слов (45.5%) было заменено на синонимы. Похожесть текстов: 0%.
Continue reading »
Итак, словари побеждены. Теперь они хранятся не в базе, а в файле, по одному файлу на словарь. При этом словари загружаются в оперативную память, и программа работает с хешированным списком. В зависимости от размера словаря скорость поиска синонимов для слов увеличилась от 20 до 5 раз (чем больше словарь, тем ниже скорость поиска). В любом случае скорость поиска слов увеличена. Кроме всего прочего, увеличилась скорость импорта словарей: словарь на 5к слов импортируется со средней скоростью 750 строк в секунду, так что импорт этого словаря занимает около не более 10 секунд. Словарь на 30к слов импортируется чуть медленней - со средней скоростью 650 строк в секунду, так что импорт проходит чуть меньше минуты. Все измерения производились на компьютере с процессором Intel Core 2 Duo 2.66GHz, 2MB RAM и дисковой подсистемой на базе двух SCSI дисков Fujitsu 74GB 10K RPM, подключенных через SCSI-контроллер с пропускной способностью шины 160 мегабайт в секунду. Чуть позже я сделаю замеры скоростей на своем ноутбуке, но уже сейчас можно предположить, что скорость работы будет меньше не более чем в четыре раза.
Continue reading »
Последние две недели усиленно занимался доработкой подсистемы словарей. Это потребовало больших усилий, чем я ожидал, так что выпуск новой версии пришлось снова отложить. Это еще усугубилось тем, что в компьютере сгорел SCSI контроллер вместе с дисками, из-за чего неделя работы ушла коту под хвост. Бекап спас, но неделя работы была потеряна.
Continue reading »
Начиная с пятой версии будет применена новая лицензионная модель, и, следовательно, возможность более четкого разделения функционала по версиям лицензий.
В настоящий момент определено четыре типа лицензий: WS0, WS1, WS2 и WS3. Все они будут содержать определенные ограничения функционала соответственно стоимости лицензии - чем ниже стоимость, тем больше ограничений. Ниже приведены функциональные возможности каждой из версий.
Continue reading »
Только что закончил кусок кода, который будет получать синонимы для указанной пары слов. Эти синонимы будут формироваться на основе статистических данных о встречаемости слов в русскоязычной литературе. Для примера приведу результат поиска синонимов для двухсловника “толстый живот”. В таблице ниже представлены все пары синонимов для этого двухсловника. В скобках указывается количество раз, сколько данная пара встречалась во время обработки текстов, что можно принимать за вес данной пары синонимов, что, в свою очередь, позволит выбрать наиболее подходящие синонимы. Пары синонимов идут в порядке возрастания весов, так что последние 5 пар можно считать наиболее удачными.
Continue reading »
Заканчиваю тестирование новой версии синонимайзера. Надеюсь, что к концу недели все баги будут выловлены, и новая версия увидит свет.
Кстати, практически все серьезные недочеты были исправлены. Особенно это относится к морфологии, так что проблем со склонением глаголов уже не будет.
Continue reading »
Наконец-то у меня дошли руки и до моего синонимайзера, и я полным ходом принялся за реализацию новых фич.
В новой версии следует ждать таких нововведений:
- будет изменена лицензионная модель
- будет добавлена возможность работы с многословниками
- будет добавлена работа с тематическими словарями
- будет реализована возможность генерации (размножения) статей
- будет улучшена работа с одним текстом
- будет улучшен сам текстовый редактор
- будет введена функция уточнения синонимов на основе базы n-грамм (только версия W3)
Continue reading »
22 июля моему синонимайзеру исполнится год. В связи с этим объявляется акция - одна лицензия за полцены, или три лицензии по цене одной! В первом случае вы можете приобрести лицензию за половину ее текущей стоимости. Во втором случае вы оплачиваете одну, а получаете три лицензии на синонимайзер.
Continue reading »
Последние комментарии