В связи с переездом мой блог и все остальные сайты начиная с 1 декабря будут недоступны. Надеюсь, что переезд произойдет достаточно быстро, хоть это и займет не менее двух дней. К сожалению, некоторые накладки не дают сделать этот переезд прозрачным и незаметным. Надеюсь, отсутствие доступа к блогу не очень вас опечалит.
Выложен для скачивания новый релиз программы. Скачать его можно отсюда.
Изменения в этом релизе минимальны, хотя по-своему этот релиз достоин того, чтобы его скачать и установить. Список изменений представлен ниже.
Continue reading »
Выложена для скачивания версия синонимайзера 5.0.4
Скачать ее можно отсюда. Словари для морфологического движка нужно скачивать отсюда.
Continue reading »
Почти все, кто установил себе новую версию программы задают мне разные вопросы, касающиеся разных аспектов работы с синонимайзером. В этом посте я постараюсь ответить на большинство из них, чтобы в дальнейшем мне не приходилось повторять то же самое еще и еще.
Continue reading »
Сегодня несколько часов провел за реализацией поиска подходящих пар слов. Объем программы вырос на 8 мегабайт за счет внедрения в код данных о 775 тысячах пар “прилагательное-существительное”. Теперь программа может выдавать все известные ей пары синонимов для любых известных ей слов. При этом программа не только возвращает эти пары, но еще и приводит прилагательные к нужному роду, числу и падежу. Так что теперь осталось только прикрутить эту фичу к синонимайзеру и научить его использовать эту замечательную базу.
Continue reading »
Выложена для скачивания новая версия программы. Скачать ее можно отсюда. Морфологические словари для программы (если вы их еще не скачивали) скачиваете отсюда.
Continue reading »
Наконец-то это произошло: выложил для скачивания первый релиз пятой версии синонимайзера.
Для того, чтобы установить новую версию вам нужно сделать следующие шаги:
- Скачать архив с программой
- Установить программу с дефолтными установками
- Скачать архив со словарями
- Установить словари с дефолтными установками
Внимание!!! Программа не работает без установленных словарей!
Continue reading »
Как я уже писал раньше, в новой версии используется совершенно новый подход к работе со словарями. Теперь они компилируются в бинарный вид и полностью загружаются в память компьютера во время запуска программы. В результате этого нововведения программа стала работать быстрее, но при этом в ее работе появились некоторые ошибки, исправлением которых я и занимаюсь последнее время.
Continue reading »
Написал предыдущий пост и тут же решил испытать скорость работы программы.
Для начала был синонимизирован мой предыдущий пост. Он содержит 2482 символа (с пробелами), 372 слова (367 неповторяющихся). Обработка этого текста заняла 8 секунд, в результате чего 167 слов (45.5%) было заменено на синонимы. Похожесть текстов: 0%.
Continue reading »
Итак, словари побеждены. Теперь они хранятся не в базе, а в файле, по одному файлу на словарь. При этом словари загружаются в оперативную память, и программа работает с хешированным списком. В зависимости от размера словаря скорость поиска синонимов для слов увеличилась от 20 до 5 раз (чем больше словарь, тем ниже скорость поиска). В любом случае скорость поиска слов увеличена. Кроме всего прочего, увеличилась скорость импорта словарей: словарь на 5к слов импортируется со средней скоростью 750 строк в секунду, так что импорт этого словаря занимает около не более 10 секунд. Словарь на 30к слов импортируется чуть медленней - со средней скоростью 650 строк в секунду, так что импорт проходит чуть меньше минуты. Все измерения производились на компьютере с процессором Intel Core 2 Duo 2.66GHz, 2MB RAM и дисковой подсистемой на базе двух SCSI дисков Fujitsu 74GB 10K RPM, подключенных через SCSI-контроллер с пропускной способностью шины 160 мегабайт в секунду. Чуть позже я сделаю замеры скоростей на своем ноутбуке, но уже сейчас можно предположить, что скорость работы будет меньше не более чем в четыре раза.
Continue reading »
Последние комментарии