WordSyn 5: предрелизная подготовка

Итак, словари побеждены. Теперь они хранятся не в базе, а в файле, по одному файлу на словарь. При этом словари загружаются в оперативную память, и программа работает с хешированным списком. В зависимости от размера словаря скорость поиска синонимов для слов увеличилась от 20 до 5 раз (чем больше словарь, тем ниже скорость поиска). В любом случае скорость поиска слов увеличена. Кроме всего прочего, увеличилась скорость импорта словарей: словарь на 5к слов импортируется со средней скоростью 750 строк в секунду, так что импорт этого словаря занимает около не более 10 секунд. Словарь на 30к слов импортируется чуть медленней - со средней скоростью 650 строк в секунду, так что импорт проходит чуть меньше минуты. Все измерения производились на компьютере с процессором Intel Core 2 Duo 2.66GHz, 2MB RAM и дисковой подсистемой на базе двух SCSI дисков Fujitsu 74GB 10K RPM, подключенных через SCSI-контроллер с пропускной способностью шины 160 мегабайт в секунду. Чуть позже я сделаю замеры скоростей на своем ноутбуке, но уже сейчас можно предположить, что скорость работы будет меньше не более чем в четыре раза.
Continue reading »

WordSyn 5: вести с полей

Последние две недели усиленно занимался доработкой подсистемы словарей. Это потребовало больших усилий, чем я ожидал, так что выпуск новой версии пришлось снова отложить. Это еще усугубилось тем, что в компьютере сгорел SCSI контроллер вместе с дисками, из-за чего неделя работы ушла коту под хвост. Бекап спас, но неделя работы была потеряна.
Continue reading »

WordSyn 5: разделение функционала по версиям

Начиная с пятой версии будет применена новая лицензионная модель, и, следовательно, возможность более четкого разделения функционала по версиям лицензий.

В настоящий момент определено четыре типа лицензий: WS0, WS1, WS2 и WS3. Все они будут содержать определенные ограничения функционала соответственно стоимости лицензии - чем ниже стоимость, тем больше ограничений. Ниже приведены функциональные возможности каждой из версий.
Continue reading »

WordSyn: работа с n-граммами

Только что закончил кусок кода, который будет получать синонимы для указанной пары слов. Эти синонимы будут формироваться на основе статистических данных о встречаемости слов в русскоязычной литературе. Для примера приведу результат поиска синонимов для двухсловника “толстый живот”. В таблице ниже представлены все пары синонимов для этого двухсловника. В скобках указывается количество раз, сколько данная пара встречалась во время обработки текстов, что можно принимать за вес данной пары синонимов, что, в свою очередь, позволит выбрать наиболее подходящие синонимы. Пары синонимов идут в порядке возрастания весов, так что последние 5 пар можно считать наиболее удачными.
Continue reading »

WordSyn 5.0 уже на подходе

Заканчиваю тестирование новой версии синонимайзера. Надеюсь, что к концу недели все баги будут выловлены, и новая версия увидит свет.

Кстати, практически все серьезные недочеты были исправлены. Особенно это относится к морфологии, так что проблем со склонением глаголов уже не будет.
Continue reading »

SimpleGrabber - сбор информации с одной странички

Только что выложил для скачивания небольшую программку, идею которой мне когда-то подбросили, а теперь я за пару часов ее сваял. Программка весит всего 30 килобайт и для своей работы требует .NET Framework 2.0.

Идея программы заключается в следующем:допустим, вам нужно найти на определенной странице все телефоны (емейлы, урлы или слова, начинающиеся на букву А), собрать их и сохранить в определенный файл, или просто вывести на экран, но в компактном виде. Руками делать это долго, самому писать - не у всех получится. И тут вам придет на помощь эта небольшая утилитка, выполненная в виде настольного приложения, работающего в среде Windows под управлением .NET Framework.
Continue reading »

WordSyn: версия 5.х

Наконец-то у меня дошли руки и до моего синонимайзера, и я полным ходом принялся за реализацию новых фич.

В новой версии следует ждать таких нововведений:

  • будет изменена лицензионная модель
  • будет добавлена возможность работы с многословниками
  • будет добавлена работа с тематическими словарями
  • будет реализована возможность генерации (размножения) статей
  • будет улучшена работа с одним текстом
  • будет улучшен сам текстовый редактор
  • будет введена функция уточнения синонимов на основе базы n-грамм (только версия W3)

Continue reading »

Акция закончена. Да здравствует акция!

Итак, то ли я мало рассказывал об акции “1 к 5″, то ли никому это не нужно, но откликов было не очень много. Поэтому акция досрочно отменяется. Вместо нее в честь первого сентября [привет школьникам!] объявляется другая акция “Половинка”. По условиям этой акции любой продукт может быть приобретен за половину стоимости. Условия распространяются и на существующие скидки. Поэтому если вы являетесь владельцем коммерческой лицензии на WordSyn, вы получаете дополнительную скидку в 50% на уже имеющуюся скидку. Таким образом вы можете приобрести любую программу за четверть стоимости.
Continue reading »

MultiSense - обновление инсталлятора

Сегодня была обнаружена ошибка в инсталляторе, которая приводила к тому, что программа не могла скачать из интернета базу синонимов. Такая ошибка не возникала если мультисенс устанавливался после мультиридера. Если же эта программа устанавливалась первой, то она не могла найти папку для загрузки нужного файла.
Continue reading »

Пришла беда - отворяй ворота…

В мой дом пришла беда. Причем такая, что даже врагу не пожелаешь. Благодаря произволу чиновников и их нежеланию (неспособности?) помочь и вследствие махинаций, произведенных нехорошими людьми, моя семья может лишиться своего дома. Последние пять лет мы боремся за него, потратили более 10 тысяч долларов, прошли через кучу судебных заседаний, пережили две апелляции, но это ни к чему не привело - вчера апелляционный суд (третий по счету) вынес решение не в нашу пользу. И теперь нам предстоит последнее дело - чтобы дом остался нашим, нам нужно выплатить в бюджет 20000 долларов. Сумма, скажем прямо, неподъемная. По крайней мере за те пару недель, которые остались до прихода исполнительной службы, заработать ее невозможно.
Continue reading »