WordSyn 5: разделение функционала по версиям

Начиная с пятой версии будет применена новая лицензионная модель, и, следовательно, возможность более четкого разделения функционала по версиям лицензий.

В настоящий момент определено четыре типа лицензий: WS0, WS1, WS2 и WS3. Все они будут содержать определенные ограничения функционала соответственно стоимости лицензии - чем ниже стоимость, тем больше ограничений. Ниже приведены функциональные возможности каждой из версий.
Continue reading »

WordSyn: работа с n-граммами

Только что закончил кусок кода, который будет получать синонимы для указанной пары слов. Эти синонимы будут формироваться на основе статистических данных о встречаемости слов в русскоязычной литературе. Для примера приведу результат поиска синонимов для двухсловника “толстый живот”. В таблице ниже представлены все пары синонимов для этого двухсловника. В скобках указывается количество раз, сколько данная пара встречалась во время обработки текстов, что можно принимать за вес данной пары синонимов, что, в свою очередь, позволит выбрать наиболее подходящие синонимы. Пары синонимов идут в порядке возрастания весов, так что последние 5 пар можно считать наиболее удачными.
Continue reading »

WordSyn 5.0 уже на подходе

Заканчиваю тестирование новой версии синонимайзера. Надеюсь, что к концу недели все баги будут выловлены, и новая версия увидит свет.

Кстати, практически все серьезные недочеты были исправлены. Особенно это относится к морфологии, так что проблем со склонением глаголов уже не будет.
Continue reading »

SimpleGrabber - сбор информации с одной странички

Только что выложил для скачивания небольшую программку, идею которой мне когда-то подбросили, а теперь я за пару часов ее сваял. Программка весит всего 30 килобайт и для своей работы требует .NET Framework 2.0.

Идея программы заключается в следующем:допустим, вам нужно найти на определенной странице все телефоны (емейлы, урлы или слова, начинающиеся на букву А), собрать их и сохранить в определенный файл, или просто вывести на экран, но в компактном виде. Руками делать это долго, самому писать - не у всех получится. И тут вам придет на помощь эта небольшая утилитка, выполненная в виде настольного приложения, работающего в среде Windows под управлением .NET Framework.
Continue reading »