Мой сервер переезжает WordSyn: версия 5.1.1

WordSyn: работа с многословниками

Как уже говорилось не один раз - работа с многословниками - очень хорошее дело в любом синонимайзере. Конструкция, составленная из нескольких слов, может быть заменена другой конструкцией из нескольких слов, причем общий смысл будет передан более точно, чем если бы замене подвергались все слова по-отдельности.

На днях занимался прикручиванием работы с многословниками, и обнаружил вот какую штуку: работа с многословниками будет наиболее эффективной в двух случаях:

  1. если использовать умный обработчик любых многословных конструкций, который позволит разбирать многословную конструкцию, так что при этом можно будет воспользоваться услугами морфологического движка
  2. если хранить в базе все варианты всех многословных конструкций

Первый случай требует наличия парсера выражений, который сможет разобраться в частях речи слов, составляющих конструкцию и сможет выдать результирующее выражение в нужном роде, числе и падеже. Например, выражение “железной дорогой” должно быть приведено в вид “железная дорога”, найдено в словаре и заменено на слово “чугунка”, приведенное к родительному падежу единственного числа.

Второй случай не требует никаких телодвижений, кроме как простого поиска по словарю с последующей заменой исходного куска на новый.

При этом первый вариант требует напряженной работы с моей стороны, второй - со стороны пользователя программы или составителя словаря.

Так что дело за малым - решить: кого же напрягать - меня или пользователей? :)

google.com bobrdobr.ru del.icio.us technorati.com linkstore.ru news2.ru rumarkz.ru memori.ru moemesto.ru

Комментарии (3) на запись “WordSyn: работа с многословниками”

  1. Faster пишет:

    решить нужно немного другое- чего хотите вы? Если хотите создать интересный или даже уникальный продукт, привлекающий к себе пользователей(читай покупателей), то имхо необходимо придерживаться варианта №1. Вариант №2 уже давно существует у программ конкурирующих организаций, при цене около 20$.

  2. arch14 пишет:

    как вообще у вас обстоят дела? на форуме видел пост “коммерческое предложение”. Все ли благополучно разрешилось?
    Перевел 10 вмз за месяц на мультиридер.
    Это ваша прога создает файл db.db3? Здоровый он какой-то получился. Неужели я успел столько спарсить? О_о И как его почистить? удаление страниц в проекте выкидывает их в корзину, а как выкинуть из корзины?

  3. Faster пишет:

    к новому году будет подарок в виде новой версии програмы работающей с многословниками? :)

Оставить комментарий