WordSyn: работа с многословниками
Как уже говорилось не один раз - работа с многословниками - очень хорошее дело в любом синонимайзере. Конструкция, составленная из нескольких слов, может быть заменена другой конструкцией из нескольких слов, причем общий смысл будет передан более точно, чем если бы замене подвергались все слова по-отдельности.
На днях занимался прикручиванием работы с многословниками, и обнаружил вот какую штуку: работа с многословниками будет наиболее эффективной в двух случаях:
- если использовать умный обработчик любых многословных конструкций, который позволит разбирать многословную конструкцию, так что при этом можно будет воспользоваться услугами морфологического движка
- если хранить в базе все варианты всех многословных конструкций
Первый случай требует наличия парсера выражений, который сможет разобраться в частях речи слов, составляющих конструкцию и сможет выдать результирующее выражение в нужном роде, числе и падеже. Например, выражение “железной дорогой” должно быть приведено в вид “железная дорога”, найдено в словаре и заменено на слово “чугунка”, приведенное к родительному падежу единственного числа.
Второй случай не требует никаких телодвижений, кроме как простого поиска по словарю с последующей заменой исходного куска на новый.
При этом первый вариант требует напряженной работы с моей стороны, второй - со стороны пользователя программы или составителя словаря.
Так что дело за малым - решить: кого же напрягать - меня или пользователей? ![]()



10.12.2009 в 14:09
решить нужно немного другое- чего хотите вы? Если хотите создать интересный или даже уникальный продукт, привлекающий к себе пользователей(читай покупателей), то имхо необходимо придерживаться варианта №1. Вариант №2 уже давно существует у программ конкурирующих организаций, при цене около 20$.
24.12.2009 в 23:33
как вообще у вас обстоят дела? на форуме видел пост “коммерческое предложение”. Все ли благополучно разрешилось?
Перевел 10 вмз за месяц на мультиридер.
Это ваша прога создает файл db.db3? Здоровый он какой-то получился. Неужели я успел столько спарсить? О_о И как его почистить? удаление страниц в проекте выкидывает их в корзину, а как выкинуть из корзины?
28.12.2009 в 11:10
к новому году будет подарок в виде новой версии програмы работающей с многословниками?