WordSyn: множественные словари-2 WordSyn: множественные словари - 3

WordSyn: многословные конструкции

Сегодня по дороге на работу придумал, как сделать функционал для многословных конструкций. Для этого достаточно сделать таблицу со, скажем, десятью полями, в которых будут храниться идентификаторы слов. Заполняться она может с помощью импорта словаря или вручную. Во время обработки текста такие конструкции будут находиться и заменяться на соответствующие много- или однословные синонимы, которые будут браться из той же таблицы. Вот только один вопрос возникает: что делать, если найдется две конструкции, начинающиеся с одной и той же последовательности слов? Брать меньшую или большую? Пока писал предыдущую фразу, понял, что нужно брать наибольшую найденную. Но в этом случае, если в словаре будет конструкция “пошел ты” с синонимом “отвали”, то при нахождении конструкции “пошел ты к чертовой матери”, которая должна иметь синоним “иди на хер”, она будет заменена на “отвали к чертовой матери”. Это, в принципе, звучит правильно, но разве так кто-то говорит?

google.com bobrdobr.ru del.icio.us technorati.com linkstore.ru news2.ru rumarkz.ru memori.ru moemesto.ru

Оставить комментарий