Словарная база синонимайзера Как работает синонимайзер

Разбираем морфологию

Одной из важнейших задач, которые стоят перед лингвистическими автоматами, является морфологический анализ слов. Если заглянуть в Википедию, то можно обнаружить, что морфология - это раздел лингвистики, основным объектом которого являются слова естественных языков и их значимые части (морфемы). В задачи морфологии входит определение слова как особого языкового объекта и описание его внутренней структуры.

Таким образом, для построения приличного аппарата нам нужно построить конечный автомат, который будет получать на вход какое-либо слово а на выходе выдавать словарь, в котором это слово может быть найдено, часть речи, к которой оно принадлежит, в случае существительного - род и падеж, а в случае прилагательного - род данного слова.

Вторичной задачей данного автомата должно быть нахождение синонимов слова. Причем на выходе автомата эти синонимы должны быть того же рода и в том же падеже, что и исходное слово.

К сожалению, моя база не содержит правил морфологического анализа, поэтому придется создавать эти самые правила с чистого листа. В настоящий момент у меня есть правила для определения рода имени существительного в именительном падеже.

Итак: если слово заканчивается на о, е или и - это средний род. Если слово заканчивается на а, я или мягкий знак (кроме -ель) - это женский род. Все остальные варианты написания - мужской род. Правда, меня постоянно гложет мысль, что я что-то упустил. :( Посмотрим, может это просто червячок сомнения?

google.com bobrdobr.ru del.icio.us technorati.com linkstore.ru news2.ru rumarkz.ru memori.ru moemesto.ru

Оставить комментарий