Разбираем морфологию
Одной из важнейших задач, которые стоят перед лингвистическими автоматами, является морфологический анализ слов. Если заглянуть в Википедию, то можно обнаружить, что морфология - это раздел лингвистики, основным объектом которого являются слова естественных языков и их значимые части (морфемы). В задачи морфологии входит определение слова как особого языкового объекта и описание его внутренней структуры.
Таким образом, для построения приличного аппарата нам нужно построить конечный автомат, который будет получать на вход какое-либо слово а на выходе выдавать словарь, в котором это слово может быть найдено, часть речи, к которой оно принадлежит, в случае существительного - род и падеж, а в случае прилагательного - род данного слова.
Вторичной задачей данного автомата должно быть нахождение синонимов слова. Причем на выходе автомата эти синонимы должны быть того же рода и в том же падеже, что и исходное слово.
К сожалению, моя база не содержит правил морфологического анализа, поэтому придется создавать эти самые правила с чистого листа. В настоящий момент у меня есть правила для определения рода имени существительного в именительном падеже.
Итак: если слово заканчивается на о, е или и - это средний род. Если слово заканчивается на а, я или мягкий знак (кроме -ель) - это женский род. Все остальные варианты написания - мужской род. Правда, меня постоянно гложет мысль, что я что-то упустил.
Посмотрим, может это просто червячок сомнения?



Последние комментарии