Первый скриншот синонимайзера

Я не хотел публиковать никакие скриншоты до тех пор, пока не будет показать хоть что-то более-менее серьезное и работоспособное. Но сегодня я закончил очередной кусок, который не грех и показать. Итак, увидеть его вы можете здесь.
Continue reading »

Пишу враппер для DLL-ки

После не слишком продолжительных поисков я нашел одну библиотечку, которая представляет собой морфологический анализатор. В числе прочих вещей он умеет возвращать нормальную форму слова, а также форму выбранного слова в любом роде, числе и падеже. В общем, очень мощная штука!
Continue reading »

И снова морфология

Оказывается, написать морфологический анализатор не так и просто. Впрочем, кто бы сомневался! Поэтому я пошел другим путем и стал рыскать в интернете в поисках уже готового решения. Нашлось несколько решений, которые подходят в той или иной мере.

Решение первое: программа написана на прологе, скомпилирована в и даже имеет файл хендлера для С++. У программы есть большой словарь, что является плюсом. Правда, не совсем понятно, как она работает. Но то, что она работает хорошо, видно по журналу отчета - сложносочиненные предложения она щелкает “на раз”, выделяя основные и вспомогательные члены предложения и указывая связи между ними. Например фраза “Российская Федерация обеспечивает целостность и неприкосновенность своей территории” разбирается в вот такую структуру:

+– # [существительные, объединеные союзом,им.пад.]
+– # [первая часть союза,третье лицо,ж.род,ед.число,им.пад.]
+– и [союз и,третье лицо,ж.род,ед.число,им.пад.]
¦ +– федерация [существительное,третье лицо,ж.род,ед.число,им.пад.]
¦ +– российская [прилагательное,третье лицо,ж.род,ед.число,им.пад.]
¦ +– обеспечивает [глагол,третье лицо,ж.род,ед.число,Н вр.,невозв.]
¦ +– целостность [существительное,третье лицо,ж.род,ед.число,вин.пад.]
+– неприкосновенность [существительное,третье лицо,ж.род,ед.число,им.пад.]
+– территории [существительное,третье лицо,ж.род,ед.число,род.пад.]
+– своей [местоименное прилагательное,третье лицо,ж.род,ед.число,род.пад.]

Что с этим можно сделать я пока еще не знаю, но в целом программа очень хороша! Кроме того, у меня возникли трудности с подключением этой к своему коду.
Continue reading »

Разбираем морфологию

Одной из важнейших задач, которые стоят перед лингвистическими автоматами, является морфологический анализ слов. Если заглянуть в Википедию, то можно обнаружить, что морфология - это раздел лингвистики, основным объектом которого являются слова естественных языков и их значимые части (морфемы). В задачи морфологии входит определение слова как особого языкового объекта и описание его внутренней структуры.
Continue reading »