Синонимайзер: итоги номер два
Выходные позади… Должен сказать, что выходные очень плодотворные. Это выразилось в том, что теперь у меня есть новый скриншот моего синонимайзера. Кликните по нему, чтобы увидеть его на полном экране.
На этом скриншоте показан результат ручной обработки текста из девяти слов. Левая панель содержит исходный текст, в котором красным подсвечены те слова, у которых есть синонимы. Под панелью находится панель опций. Вы можете экспериментировать с галочками и циферками для получения наилучшего результата.
Средняя панель содержит результат замены - слова, выделенные жирным, являются синонимами выделенных слов с левой панели. Под панелью есть три кнопки: первая генерирует очередной текст, подставляя другие синонимы, вторая сохраняет сгенерированный текст, третья - создает шаблон для размножения.
Правая панель содержит синонимы для слова, по которому кликнули на левой панели и кнопки для управления синонимами. Числа возле синонимов обозначают приоритет для каждого из синонимов. Большие числа - больший приоритет при выборе. Это значит, что при N выборках синоним с приоритетом 5 будет выбираться в 5 раз чаще, чем синоним с приоритетом 1.
К слову сказать, я планирую поменять панель результатов с панелью синонимов. Текущее расположение обусловлено тем, что в самом начале я планировал отрабатывать клики по панели с результатами. Теперь же, когда клики ловятся на левой панели, есть смысл перенести панель синонимов в центр, сместив при этом панель результатов направо.
Теперь о том, чего не хватает. А не хватает следующих вещей:
- добавления синонимов
- перенос выбранного слова в исключения
- реализации добавления опечаток для всех слов и превосходных форм для прилагательных
- преобразование цифр в словесную форму с приведением к тому же падежу, что и существительное.
- создание шаблона для размножения
По моим прогнозам мне может потребоваться от 10 до 14 дней для полного завершения работы над первой версией. Кстати, вторая версия обещает быть намного интересней. Я не скажу, что будет в ней, но морфологическим разбором предложений дело не закончится - у меня в запасе есть одна отличная мысль, которая позволит вывести мой синонимайзер на первые места по функционалу среди программ такого рода.



09.07.2008 в 07:42
У тебя синонимайзер обрабатывает слова только в нормальной форме, или все словоформы?
Я делал синонимайзер на базе MS Word: http://vovanmozg.com/2008/sinonimaizer-tekstov-dlya-russkogo-yazyka
Хочу попробовать выдернуть из него базу синонимов.
09.07.2008 в 20:38
Да, он обрабатывает все слова, независимо от того, в какой форме стоит слово. Таким образом если программа встречает слово “маленькую”, она приводит его в нормальную форму “маленький” и затем ищет синонимы уже для базовой формы. А затем приводит полученные прилагательные к женскому роду единственного числа и дательного падежа.