Словарная база синонимайзера
С легкой руки Dizels - моего постоянного читателя и комментатора (надеюсь, в дальнейшем он станет еще и критиком, а, может, еще и партнером) - решил переименовать Синонимизатор в Синонимайзер. Название приобрело если не зловещий, то по крайней мере хищный (устрашающий?) вид. Впрочем, надеюсь, что это не отпугнет моих потенциальных клиентов.
Теперь по теме… Словарная база синонимайзера составляет 310449 слов. Все слова разбиты по частям речи. Имена существительные введены в именительном падеже и единственном числе. Имена прилагательные введены в единственном числе мужского рода. Наречия и предлоги введены в своем единственном и неизменяемом виде.
Кроме того, есть база синонимов, насчитывающая 1301306 синонимических пар. К сожалению, синонимические пары имен существительных включают в себя синонимы из разных родов. Например, слово “авария” (ж.р.) имеет следующие синонимы: “катастрофа” (ж.р.), “поломка” (ж.р.), “крушение” (ср.р.) и даже “выход из строя” (сост.,м.р.).
На первых порах это не будет проблемой, так как я просто буду исключать слова других родов из списка синонимов. В дальнейшем планируется использование всех вариантов с заменой прилагательных на соответствующий род.
Кроме того я планирую разделить единую базу слов на несколько таблиц по направлениям. Таким образом мне удастся избегать неправильных замен слов. Например при исключении военной тематики, слово “автомат” может быть заменен на “установка”, “машина” и “агрегат”, а слово “калашников” будет исключено. Согласитесь, это должно быть правильным подходом.



23.06.2008 в 14:22
Очень верно написано, хорошо бы еще реализовать, по идее можно вообще создавать тематические базы синонимов + было бы хорошо сделать функцию, когда текст на автомате перевелся и потом человек его читает + возможно правит и правки эти программа запоминает, вот тогда со временем от такой базы толк будет, может даже сервак с этими базами сделать и доступ к нему платный. Правда на первых парах придется скорее всего наоборот как-то поощрять, чтобы пользовались.
23.06.2008 в 14:51
Нет, такой сервис сам по себе вряд ли будет интересен пользователям. Надо придумывать что-то, что будет включать данный функционал. Кстати, мысль по поводу разделения пар синонимов на тематические разделы весьма хороша. Возможно, я так и буду делать, вместо того, чтобы группировать словари из разных тем.