Реализована проверка схожести текстов
11.08.2008 1 комментарий »
Сегодня, благодаря Глумию, моему постоянному тестеру, я все-таки реализовал проверку похожести текстов. Проверка производится по методу десятисловных шинглов. В настоящий момент обрабатываются все слова: предлоги, междоментия и вводные слова учитываются. В дальнейшем я планирую улучшить метод проверки для того, чтобы минимизировать влияние указанных частей речи на проверку.
Continue reading »

Последние комментарии