Реализована проверка схожести текстов

Сегодня, благодаря Глумию, моему постоянному тестеру, я все-таки реализовал проверку похожести текстов. Проверка производится по методу десятисловных шинглов. В настоящий момент обрабатываются все слова: предлоги, междоментия и вводные слова учитываются. В дальнейшем я планирую улучшить метод проверки для того, чтобы минимизировать влияние указанных частей речи на проверку.
Continue reading »