К вопросу о цене граббера MultiReader: версия 1.2.8.214

MultiReader: версия 1.2.5.168

Только что закончил исправление одной неприятной ошибки, приводящей к значительной утечке памяти. Отлавливал я ее часов шесть, но все же поборол. Теперь после часа загрузки в десять потоков (примерно 70-80 страниц в минуту) программа занимает в памяти каких-то 25 мегабайт. Это достаточно серьезное достижение.

Вполне возможно, что уже скоро программа увидит свет. Надеюсь, это случится не позднее следующего понедельника, 19 января 2009 года. В финальной версии программа будет уметь грабить сайты в режиме паука и последовательности страниц (диапазон), причем сохранение и загрузка могут иметь свои собственные фильтры. Также будет присуствовать экспорт в текстовые и гипертекстовые файлы, а также в архив. В будущих версиях будет реализован выборочный экспорт по ключевым словам, рерайт и уникализация, и расширенное форматирование экспортируемых текстов.

Кстати, я благодарен Володе, моему партнеру из Москвы, который помогает мне тестировать мои программы, подает идеи и изредка критикует то, что я делаю.

google.com bobrdobr.ru del.icio.us technorati.com linkstore.ru news2.ru rumarkz.ru memori.ru moemesto.ru

Оставить комментарий