Итак, после двух недель отдыха я снова с вами.
Новый проект - мультиридер, программа, которая будет грабить сайты и складывать их контент в отдельную кучку. Именно с нее мне надо было начинать, а не с мультипостера. Ну, да ладно. Не все так плохо.
Идея программы не нова - вы можете встретить подобные продукты, созданные для работы на стороне сервера. Это набор скриптов (чаще всего PHP), которые запускаются по расписанию, а доступ к приложению возможен с любого компьютера, подключенного к интернету, что является несомненным плюсом. Вторым плюсом можно назвать возможность закачки огромного количества страниц в считанные часы. Но это, правда, возможно только если хостинг, на котором расположены эти скрипты, имеет достаточно толстый канал. Минусом сервер-ориентированных приложений является не слишком хорошая управляемость и время, необходимое на доступ к данным. В то же время настольные приложения лишены подобных недостатков, предоставляя доступ к данным практически мгновенно. Вы можете управлять заданиями, скоростью загрузки и прочими задачами, и все это будет происходить чрезвычайно быстро. Минусом данного подхода является необходимость постоянного подключения к интернету и включенный компьютер. Однако, вспомним программу TelePort и не будем капризничать.
Continue reading »
Только что закончил очередной кусок работы над исправлением ошибок и добавлению некоторых фич. Так, теперь в ручном режиме появились следующие изменения:
- нажатие на кнопку Словари раскрывает выпадающий список со словарями, вместо того, чтобы открывать отдельное окно для их выбора.
- в контекстном меню появилась новая кнопка - Стандартное меню, нажатие на которую переключает расширенное меню в обычное. В обычном же выпадающем меню также появился пункт “Расширенное меню”, нажатие на который переключает контекстное меню в расширенный вид.
- при клике на каком либо из слов в панели результатов синонимизации, текс в панели исходного текста автоматически прокручивается к нужному месту, а оригинальное слово подсвечивается. Теперь уже не будет нужно скролить исходный текст в поисках нужного места. Это, конечно же, касается только длинных текстов, так как во время обработки коротких текстов такой потребности не возникает.
Continue reading »
Итак, начались предновогодние декады. Еще каких-то 20 дней, и можно будет ненадолго оторваться от компьютера и под звон курантов выпить бокальчик томатного сока! А потом снова за компьютер. Ведь говорят, что как год начнешь, так его и закончишь! Поэтому в 0:30 первого января буду сидеть за компом с кучей денег во всех карманах. Ну, чтобы весь год была работа за компом и чтобы за нее платили хорошие денежки.
Continue reading »
Вчера в очередной раз переделал программу для сбора пар. Это был уже раз пятый, наверное. На этот раз мне надоели постоянные эксепшны OutOfMemory, так что я убрал кеширование данных в памяти, из-а чего проиводительность резко упала до уровня 200-250 слов в секунду. Но при этом я сделал обработку в пяти потоках, так что в сумме получается обрабатывать где-то по 900-1200 слов в секунду. Конечно, это в десять раз медленней, чем при использовании кеша в памяти, но зато и более надежно - я могу рассчитывать, что программа будет работать сутками, не ломаясь и не падая.
Continue reading »
Последние комментарии