WordSyn: сохранение форматирования в HTML

В общем, я решил, что необходимо такую фичу, как сохранение форматирования гипертекстовых документов оставить. Теперь среди опций настройки источника файлов для пакетного чтения появился чекбокс, отвечающий за сохранение форматирования. Достаточно его установить, и все форматирование в HTML-документах останется на своих местах.
Continue reading »

WordSyn: баг или фича в пакетном режиме?

При обработке гипертекста в автоматическом режиме удаляются все теги. Мне сказали, что это баг. Но на самом деле такой подход нужен в том случае, если нужно получить чистый текст без форматирования. Если же преследуется цель отсинонимизировать гипертекст без потери форматирования, то надо будет ввести постобработку текста, чтобы отсинонимизированный текст вписался в то форматирование, которое имел оригинальный текст.
Continue reading »

WordSyn: версия 0.4.0.5

Оказалось, что я сделал еще несколько ошибок, которые и были исправлены в двух последовательных обновлениях. Так в версии 0.4.0.4 была исправлена пакетная обработка, а в версии 0.4.0.5 была исправлена ошибка, возникающая при добавлении нового синонима.
Обновление было выложено на сервер и может быть загружено с помощью программы-апдейтера, которая идет в комплекте поставки программы.

WordSyn: версия 0.4.0.3

Не прошло и часа, как я выложил апдейт: версию 0.4.0.3

В этой версии был добавлен файл базы данных для апдейтера и исправлен баг, возникающий при экспорте словаря в текстовый вид. К сожалению, проблема с апдейтером в версии 0.4.0.1 не позволит нормально обновлять файлы, так что всем, кто скачал инсталляцию версии 0.4.0.1, придется сделать это снова, но уже для версии 0.4.0.3.
Continue reading »

Wordsyn: версия 0.4.0.1

Сегодня закончил работу над очередной фичей - множественными словарями. Теперь каждый пользователь может добавить в систему столько словарей, сколько пожелает, и затем выбирать словарь, соответствующий тематике текста непосредственно перед обработкой текста. Кроме того, базовый словарь содержит довольно большое количество слов, так что обработка текстов будет происходить намного быстрее.
Continue reading »

WordSyn: множественные словари - 3

После трех дней борьбы с компьютером, я его все-таки победил. При этом была переставлена операционка и все программы. Теперь я снова на коне, и снова доделываю свой синонимайзер.

Итак, на текущем этапе были сделаны два компонента, для выбора словарей для работы. Первый компонент представляет собой выпадающий список, и предназначен для выбора одного из словарей, например во время выбора словаря при импорте или экспорте. Второй компонент представляет собой список с чекбоксами, отмечая которые пользователь может выбирать словари, которые будут использоваться. Например, в ручном режиме. По умолчанию выбран общий словарь.
Continue reading »

WordSyn: многословные конструкции

Сегодня по дороге на работу придумал, как сделать функционал для многословных конструкций. Для этого достаточно сделать таблицу со, скажем, десятью полями, в которых будут храниться идентификаторы слов. Заполняться она может с помощью импорта словаря или вручную. Во время обработки текста такие конструкции будут находиться и заменяться на соответствующие много- или однословные синонимы, которые будут браться из той же таблицы. Вот только один вопрос возникает: что делать, если найдется две конструкции, начинающиеся с одной и той же последовательности слов? Брать меньшую или большую? Пока писал предыдущую фразу, понял, что нужно брать наибольшую найденную. Но в этом случае, если в словаре будет конструкция “пошел ты” с синонимом “отвали”, то при нахождении конструкции “пошел ты к чертовой матери”, которая должна иметь синоним “иди на хер”, она будет заменена на “отвали к чертовой матери”. Это, в принципе, звучит правильно, но разве так кто-то говорит?