Преобразует файлы из формата HTML в формат TXT. Понимает таблицы, корректно
распознает русские буквы. Отбрасывает комментарии. Может обрабатывать
файлы практически любых размеров (файл не грузится весь в оперативную
память, а используется подкачка с диска).
Функцией данной программы является именно перевод из формата HTML
в текстовый. Программа не преобразует кодировку символов (например
из KOI-8 в Windows-1251). Для того чтобы преобразовывать текст из
различных
кодировок, Вам необходимо воспользоваться другими программами.
Программа имеет INI файл, в котором Вы можете настроить по своему усмотрению
преобразование как HTML тегов, так и специальных символов (между "&"
и ";").
Вы также можете пользоваться программой для преобразования большого
количества файлов - программу можно запускать в командном (пакетном)
режиме. Достаточно указать в качестве параметров (при запуске) имя исходного
HTML и результирующего текстового файлов - программа автоматически преобразует
из HTML в текст (и сразу же завершит работу). Поэтому Вы можете использовать
программу в командных (.BAT) файлах.
Например:
HTMLtoTXT source.htm dest.txt
Вы также можете задать один параметр - "/?" - и программа
выведет справку по работе с ней в командном режиме:
HTMLtoTXT /?
Пример:
Здесь находится исходный файл.
А здесь - преобразованный HTML
to TXT converter.
Скачать HTML to TXT converter Вы можете здесь.
Получить информацию о последних версиях программы Вы можете в разделе
"Новости" сайта.
В журнале "Компьютерра" была опубликована статья
о программе.
Поскольку HTML to TXT converter не осуществляет перекодировки символов
(между KOI8-R, Windows-1251, DOS, Mac, etc.), то вот несколько программ,
которыми Вы можете воспользоваться для перекодировки символов.
DC - на наш
взгляд, наилучшая программа перекодировки. Может распознавать любые
кодировки, в том числе если текст перекодировался несколько раз и
в результате стал нечитаемым. Однако программа работает только в
режиме командной строки и не очень удобна для быстрого перекодирования.
TOT-RECODE
2 - небольшая удобная программа с графическим интерфейсом, может
перекодировать файлы или текст из буфера обмена.