Здравствуйте, Анатолий!
В интернете мы находим очень много полезных статей. Часто нам хочется сохранить их или даже подредактировать (удалить мерзкую рекламу). Многие пользователи сохраняют страницы в Word-файлы (с расширением .doc или .docx ). Однако, Word-приложение - тяжёлое (Word загружается в 3…5 раз дольше, чем встроенный в Windows браузер Internet Explorer ), его документы - громоздки, каждый символ (буква или цифра) занимает 2 байта вместо одного (кодировка Юникод), встроенные, скрытые тэги трудно найти и очистить от мусора.
Как же лучше сохранять информацию с интернет-страницы? В каждом браузере из меню "Файл" можно выбрать команду "Сохранить как". Новые, интеллектуальные браузеры предлагают просто нажать клав-сочетание Ctrl+S (Ctrl удерживать, S - кликнуть). В результате открывается диалоговое окно с заголовком "Сохранить как" с 3-мя настраиваемыми полями : "Папка" , "Имя файла" и "Тип Файла".
В поле "Папка" достаточно всего 1 раз задать Родитель-папку, куда можно будет всегда быстро сохранять копии инет-страниц для последующей их обработки. Браузер запоминает этот путь.
В поле "Имя файла" браузер копирует значение из Титул-тэга загруженной страницы. Вы можете изменить/поправить Имя при желании/необходимости.
Самое интересное поле "Тип Файла" предлагает нам выбор из 3х вариантов: "Текстовые файлы", "Веб-страница (только HTML)", "Веб-страница полностью".
Простейший вариант "Текстовые файлы" удобен для сохранения простых, незамусоренных страниц, содержащих только обычный текст (кулинарный рецепт). При этом надо в поле "Имя файла" изменить расширение .htm на .txt либо просто удалить расширение .htm . Тогда браузер автомати добавит расширение .txt в сохранённую докум-копию.
Если страница содержит ссылки или "ВнеANSI"-символы (радикал, бесконечность, греческие буквы, отсутствующие в кодовой таблице windows-1251 для кириллицы без Юникода), тогда придётся сохранять копию в формат "Веб-страница (только HTML)". Это будет одиночный файл с расширением .htm , и открывать эту копию будет браузер (не Блокнот).
Чтоб сохранить копию с картинками, выбираем "Веб-страница полностью". Браузер сохраняет htm-файл и пара-папку с одинаковыми именами. При удалении папки Windows автомати удаляет файл. При попытке переименовать уже-сохранённую папку или файл Windows предупреждает о нарушении соответствия. Это неудобство легко обойти последующим редактированием.
И всё бы хорошо, если бы все сайт-админы были культурными людьми и не загаживали свои страницы рекламой. В СНГ осталось очень мало сайтов, страницы которых можно сохранить и использовать без последующей чистки. Вот пример "чистого" сайта без мусора :
ens.tpu.ru/POSOBIE_FIS_KUSN/Колебания%20и%20волны.%20Геометрическая%20и%20волновая%20оптика/03-2.htmБывают сайты, которые не дают сохранить страницу полностью, приходится делать скриншоты (портал ГосУслуги).
Самые грязные сайты типа ok.ru (Одноклассники) при загрузке контента или сохранении "впихивают" пользователю столько мусора, что легче выделить отдельный текстовый блок + картинку и сгенерить из них htm-пару, чем отбраковывать из копии "Веб-страница полностью" сотни ненужных скриптов, стилей и реклам. К примеру, очищеный мною "Советы старовера долгожителя.htm" 9 кБайт извлечён из полной копии размером 752кБ !
Для генерации htm-документов из txt-черновиков удобно использовать простенькие скрипты (мини-программки) типа VBScript .
Формат HTML (см
ru.wikipedia.org/wiki/HTML ) - самый компактный (1 Байт/символ), легко редактируется. Достаточно для начала выучить несколько тэгов. Например :
[$60$]br> - принудительный перенос строки (без него Браузер отобразит htm-документ БЕЗ принуди-переноса в заданном месте.)
Тэг [$60$]img src=СоветыСтаровера.jpg> указывает браузеру отобразить на экран картинку (img) из файла с именем src=СоветыСтаровера.jpg из родитель-папки документа.
Отправляю Вам пример "Советы старовера долгожителя.htm" + СоветыСтаровера.jpg в архиве.
196318_SovetyStarovera.zip (26.8 кб)Просмотреть код и подредактировать текст документа Вы можете командой "Открыть с помощью" \ Блокнот из контекста htm-файла.
Если что-то непонятно, задавайте доп-вопросы в мини-форуме Вашей Консультации.