Лидеры рейтинга

ID: 226425

Konstantin Shvetski

Мастер-Эксперт

959

Россия, Северодвинск


ID: 259041

Алексеев Владимир Николаевич

Мастер-Эксперт

513

Россия, пос. Теплоозёрск, ЕАО


ID: 401284

Михаил Александров

Академик

354

Россия, Санкт-Петербург


ID: 137394

Megaloman

Мастер-Эксперт

312

Беларусь, Гомель


ID: 400669

epimkin

Профессионал

191


ID: 400484

solowey

Профессор

71


ID: 401888

puporev

Профессор

53

Россия, Пермский край


8.1.6

02.01.2021

JS: 2.2.2
CSS: 4.2.0
jQuery: 3.5.1


 

Вероятно, некоторые участники заметили, что у нас с сентября 2015 года начались некоторые изменения на Портале.
Многие изменения не видны участникам со статусами Посетитель и касаются больше управленческого уровня работы - Модераторов, Старших Модераторов и Администрации. О таких изменениях я уведомляю заинтересованных участников в соответствующих закрытых разделах.
В этой ветке я планирую выкладывать уведомления об изменениях и нововведениях, касающихся всех участников.
Думаю, такие уведомления будут также дублироваться в новости Портала.
Диалог приветствуется. smile


22.09.2015, 17:38
Алексей Гладенюк (Руководитель)

Алексеев Владимир Николаевич

Мастер-Эксперт

ID: 259041
Постов: 268

111828

Хватов Сергей:

Вы спрашивали "А они ещё нужны?" - да, коды образцов мусора нужно ввести в базу скрипта-чистильщика. Как образцы вирусов нужны лаборатории Касперского для идентификации вред-кодов, так и моему скрипту надо показать врага.

В интернете я нахожу много интересных и полезных статей. Но на скромных англи-сайтах трудно понимать чужой язык. А в загаженном рунете очень раздражают рекламы, JavaScript-анимация, всплывающие баннеры поверх контента - это вообще мерзость! Я сохраняю интернет страницы, натравливаю на htm-копию свой VBS , и он быстро удаляет все нечистоты мне на радость! Объём очищеного документа уменьшается в среднем в 20 раз!

Алексеев Владимир Николаевич

Мастер-Эксперт

ID: 259041
Постов: 268

111833

Зенченко Константин Николаевич:

Спасибо, Константин Николаевич, за теоретическое просвещение! Но Вы не предложили другой, альтернативный способ сохранения информации взамен тяжёлого Word'а. В каком формате Вы сохраняете информацию или что посоветуете чайникам?

Впервые я столкнулся с Word-проблемой в 2000г : После каких-то пробных клав-сочетаний, в середине документа появилась неудаляемая горизонтальная полоса. Попытка окружить полосу фик-текстом сверху и снизу, и затем выделить и удалить весь блок приводила к удалению текста, но полоса выскальзывала и мешала. Зато ВыделитьВсё и экспорт в новый докум копировало полосу и в новый файл.

Я пришёл к лучшим программистам артели старателей Амур, они попытались удалить полосу - никак! Приняли мою задачу на дом. Наутро мне пояснили, что Word-код почти такой же сложный и секретный, как Windows-код. И поэтому, если Word-глюк не удаётся исправить, то остаётся только скопировать текст в Блокнот, а оттуда после повторного выделения и копирования вставить очищеный текст в новый Word-докум. Форматирование придётся создавать повторно вручную.

Позже я много раз примерно таким же способом уменьшал объёмы распухших папок почтовых баз, восстанавливал другие типы документов…
Но почему мой позавчерашний докум очистился только благодаря тому, что электрики отключили эл-энергию? Как управлять этим очищением цивилизованно?

Сегодня я проводил опыты с протоколированием всех действий. Длинный протокол не буду описывать, сообщу т-ко выводы. Оказывается: Когда мы открываем Докум.doc 667 кБ, то в папке %tmp%\ создаётся маленький блокировщик (примерно 1 кБ) с псевдо-случайним именем типа ~DFF867.tmp . Блокировщик запрещает удалять/перемещать открытый докум. После корректного закрытия докума WinWord удаляет блокировщик.

Если мы открыли докум и только читаем его, то АвтоСохранённая копия НЕ создаётся. Но как только мы ввели или удалили хоть 1 символ, WinWord запускает таймер, и каждые 10 минут (таймаут можно изменить в Word-Параметрах) АвтоСохранённая копия обновляется в %ApplicationData%\Microsoft\Word\Автокопия Докум.asd , пока мы не прекратим изменять контент. Почти полчаса я вводил символы по чуть-чуть, объём АвтоСохранённой копии почти не менялся. Чистки не происходит.

Удалось сделать т-ко НЕкачественную очистку ч-з экспорт Word-контента в txt-файл и обратно с утратой закладок, ссылок, верхних и нижних индексов, шрифтов, цветов и заливок. Причём размер txt-копии с утраченным форматированием оказался 248 кБ в Utf8-кодировке ; 317 кБ в Юникоде, 159 в Windows-1251 - это уж совсем порченный эконом, где искажены все греческие буквы, радикалы, интегралы…

Чтоб сделать очистку Word-файла от мусора, мне пришлось провоцировать Аварию : Убить процесс WinWord.exe , в котором открыт докум, подлежащий очистке. Не вырубать же сисблок-вилку из розетки?!

Провокация сработала: Очистка произошла (как мне показалось) наилучшим образом: все слова целы, символы НЕ искажены, управляющие тэги форматирования НЕ утрачены (в тч цвет шрифта, заливка слов, закладки, ссылки…). Исчезла только подкраска ссылок. Да и фик с ней, поскольку изза неё файл распух до тройного объёма.
По окончании опытов я закрыл WinWord и удалил последствия аварии: скрытые файла РодительПапка\~$окум.doc и %tmp%\~DFF867.tmp .

Ч-з пару часов передышки я снова сел за комп, догадался упаковать все подопытные файлы в архив. WinRar позволяет хорошо сопоставить объёмы информации, тк он заменяет пустые и одинаковые байты их кол-вом.

И тут меня осенило: Оказалось: в процессе восстановления файла из АвтоСохранённой копии WinWord2007 обманно создаёт doc-файл в полу-ужатом docX-формате ! Я немедленно проверил это: пере-сохранил Докум.doc в Докум.docx - и объём Докум.docx тоже стал 222 кБ! Word2003 конечно не сможет открыть такой обманный doc-файл. Но мы будем знать про этот трюк.

Оказывается, я позавчера поддался обману: в процессе восстановления файла произошла не чистка контента (очистился только цвет ссылок), а подмена формата doc на docX , хотя показное расширение файла осталось doc .
Мы и сами (без горе-электриков) можем пере-сохранить doc в полу-ужатый docX , а потом удалить букву X . Только этот обман никому не полезен.

Уважаемый пользователь!
Вы зашли на форум в качестве гостя. Гости не могут оставлять сообщения.
Пожалуйста, зарегистрируйтесь.
Если Вы уже зарегистрированы, введите Ваши регистрационные данные в поля вверху страницы.

 

Ваши возможности:

Вы не можете создавать разделы
Вы не можете создавать ветки
Вы не можете оставлять сообщения
Вы не можете использовать BBCode
Уровень доступа: = общий =