Чтобы блог не простаивал, поделюсь-ка я сегодня с вами небольшим лайфхаком и покажу простой способ извлечения исходных изображений из документов, созданных в Microsoft Word. Без лишних предисловий, добро пожаловать под кат.
Для начала немного теории. Каждый документ Word на самом деле представляет собой архив с расширением .docx, внутри которого находятся несколько папок, где содержится сам текст, данные о шрифтах, верстке и, конечно же, лежат все картинки. Таким образом все, что нам нужно для извлечения изображений - распаковать документ Word, как обычный архив.
Для этих целей нам потребуется архиватор. Я рекомендую использовать
7zip: эта программа бесплатна, не содержит встроенной рекламы, не просит пожертвований, в общем, абсолютно «чистая» утилита. При этом 7zip полностью переведен на русский язык, поддерживает множество разнообразных форматов и действительно хорошо архивирует, помогая экономить дисковое пространство. Так что если вы до сих пор пользуетесь тем же WinRAR, настоятельно рекомендую с ним распрощаться и переходить на действительно хорошее ПО. Впрочем, сейчас не об этом.
После установки программы в контекстном меню Windows появятся несколько дополнительных команд. Теперь можно извлекать картинки! В своих закромах я нашел документ Word, содержащий аж 37 изображений. Сохранять каждое из них вручную было бы, мягко говоря, муторно. Но с помощью архиватора эта задача решается элементарно.
Кликните правой кнопкой мыши по нужному документу, и выберите в контекстном меню пункт 7-zip -> Распаковать в «Имя документа».
Распаковываем документ Word как обычный архив
После этого рядом с нашим документом появится одноименная папка. Заходим в нее, открываем вложенную папку «word», а в ней - папку «media». Вуаля! Именно здесь и лежат все наши картинки. Причем, это не пережатые превью, а изображения в исходном разрешении и качестве, с которыми уже можно полноценно работать.
Все картинки из документа лежат в папке «media»