Головна » як » Як витягувати зображення, текст і вбудовані файли з документів Word, Excel і PowerPoint

    Як витягувати зображення, текст і вбудовані файли з документів Word, Excel і PowerPoint

    Скажіть, що хтось надіслав вам документ Word з великою кількістю зображень, і ви хочете зберегти ці зображення на жорсткому диску. Ви можете витягувати зображення з документа Microsoft Office за допомогою простого трюку.

    Якщо у вас є файл Word (.docx), Excel (.xlsx) або PowerPoint (.pptx) з зображеннями або іншими вбудованими файлами, ви можете витягти їх (а також текст документа), не зберігаючи кожну окремо . А краще за все, вам не потрібно ніякого додаткового програмного забезпечення. Формати файлів Office XML - docx, xlsx і pptx - фактично стислі архіви, які можна відкрити, як і будь-який інший .zip-файл у Windows. Звідти можна витягувати зображення, текст та інші вбудовані файли. Можна використовувати вбудовану у форматі .zip підтримку Windows або програму, наприклад, 7-Zip, якщо ви віддаєте перевагу.

    Якщо вам потрібно витягти файли зі старого офісного документа, наприклад файлу .doc, .xls або .ppt, ви можете зробити це за допомогою невеликого фрагмента вільного програмного забезпечення. Ми деталізуємо цей процес у кінці цього посібника.

    Як витягти вміст нового файлу Office (.docx, .xlsx або .pptx)

    Щоб отримати доступ до внутрішнього вмісту документа Office на основі XML, відкрийте Провідник файлів (або Провідник Windows у Windows 7), перейдіть до файлу, з якого ви хочете витягти вміст, і виберіть файл.

    Натисніть “F2”, щоб перейменувати файл і змінити розширення (.docx, .xlsx або .pptx) на “.zip”. Залишайте лише основну частину назви файлу. Натисніть "Enter", коли закінчите.

    Наступне діалогове вікно відображає попередження про зміну розширення імені файлу. Натисніть "Так".

    Windows автоматично розпізнає файл як стиснений файл. Щоб витягти вміст файлу, клацніть правою кнопкою миші на файлі та виберіть "Extract All" у контекстному меню.

    У діалоговому вікні «Вибрати файли призначення та вилучення» шлях, у якому буде вилучено вміст .zip-файлу, відображається у вікні «Файли буде вилучено до цієї папки». За промовчанням папка з таким самим іменем, що й назва файлу (без розширення файлу), створюється в тій же папці, що й файл .zip. Щоб витягти файли в іншу папку, натисніть "Огляд".

    Перейдіть до місця вилучення вмісту файлу .zip, натиснувши "Нова папка", щоб створити нову папку, якщо це необхідно. Натисніть "Вибрати папку".

    Щоб відкрити вікно Провідника файлів (або Провідника Windows) з папкою, що містить витягнуті файли, які відображаються після їх вилучення, встановіть прапорець «Показати вилучені файли після завершення», щоб у вікні з'явилася галочка. Натисніть "Вилучити".

    Як отримати доступ до витягнутих зображень

    До вилученого вмісту входить папка з назвою “word”, якщо ваш вихідний файл є документом Word (або “xl” для документа Excel або “ppt” для документа PowerPoint). Двічі клацніть папку "word", щоб відкрити її.

    Двічі клацніть папку "media".

    Всі зображення з оригінального файлу знаходяться в папці «media». Витягнуті файли - це оригінальні зображення, використані в документі. Усередині документа може бути змінено розмір або інші властивості, але вилучені файли - це необроблені зображення без цих властивостей.

    Як отримати доступ до витягнутого тексту

    Якщо у вас немає Office, встановленого на вашому комп'ютері, і вам потрібно витягти текст з файлу Word (або Excel або PowerPoint), ви можете отримати доступ до витягнутого тексту у файлі "document.xml" у папці "word".

    Ви можете відкрити цей файл у текстовому редакторі, наприклад, у Блокноті або WordPad, але його легше читати в спеціальному редакторі XML, наприклад, у вільній програмі, XML Notepad. Весь текст з файлу доступний фрагментами звичайного тексту незалежно від стилю та / або форматування, застосованого в самому документі. Звичайно, якщо ви збираєтеся завантажити безкоштовне програмне забезпечення для перегляду цього тексту, ви можете також завантажити LibreOffice, який може читати документи Microsoft Office.

    Як витягти вбудовані об'єкти OLE або прикріплені файли

    Щоб отримати доступ до вбудованих файлів у документі Word, якщо у вас немає доступу до Word, спочатку відкрийте файл Word у програмі WordPad (вбудований у Windows). Ви можете помітити, що деякі вбудовані піктограми файлів не відображаються, але вони все ще існують. Деякі вбудовані файли можуть мати часткові назви файлів. WordPad не підтримує всі функції Word, тому деякий вміст може відображатися неправильно. Але ви повинні мати доступ до файлів.

    Якщо клацнути правою кнопкою миші на одному з вбудованих файлів у нашому зразковому файлі Word, одним з варіантів є "Відкрити PDF-об'єкт". Це відкриє файл PDF у програмі читання PDF за промовчанням на вашому ПК. Звідти ви можете зберегти файл PDF на жорсткому диску.

    Якщо WordPad не має опції для відкриття файлу, відзначте тут його тип файлу. Наприклад, наш другий файл у цьому документі - файл .mp3.

    Потім поверніться до папки "Файли з [Document]" і двічі клацніть папку "embeddings" у папці "word".

    На жаль, типи файлів не зберігаються в іменах файлів. Всі вони мають розширення «.bin». Якщо ви знаєте, які типи файлів вбудовані у файл, ви, ймовірно, можете вивести, який файл є розміром файлу. У нашому прикладі ми мали PDF-файл і MP3-файл, вбудовані в наш документ. Оскільки MP3-файл, швидше за все, є більшим, ніж PDF-файл, ми можемо з'ясувати, який саме файл, дивлячись на розміри файлів, а потім перейменувати їх, використовуючи правильні розширення. Нижче ми перейменуємо файл MP3.

    Зверніть увагу, що не всі файли обов'язково будуть відкриті за допомогою цього процесу - наприклад, наш PDF-файл відкритий правильно з WordPad, але ми не могли змусити його відкрити, перейменувавши його .bin файл.

    Після вилучення вмісту архівованого файлу можна повернути розширення оригінального файлу до .docx, .xlsx або .pptx. Файл залишиться недоторканим і може бути відкритий у відповідній програмі.

    Як витягувати зображення зі старих документів Office (.doc, .xls або .ppt)

    Якщо вам потрібно витягти зображення з документа Office 2003 (або більш ранніх), є безкоштовний інструмент майстра вилучення зображень Office, який полегшує це завдання. Ця програма також дозволяє витягувати зображення з декількох документів (однакових або різних типів) одночасно. Завантажте програму та встановіть її (доступна також портативна версія, якщо ви не хочете встановлювати її).

    Запустіть програму, і з'явиться екран привітання. Натисніть "Далі".

    По-перше, потрібно вибрати файл, з якого ви хочете витягти зображення. На екрані Input & Output клацніть кнопку «Browse» (значок папки) праворуч від поля редагування документа.

    Перейдіть до папки, що містить потрібний документ, виберіть її та натисніть "Відкрити".

    Папка, що містить вибраний файл, автоматично стає папкою Output. Щоб створити вкладену папку в цій папці, що має назву з вибраним файлом, встановіть прапорець "Створити папку тут", щоб у вікні з'явилася галочка. Потім натисніть "Далі".

    На екрані Ready to Start (Готовий до початку) натисніть "Start" (Пуск), щоб розпочати вилучення зображень.

    У процесі видобутку відображається наступний екран.

    На екрані Завершено натисніть кнопку "Натисніть тут, щоб відкрити папку призначення", щоб переглянути отримані файли зображень.

    Оскільки ми вирішили створити підтеку, ми отримуємо папку, що містить файли зображень, вилучені з файлу.

    Ви побачите всі зображення як нумеровані файли.

    Ви також можете витягувати зображення з декількох файлів одночасно. Для цього на екрані "Вхід і вихід" клацніть прапорець "Пакетний режим", щоб у вікні з'явився прапорець.

    Відобразиться екран Пакетний вхід і вихід. Натисніть "Додати файли".

    У діалоговому вікні "Відкрити" перейдіть до папки, що містить будь-які файли, з яких ви хочете витягти зображення, виберіть файли за допомогою клавіші "Shift" або "Ctrl", щоб вибрати кілька файлів, і натисніть "Відкрити".

    Ви можете додати файли з іншої папки, натиснувши кнопку "Додати файли" знову, перейшовши в папку у діалоговому вікні Відкрити, вибравши потрібні файли, і натиснувши "Відкрити".

    Після додавання всіх файлів, з яких ви хочете витягти зображення, ви можете створити окрему папку для кожного документа в тій же папці, що й кожен документ, в який будуть збережені файли зображень, натиснувши кнопку «Створити папку для кожен документ ”, щоб у вікні з'явилася галочка.

    Ви також можете вказати папку "Вихідні" як "Те ж, що й у вхідній папці кожного файлу", або ввести або вибрати спеціальну папку, використовуючи поле редагування та кнопку "Огляд" нижче цієї опції. Після вибору потрібних параметрів натисніть кнопку «Далі».

    Натисніть "Пуск" на екрані "Готово до запуску".

    На наступному екрані відображається прогрес вилучення.

    Кількість зображень, вилучених на екрані "Готово". Натисніть "Закрити", щоб закрити Майстер видобування зображення Office.

    Якщо ви вирішили створити окрему папку для кожного документа, ви побачите папки з такими ж іменами, що й файли, що містять зображення, незалежно від папки виводу, яку ви вказали..

    Знову ж таки, ми отримуємо всі зображення як нумеровані файли для кожного документа.

    Тепер ви можете перейменувати зображення, перемістити їх і використовувати їх у власних документах. Просто переконайтеся, що ви маєте право використовувати їх на законних підставах.