Можете лесно да конвертирате PDF файлове в редактируем текст в Linux, като използвате инструмента за обработка на команди "pdftotext". Ако обаче има оригинални PDF файлове, те не се извличат. За да извлечете изображения от PDF файл, можете да използвате друг инструмент на командния ред, наречен "pdfimages".
ЗАБЕЛЕЖКА: Когато казваме да въведете нещо в тази статия и има цитати около текста, НЕ пишете кавичките, освен ако не посочим друго.
Инструментът "pdfimages" е част от пакета poppler-utils. Можете да проверите дали той е инсталиран на вашата система и да го инсталирате, ако е необходимо, като използвате стъпките, описани в тази статия.
За да извлечете изображения от PDF файл с помощта на pdfimages, натиснете "Ctrl + Alt + T", за да отворите прозореца на терминала. Въведете следната команда в подканата.
pdfimages /home/lori/Documents/SampleWithImages.pdf / home / lori / Документи / ExtractedImages / image
ЗАБЕЛЕЖКА: За всички команди, показани в тази статия, заменете първия път в командата и името на PDF файла с пътя и името на файла за оригиналния PDF файл. Вторият път трябва да бъде пътят към основната папка, в която искате да запазите извлечените изображения. Думата "изображение" в края на втория път представлява всичко, с което искате да предложите името на файла си. Файловете на изображенията се номерират автоматично (000, 001, 002, 003 и т.н.). Ако искате да добавите текст към началото на всяко изображение, въведете този текст в края на втория път. В нашия пример всяко име на файла ще започне с "изображение", като например image-001.ppm, image-002.ppm и т.н. Добавя се тире между текста, който посочвате и номера.
Форматът на изображението по подразбиране е PPM (преносима pixmap) за немонометрични изображения или PBM (портативна растерна графика) за монохромни изображения. Тези формати са предназначени за лесно обмен между платформи.
ЗАБЕЛЕЖКА: Можете да получите два файла с изображения за всяко изображение във вашия PDF файл. Второто изображение за всяко изображение е празно, така че ще можете да кажете кои изображения съдържат изображенията от файла чрез миниизображението във файла в File Manager.
За да създадете графични файлове .jpg, добавете опцията "-j" към командата, както е показано по-долу.
pdfimages -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Документи / ИзтеглениИмаги / изображение
ЗАБЕЛЕЖКА: Можете също така да промените изхода по подразбиране на PNG, като използвате опцията "-png" или TIFF, като използвате опцията "-tiff".
Основният файл с изображения за всяко изображение се запазва като .jpg файл. Второто празно изображение все още е .ppm или .pbm файл.
Ако искате да конвертирате изображения само върху и след определена страница, използвайте опцията "-f" с номер, за да посочите първата страница, която да преобразувате, както е показано в примерната команда по-долу.
pdfimages -f 2 -j /home/lori/Documents/SampleWithImages.pdf / начало / lori / Документи / Изтеглени илюзии / изображение
ЗАБЕЛЕЖКА: Ние комбинирахме опцията "-j" с опцията "-f", за да получим .jpg изображения и направихме същото с опцията "-l", посочена по-долу.
За да конвертирате всички изображения преди и на определена страница, използвайте опцията "-l" (малка буква "L", а не номер "1") с номер, за да посочите последната страница за конвертиране, както е показано по-долу.
pdfimages -l 1 -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Документи / ExtractedImages / изображение
ЗАБЕЛЕЖКА: Можете да използвате опциите "-f" и "-l" заедно, за да конвертирате изображения в определен диапазон от страници в средата на документа.
Ако в PDF файла има парола на собственика, използвайте опцията "-opw" и паролата в единични кавички, както е показано по-долу. Ако паролата в PDF файла е потребителска парола, вместо това използвайте опцията "-upw" с паролата.
ЗАБЕЛЕЖКА: Уверете се, че има единични кавички около паролата ви в командата.
pdfimages -pw 'парола' -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Документи / Изтеглени данни / изображение
За повече информация относно използването на командата pdfimages въведете "pdfimages" в прозореца на терминал и натиснете "Enter". Използва се командата за използване с списък с опции, които могат да се използват в командата.