Има различни причини, поради които може да искате да конвертирате PDF файл в редактируем текст. Може би трябва да преработите стар документ и всичко, което имате, е PDF версията му. Конвертирането на PDF файлове в Windows е лесно, но какво става, ако използвате Linux?
Няма проблем. Ще ви покажем как лесно да конвертирате PDF файловете в редактируем текст, като използвате инструмента за команден ред наречен pdftotext, който е част от пакета "poppler-utils". Този инструмент може вече да е инсталиран. За да проверите дали pdftotext е инсталиран на вашата система, натиснете "Ctrl + Alt + T", за да отворите прозореца на терминала. Въведете следната команда на промпта и натиснете "Enter".
dpkg -s poppler-utils
ЗАБЕЛЕЖКА: Когато казваме да въведете нещо в тази статия и има цитати около текста, НЕ пишете кавичките, освен ако не посочим друго.
Ако pdftotext не е инсталиран, въведете следната команда на промпта и натиснете "Enter".
sudo apt-get инсталирате poppler-utils
Въведете паролата си, когато получите подкана, и натиснете "Enter".
Има няколко налични инструмента в пакета poppler-utils за конвертиране на PDF в различни формати, манипулиране на PDF файлове и извличане на информация от файлове.
Следващата е основната команда за конвертиране на PDF файл в редактируем текстов файл. Натиснете "Ctrl + Alt + T", за да отворите прозорец Терминал, напишете командата на промпта и натиснете "Enter".
pdftotext /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt
Променете пътя към всеки файл, така че да отговаря на местоположението и името на оригиналния ви PDF файл и къде искате да запазите получения текстов файл. Също така променете имената на файловете така, че да съответстват на имената на файловете ви.
Текстовият файл е създаден и може да бъде отворен точно както бихте отворили всеки друг текстов файл в Linux.
Преобразуваният текст може да има прекъсвания на линии в места, които не искате. Прекъсванията на редовете се въвеждат след всеки ред текст в PDF файла.
Можете да запазите оформлението на документа (заглавки, долни колонтитули, пейджинг и т.н.) от оригиналния PDF файл в конвертирания текстов файл, използвайки флага "-layout".
pdftotext -layout /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt
Ако искате да конвертирате набор от страници в PDF файл, използвайте флаговете "-f" и "-l" (малка буква "L"), за да определите първата и последната страница в диапазона, който искате да конвертирате.
pdftotext -f 5 -l 9 /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt
За да конвертирате PDF файл, който е защитен и шифрован със собствена парола, използвайте флага "-opw" (първият символ в флага е малка буква "O", а не нула).
pdftotext -opw 'парола' /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt
Променете "паролата" на тази, използвана за защита на оригиналния PDF файл, който се преобразува. Уверете се, че има единични кавички, а не двойни, около "паролата".
Ако PDF файлът е защитен и шифрован с потребителска парола, използвайте флага "-upw" вместо флага "-opw". Останалата част от командата е една и съща.
Можете също така да определите типа на крайния знак, който се прилага към преобразувания текст. Това е особено полезно, ако планирате да осъществите достъп до файла на различна операционна система като Windows или Mac. За да направите това, използвайте флаг "-eol" (средният знак във флага е малка буква "O", а не нула), следвана от интервал и типа на крайния символ, който искате да използвате (" unix "," dos "или" mac ").
ЗАБЕЛЕЖКА: Ако не посочите име на файл за текстовия файл, pdftotext автоматично използва базата на името на PDF файла и добавя разширението ".txt". Например "file.pdf" ще бъде преобразуван в "file.txt". Ако текстовият файл е зададен като "-", преобразуваният текст се изпраща на stdout, което означава, че текстът се показва в прозореца на терминала и не се записва във файл.
За да затворите прозореца на терминала, кликнете върху бутона "X" в горния ляв ъгъл.
За повече информация относно командата pdftotext въведете "man page pdftotext" в подканата в прозореца на терминала.