If-Koubou

5 безплатни он-лайн услуги, тествани и прегледани

5 безплатни он-лайн услуги, тествани и прегледани (Cool Уебсайтове)

Имате PDF документ или изображение, което искате да конвертирате в текст? Наскоро някой ми изпрати документ в пощата, който трябваше да редактирам и изпратя с корекции. Човекът не можа да намери дигитално копие, затова бях натоварен с това, че получих целия текст в цифров формат.

Нямаше начин да прекарам часове да пиша всичко обратно, така че аз в крайна сметка направих хубава и качествена картина на документа и след това изгорих пътя си през куп онлайн OCR услуги, за да видя кой ще ми даде най-доброто резултати.

В тази статия ще прегледам няколко от любимите ми сайтове за OCR, които са безплатни. Заслужава да се отбележи, че повечето от тези сайтове осигуряват основна безплатна услуга и след това имат платени опции, ако искате допълнителни функции като по-големи изображения, многостранични PDF документи, различни езици за въвеждане и др.

Също така е добре да знаете предварително, че повечето от тези услуги няма да могат да съответстват на форматирането на оригиналния документ. Те са основно за извличане на текст и това е всичко. Ако имате нужда от всичко, за да имате конкретно оформление или формат, ще трябва да го направите ръчно, след като получите целия текст от OCR.

В допълнение, най-добрите резултати за получаване на текста ще бъдат от документи с разделителна способност от 200 до 400 DPI. Ако имате ниско изображение на DPI, резултатите няма да са толкова добри.

И накрая, имаше много сайтове, които проверих, че просто не работи. Ако имате безплатно онлайн OCR от Google, ще видите множество сайтове, но няколко от сайтовете в първите 10 резултата дори не завършиха реализацията. Някои щяха да изчакат, други щяха да дават грешки, а някои просто се забиха на страницата "конвертиране", така че дори не се занимавах да спомена тези сайтове.

За всеки сайт тествах два документа, за да видя колко добре ще бъде продукцията. За моите тестове просто използвах моя iPhone 5S, за да направя снимка на двата документа и след това ги качих директно на уебсайтовете за преобразуване.

В случай, че искате да видите как изглеждат изображенията, които използвах за теста, ги прикачих тук: Test1 и Test2. Имайте предвид, че това не са версиите с пълна разделителна способност на изображенията, взети от телефона. Използвах изображението с пълна разделителна способност, когато го качвам на сайтовете.

OnlineOCR

OnlineOCR.net е чист и прост сайт, който доставя много добри резултати в моя тест. Основното нещо, което ми харесва, е, че няма тонове реклами навсякъде, което обикновено се случва с тези видове сайтове за сервизно обслужване.

За да започнете, изберете файла си и изчакайте, докато приключи качването. Максималният размер на качване за този сайт е 100 МБ. Ако се регистрирате за безплатен профил, получавате няколко допълнителни функции, като по-голям размер на качване, многостранични PDF файлове, различни езици за въвеждане, повече реализации на час и др.

След това изберете езика за въвеждане и след това изберете изходния формат. Можете да избирате между Word, Excel или обикновен текст. Кликнете върху превръщам и ще видите текста, показан в долната част на кутията, заедно с връзка за изтегляне.

Ако всичко, което искате, е текст, просто го копирайте и поставете от полето. Въпреки това ви предлагам да изтеглите документа на Word, защото той прави изненадващо страхотна работа да запази оформлението на оригиналния документ.

Например, когато отворих документа на Word за втория ми тест, бях изненадан, че документът съдържаше таблица с три колони, точно както в изображението.

От всички места това беше най-доброто досега. Заслужава си да се регистрирате, ако трябва да направите много реализации.

За пълнота, аз също ще се свърже с изходните файлове, създадени от всяка услуга, така че да можете да видите резултатите за себе си. Ето резултатите от OnlineOCR: Test1 Doc and Test2 Doc.

Имайте предвид, че когато отваряте тези документи на Word на компютъра си, ще получите съобщение в Word, в което се казва, че е от Интернет и редактирането е деактивирано. Това е напълно OK, защото Word не се доверява на документи от интернет и наистина не е нужно да разрешавате редактирането, ако просто искате да видите документа.

i2OCR

Друг сайт, който даде доста добри резултати, беше i2OCR. Процесът е много подобен: изберете вашия език, файл и след това натиснете Извличане на текст.

Ще трябва да изчакате поне две минути, защото този сайт отнема малко повече време. Също така, в стъпка 2, уверете се, че изображението ви се показва отдясно нагоре в предварителен преглед, в противен случай ще получите куп глупости като изход. По някаква причина изображенията от моя iPhone се показват в портретен режим на моя компютър, но пейзаж, когато качих на този сайт.

Трябваше ръчно да отворите изображението в приложение за редактиране на снимки, да го завъртите на 90 градуса, след това да го завъртите обратно на портрет и да го запазите отново. След като приключите, превъртете надолу и ще ви покаже предварителен преглед на текста заедно с бутона за изтегляне.

Този сайт се справи доста добре с изхода за първия тест, но не се справи толкова добре с втория тест, който имаше оформлението на колоните. Ето резултатите от i2OCR: Test1 Doc and Test2 Doc.

FreeOCR

Free-OCR.com ще заснеме вашите изображения и ще ги превърне в обикновен текст. Няма опция за експортиране в Word формат. Изберете файла си, изберете език и кликнете върху него начало.

Сайтът е бърз и ще получите доста бързо. Просто кликнете върху връзката, за да изтеглите текстовия файл на компютъра си.

Както и при NewOCR, споменато по-долу, този сайт капитализира всички T в документа. Нямам представа защо ще го направи, но по някаква странна причина този сайт и NewOCR направиха това. Не е голяма работа да го промените, но това е труден процес, който наистина не би трябвало да правите.

Ето резултатите от FreeOCR: Test1 Doc and Test2 Doc.

ABBYY FineReader Online

За да използвате FineReader Online, трябва да се регистрирате за сметка, което ви дава 15-дневен безплатен пробен период до OCR до 10 страници безплатно. Ако само трябва да направите еднократно OCR за няколко страници, можете да използвате тази услуга. Уверете се, че след като се регистрирате, кликнете върху връзката за потвърждение в имейла за потвърждение.

Кликнете върху Разпознава в горната част на екрана и кликнете върху него Качи за да изберете файла си. Изберете езика, изходния си формат и кликнете върху него Разпознава на дъното. Този сайт има чист интерфейс и няма реклами.

В моите тестове този сайт успя да грабне текста от първия тестов документ, но беше абсолютно огромен, когато отворих Word doc, затова завърших да го правя отново и да избирам Plain Text като изходен формат.

За втория тест с колоните документът на Word беше празен и дори не можах да намеря текста. Не сте сигурни какво се е случило там, но изглежда, че не е в състояние да се справи с нищо друго освен с прости параграфи. Ето резултатите от FineReader: Test1 Doc и Test2 Doc.

NewOCR

Следващият сайт, NewOCR.com, беше добре, но не беше толкова добър, колкото първия сайт. Първо, има реклами, но за щастие не е тон. Първо изберете файла си и след това кликнете върху предварителен преглед бутон.

След това можете да завъртите изображението и да настроите областта, в която искате да сканирате текст. Това е доста подобно на това как процесът на сканиране работи на компютър с прикачен скенер.

Ако документът има няколко колони, можете да проверите Анализ на оформлението на страницата и ще се опита да раздели текста нагоре в колони. Кликнете върху бутона OCR, изчакайте няколко секунди, за да завърши и след това превъртете надолу до долу, когато страницата се опреснява.

В първия тест, той получи целия текст правилно, но по някаква причина капитализира всеки T в документа! Нямаше представа защо да го направи, но го направи. Във втория тест, с активиран анализ на страниците, той получи голямата част от текста, но оформлението беше напълно изключено.

Ето резултатите от NewOCR: Test1 Doc and Test2 Doc.

заключение

Както можете да видите, безплатната не ви дава много добри резултати през повечето време за съжаление. Първият споменаван сайт е най-добрият, тъй като не само че е свършил чудесна работа с разпознаването на целия текст, но също успя да запази формата на оригиналния документ.

Ако имате нужда от текст, обаче, повечето от горните уеб сайтове трябва да могат да ви направят това. Ако имате някакви въпроси, можете да коментирате. Наслади се!