PDF ve Görüntü Dosyalarından Metin Çıkarma


Tüm metni çıkarmak istediğiniz PDF belgesine sahip misiniz? Düzenlenebilir metne dönüştürmek istediğiniz taranmış belgenin görüntü dosyaları nedir? Bunlar, dosyalarda çalışırken işyerinde gördüğüm en yaygın sorunlardan bazıları.

Bu yazıda, PDF'den metin ayıklamaya çalışmak için kullanabileceğiniz birkaç farklı yoldan bahsedeceğim. veya bir görüntüden. Ekstraksiyon sonuçlarınız, PDF veya görüntüdeki metnin türüne ve kalitesine bağlı olarak değişecektir. Ayrıca, sonuçlarınız kullandığınız araca göre değişecektir, bu nedenle en iyi sonuçları almak için mümkün olduğunca çok sayıda seçenek denemek en iyisidir.

Görüntü veya PDF'den Metin Çıkar

Başlamak için en basit ve hızlı yol, çevrimiçi PDF metin çıkarıcı servisini denemek. Bunlar normal olarak ücretsizdir ve bilgisayarınıza bir şey yüklemeniz gerekmeden tam olarak aradığınız şeyi verebilir. İşte mükemmel sonuçlar için çok iyi kullandığım iki tane:

ExtractPDF

extractpdf

ExtractPDF bir PDF dosyasından resim, metin ve yazı tipi almak için ücretsiz bir araçtır. Tek sınırlama, PDF dosyasının maksimum boyutunun 10 MB olmasıdır. Bu biraz küçük; Daha büyük bir dosyanız varsa, aşağıdaki diğer yöntemlerden bazılarını deneyin. Dosyanızı seçin ve ardından Dosya gönderdüğmesini tıklayın. Sonuçlar normalde çok hızlıdır ve Metin sekmesine tıkladığınızda metnin bir önizlemesini görmelisiniz.

download text

Ayrıca bu da güzel bunlara ihtiyacınız varsa, görüntüleri PDF dosyasından da çıkarır. Genel olarak, çevrimiçi araç harika çalışıyor, ancak bana komik çıktı veren birkaç PDF dokümanına girdim. Metin sadece iyi bir şekilde çıkarılır, ancak bazı nedenlerden dolayı her kelimeden sonra bir satır sonu olur! Kısa bir PDF dosyası için büyük bir sorun değil, ama kesinlikle bir sürü metin içeren dosyalar için bir sorun. Bu size olursa, sonraki aracı deneyin.

Çevrimiçi OCR

Çevrimiçi OCR genellikle ExtractPDF ile düzgün bir şekilde dönüşmeyen belgeler için çalışmaya yöneldi. Bu nedenle, hangisinin daha iyi bir çıktı verdiğini görmek için her iki hizmeti de denemek iyi bir fikirdir. Çevrimiçi OCR ayrıca, tüm belgeyi değil, yalnızca birkaç sayfadaki metni dönüştürmesi gereken büyük bir PDF dosyası olan herkes için kullanışlı olabilecek bazı güzel özelliklere sahiptir.

Yapmak istediğiniz ilk şey gitmek önde ve ücretsiz bir hesap oluşturun. Bu biraz can sıkıcı, ancak ücretsiz hesabı oluşturmadıysanız, yalnızca belgenin tamamını değil PDF'nizi kısmen dönüştürür. Ayrıca, yalnızca 5 MB'lık bir belgeyi yüklemek yerine, bir hesapla dosya başına 100 MB'a kadar yükleme yapabilirsiniz.

online ocr

Önce , bir dil seçin ve sonra dönüştürülen dosya için istediğiniz çıktı biçimlerinin türünü seçin. Birkaç seçeneğiniz var ve isterseniz birden fazla seçim yapabilirsiniz. Çok sayfalı dokümanaltında, Sayfa numaraları'nı seçebilir ve ardından yalnızca dönüştürmek istediğiniz sayfaları seçebilirsiniz. Ardından dosyayı seçip Dönüştür'i tıklayın!

online ocr docs

Dönüşümden sonra, kalan ücretsiz boş sayfa sayısını görebileceğiniz Dokümanlar bölümüne (giriş yaptıysanız) götürüleceksiniz. ve dönüştürülen dosyalarınızı indirmek için bağlantılar. Günde 25 sayfa ücretsiz görünüyor, bu yüzden bundan daha fazlasına ihtiyacınız varsa, biraz beklemeniz veya daha fazla sayfa satın almanız gerekecek.

Çevrimiçi OCR, mükemmel bir dönüşüm işi yaptı PDF'lerim, metnin gerçek düzenini koruyabildiği için. Testimde mermileri, farklı yazı tipi boyutlarını vb. Kullanan ve bir PDF'ye dönüştüren bir Word dokümanı aldım. Ardından, Word formatına geri dönüştürmek için Online OCR'yi kullandım ve orijinal ile yaklaşık% 95 aynıydı. Bu benim için oldukça etkileyici.

Artı, bir görüntüyü metne dönüştürmek istiyorsanız, Çevrimiçi OCR bunu PDF dosyalarından metin ayıklamak kadar kolay bir şekilde yapabilir.

Ücretsiz Çevrimiçi OCR

OCR'den metne görüntü hakkında konuştuktan sonra, resimlerde gerçekten iyi çalışan başka bir web sitesi daha bahsetmeme izin verin. Test resimlerimden metin çıkarırken Free Çevrimiçi OCR çok iyi ve çok doğruydu. Kitaplarımdan, broşürlerden, vb. Sayfalarımdan birkaç tane fotoğraf çektim ve metinleri nasıl dönüştürdüğüne şaşırdım.

free online ocr

Dosyanızı seçin ve ardından Yükle düğmesini tıklayın. Bir sonraki ekranda, birkaç seçenek ve resmin bir önizlemesi vardır. Her şeyi OCR yapmak istemezseniz kırpabilirsiniz. Ardından, OCR düğmesini tıklayın ve dönüştürülmüş metniniz resim önizlemesinin altında görünecektir. Ayrıca, herhangi bir sınırlama da yok, bu gerçekten güzel.

Çevrimiçi hizmetlere ek olarak, bilgisayarınızda yerel olarak çalışan bir yazılımın olması için sözünü etmek istediğim iki ücretsiz PDF dönüştürücü var. dönüşümler. Çevrimiçi hizmetlerle, her zaman bir İnternet bağlantısına ihtiyacınız olacak ve bu herkes için mümkün olmayabilir. Ancak, ücretsiz programlardan elde edilen dönüşümlerin kalitesinin web sitelerine göre daha kötü olduğunu fark ettim.

A-PDF Text Extractor

A-PDF Metin Çıkarıcı PDF dosyalarından metin ayıklamak oldukça iyi bir iş yapar. İndirip yükledikten sonra PDF dosyanızı seçmek için Aç düğmesine tıklayın. Ardından işlemi başlatmak için Metni çıkar 'ı tıklayın.

apdf extractor

Metin çıktı dosyasının saklanacağı bir yer soracaktır ve ardından ayıklamaya başlayacaktır. . Ayıklamak için yalnızca belirli sayfaları ve çıkarma türünü seçmenizi sağlayan Seçenekdüğmesini de tıklayabilirsiniz. İkinci seçenek ilginçtir çünkü metni farklı düzenlerde ayıklar ve hangisinin size en iyi çıktıyı vereceğini görmek için üçünü denemeye değerdir.

PDF2Text Pilot

PDF2Text Pilotu metni ayıklamak için iyi bir iş yapar. Herhangi bir seçeneği yok; sadece dosya veya klasörleri ekleyin, dönüştürün ve en iyisi için umuyorsunuz. Bazı PDF'lerde iyi çalıştı, ancak bunların çoğu için çok sayıda sorun vardı.

pdf2text

Sadece Dosya Ekle'ye tıklayın ve sonra . Dönüşüm tamamlandıktan sonra dosyayı açmak için Gözat'a tıklayın. Siz bu programdan yararlanacaksınız, bu yüzden çok fazla beklemeyin.

Ayrıca, kurumsal bir ortamda bulunuyorsanız veya ellerinizi Adobe Acrobat uygulamasının bir kopyasından elde ederseniz, gerçekten çok daha iyi sonuçlar alacağınızdan bahsetmeye değer. Acrobat açıkçası özgür değil, ama PDF'yi Word, Excel ve HTML formatına dönüştürme seçenekleri var. Ayrıca orijinal belgenin yapısını korumak ve karmaşık metni dönüştürmek için en iyi işi yapar.

pdf Dosyada Sayfa Ayırma

İlgili Mesajlar:


13.11.2014