Adobe Acrobat Pro DCでPDFをテキスト認識できない時の対処法(OCR)

Pocket

スキャンデータや画像から文字を読み取りテキストに変換するOCRという技術がありますが、AdobeのAcrobat Pro DCにはOCRの技術がついています。
(公式サイトの説明はこちら)

しかし、PDFを一旦画像化しないとテキスト認識できない場合があったりと、少しコツが必要な場合もあります

若干読み取り間違いはありますが、PDFの原稿を見ながらイチから手打ちをするよりは、
はるかに効率が良いので、そのちょっとしたコツを紹介します。

えーOCR効かへんしーまじでー全部手打ち??ってなる前に、一度お試しください。

Adobe Acrobat Pro DCでPDFをテキスト認識できない時の対処法

1.PDFをAcrobat Pro DCで開き、スキャン補正を選択

PDFをAcrobat Pro DCで開き、スキャン補正を選択。

画面上部にスキャン補正というメニューが現れます。

2.Acrobat Pro DCでスキャン補正後、テキスト認識を選択

中央部分の「テキスト認識」→ このファイル内を選択。

青いテキスト認識というボタンを選択。

するとPDF内で文字を選択できるようになり、文字をコピーすることができるようになります。

テキスト認識後、文字選択できなかったら一度画像化して再度PDF化する

しかしファイルによっては、テキスト認識を選択後、画面が真っ白になったり、文字を選択できない場合があります。

Acrobat Pro DCのOCRは文字データを一切含まない、画像から作成したPDFから文字を抽出する機能です。

PowerPointやWordから作成したPDFには使えないことがあります。

その場合は、一旦画像化(jpegに書き出し)します。

ファイル → 書き出し形式 → 画像 → jpegと選択。

すると各ページ毎のjpegファイルが書き出されます。

書き出されたファイルをペイント等のアプリケーションで開きます。

印刷指示をして、プリンタを選択する欄で「Adobe PDF」を選択して再度PDF化します。

画像から作成したPDFをAcrobat Pro DCで開いて、スキャン補正→テキスト認識を行います。

作業後は文字が選択できるようになりますよ。

まとめ

Acrobat Pro DCからは、このOCR機能があるためWordやExcelに書き出すことも可能です。

Acrobat Pro DCのツール画面には色々なメニューがありますが、私は他にはPDFを結合させるくらいしか使ったことがないので、色々試してみたいです。

Adobe Acrobat DCを使われたことがない方は、無料体験版を使うこともできますよ。

無料体験版ダウンロードはこちら

この記事が気に入ったら
いいね ! しよう

Twitter で

この記事へのコメント

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です