パソコンで画像やPDFファイルからテキストデータを抽出するなら「Googleドライブ」がおすすめ

パソコンで画像やPDFファイルからテキストデータを抽出するなら「Googleドライブ」がおすすめ

PCで、画像やPFGファイルなどから文字を認識させる(OCR)には、専用のアプリを利用するのが一般的ですが、Googleアカウントを持っているなら、Web版の「Googleドライブ」を利用してみてはいかがでしょうか。

Web版の「Googleドライブ」にはOCR機能が搭載されており、専用ソフトに引けを取らない精度で文字を認識してくれます。

そこでここでは、Web版の「Googleドライブ」で、画像ファイルやPDFファイルから文字を抽出する方法を紹介します。

動作環境

この記事は、以下の環境で実行した結果を基にしています。他のエディションやバージョンでは、動作結果が異なる場合があることをご了承ください。

ソフトウェアバージョン
Windows10 Pro 64bit1903

ファイルからテキストデータを抽出する

まず、WebブラウザでGoogleドライブにアクセスします。(Googleアカウントでログインしていない場合は、ログインします。)

ここでは、Google Chromeを利用しています。

マイドライブ - Google ドライブ

パソコンで画像やPDFファイルからテキストデータを抽出するなら「Googleドライブ」がおすすめ

Googleドライブのページを開いたら、文字認識させたい画像やPDFファイルをドラッグするなどしてアップロードします。

パソコンで画像やPDFファイルからテキストデータを抽出するなら「Googleドライブ」がおすすめ

ファイルをアップロードしたら、Googleドライブ上でファイルを右クリックして、メニューから「アプリで開く」をクリックし「Googleドキュメント」を選択します。

パソコンで画像やPDFファイルからテキストデータを抽出するなら「Googleドライブ」がおすすめ

すると、アップロードしたファイルに対してテキストへの変換処理が実行され、変換が完了するとファイルが開きます。

パソコンで画像やPDFファイルからテキストデータを抽出するなら「Googleドライブ」がおすすめ

変換処理中の画面

Googleドキュメントでファイルが開くと、元の画像の下に変換されたテキストデータが表示されています。

以下のような手書きではない文字だけの画像であれば、かなり高精度で変換できます。また、横書きだけでなく縦書きでも問題なく変換できます。

パソコンで画像やPDFファイルからテキストデータを抽出するなら「Googleドライブ」がおすすめ

抽出したテキストデータは、クリップボードにコピーしてほかのアプリに貼り付けたり、そのままGoogleドキュメント上で、Word形式、ODF形式、PDF形式、テキスト形式などのファイルとして保存することもできます。

なお、Googleドキュメントで開いたファイルは、Googleドライブ上に自動的に保存されます。

留意事項

上記のように、手書きではない文字だけの場合は、かなりの高精度でテキスト変換できますが、元の文字に色がついている場合や、箇条書きや表などが含まれる場合、手書きの文章の場合などではうまく変換できない場合があります。

この辺りは実際に試してみるのが一番です。

なお、元ファイルの主な制限事項は、公式ヘルプで以下のように記載されています。

  • 元ファイル形式: JPEG、PNG、GIF、PDF
  • ファイルサイズ:2MB以下(2MB以上でも変換できる場合もあります)
  • ファイルの向き:元ファイルを正しい向きにします。向きが間違っている場合は、回転させてからGoogleドライブにアップロードします。
  • 画質:明るさが均一でコントラストがはっきりしたシャープな画像

PDF や写真のファイルをテキストに変換する - パソコン - Google ドライブ ヘルプ

あとがき

ここで紹介している方法では、紙の書類を撮影した画像ファイルを用意しなければならない手間があります。

紙の書類をカメラで直接撮影してテキストデータに変換したいときは、以下の記事で紹介しているスマホ版「Google Keep」がおススメです。

Android端末で紙の書類や画像からテキストデータを抽出する方法
ここでは、Android向けアプリの「LINE」や「Google Keep」を使って、紙の書類や画像からテキストデータを抽出する方法を紹介します。

記事が役立ったらシェアしてくれるとうれしいです。