ノウハウ

PDFの文字をコピーする方法とコピーできない理由とその対策

公開日:2023 / 11 / 27更新日:2024 / 1 / 19

PDFで作成した資料の内容を他の文書に使いたい、参考にしたいという場面は多いものです。その場合はPDFからコピー&ペーストすることが多いでしょう。しかし、ときにはうまくコピーできないことがあります。大量のPDF文書をコピーしたい場合、一つひとつ手作業でコピーするのは非効率です。

今回は、PDFの文字をコピーする方法と、そのままではコピーできないときの対策をわかりやすくお伝えします。効率的にコピーする方法も紹介しますので、コピーができないなどのトラブルがない方も、ぜひご覧ください。

PDFの文字をコピーする一般的な方法

PDF のコンテンツは基本的にコピー可能です。コピーした内容は、テキストファイルだけでなくMicrosoft Word、Microsoft Excel、Power Pointなどさまざまなファイル形式で書き出して利用できます。

ただし次の場合、そのままではコピーできません。

  • 作成者がコピーを許可していない場合
  • ページ1枚が1つの画像データになっている場合

PDFの文字をコピーする一般的な方法を2つ紹介します。

  画面上でテキスト範囲を指定してコピーする方法

PDFのテキストをコピーするときの、もっとも簡単な方法です。

  1. Adobe Acrobat Reader などのPDFビューアーやWebブラウザーで、コピーしたいPDFを表示する
  2. コピーする範囲を選択する
  3. 右クリック+コピー、もしくはctrl+Cでコピーする
  4. 利用したいアプリケーションに貼り付ける

ただし、改行や改ページ、複雑なレイアウトがある場合は文章の順番が崩れることが多く、手作業での修正が必要です。

  全てを選択してコピーする方法

たとえば、うまく範囲選択できない、表示しているページの外までコピーしたいなどの場合、PDFビューアーで「全てを選択」すればコピーできます。一度全てをコピーして、必要な部分だけを抜き出しましょう。

  1. PDFビューアーでコピーしたいPDFを表示する
  2. 「全てを選択」コマンド、もしくはctrl+Aを実行する
    ※ 表示しているページのテキスト全てが選択される場合と、文書全体のテキストが選択される場合があります。
  3. 右クリック+コピー、もしくはctrl+Cでコピーする
  4. 利用したいアプリケーションに右クリック+貼り付け、もしくはctrl+Vで貼り付ける

一般的にはこの2つの方法が使われます。しかしこれらの方法は、文書が複数ある場合、またはコピーしたページが3ページ以上ある場合は時間がかかってしまい、不便です。

その場合は「PDFの文字を効率的にコピーする方法」をおすすめします。

PDFの文字をコピーできない理由と対処法

紹介した方法を試しても、PDFの文字をコピーできないことがあります。その理由と対処法を3通り説明します。

  PDFが保護されている場合

作成者がPDFファイルを作成するとき、PDFの利用制限を設定していることがあります。この場合はファイルが保護されているので、テキストや画像をコピーすることはできません。この設定は、文書のプロパティで確認できます。

  1. 「ファイル」メニューの「プロパティ」を開く
  2. 「文書のプロパティ」ダイアログを表示し、「セキュリティ」タブを確認する
  3. 「文書に関する制限の概要」のセクションで「内容のコピー」が「許可しない」になっていればコピーできない

この場合は、PDFの作成者に連絡し、保護を外したファイルを送ってもらうか、パスワードをもらって保護を解除すれば、コピーすることが可能です。

  画像データになっている場合

PDFファイルが文書ファイルをPDF化したものではなく、印刷物をスキャンしたPDFの場合も、そのままコピーできません。ページ全体が1枚の画像データになっているので、テキストを抽出できないからです。

この場合は、OCRツールでテキストを抽出するとコピーできるようになります。

  正しく貼り付けできない場合

テキストを選択してコピーできても、うまく貼り付けできない場合もあります。貼り付け時に順序がバラバラになったり、同じ部分が繰り返されたりする現象が起こる場合、PDFと貼り付け先のアプリの相性が悪いことが原因です。

この場合は一度Microsoft Wordやテキストエディターに貼り付け、再度コピーして目的のアプリケーションに貼り付けると、正確に貼り付けることができます。しかし、コピーしたいPDFが大量にある場合は、現実的ではありません。

PDFの文字を効率的にコピーする方法

PDFファイルから大量のデータを効率的にコピーしたい場合に有効な方法を、3つ紹介します。

  OCRツールを利用する

OCRに特化したツールを導入し、PDFファイルの文字をテキストデータとして抽出します。大量のファイルでも自動的に認識することが可能で、画像や表も認識できるので、効率的なコピーが可能です。

OCRを導入することで、PDF内容を手作業で転記する手間を省くことができます。たとえば、注文書や申込書などPDFで送付される書類も、OCRツールで素早くテキストデータ化し、データベースに連係できます。図や表が挿入されているレイアウトでも高精度に文字認識ができるので、入力作業の効率化や転記ミスの軽減が可能です。

作業時間が大幅に短縮できるので、人件費のコストダウンや生産性向上にもつながるでしょう。

  Acrobat DCを利用する

多くのユーザーはPDFファイルの閲覧に、WebブラウザーかAdobe Acrobat Reader DCなどPDFビューアーを利用しているでしょう。しかし、これらのアプリケーションで可能なのは閲覧のみで、編集はできません。有料のAdobe Acrobat DCを利用すれば、PDFファイルの編集も可能になります。また、文字認識機能により、編集可能なPDFファイルを作成できます。

PDFファイルを直接編集でき、さまざまな操作が可能だというのが大きなメリットです。ただしOCR機能に特化したツールと比較して読み取り精度が低く、うまく読み取らない場合もあります。また、OCR機能に特化したツールの方が日本のビジネスで利用される書類や帳票に強いものが多く、ビジネスで利用する際の利便性については、OCRツールの方に軍配が上がります。

  専門業者に依頼する

コピーしたいPDFファイルが大量にある場合は、文書電子化の専門業者に頼むという方法もあります。業者が作業を行ってくれるため、OCRツールやAcrobat DCなどを利用して自社社員が作業するのと比較して、大きく手間を省けるでしょう。しかし、外注であるため、毎回一定の費用がかかり、社内にノウハウを蓄積できないというデメリットがあります。

以上のように、PDFの文字を効率的にコピーする方法は複数あります。コピーした後ビジネスにおいて広く活用していきたいなら、OCRツールの利用がおすすめです。

PDFの文字をOCRツールでテキストデータにすることで得られるメリット

OCRツールを活用し、PDFの文字をテキストデータ化した場合には、次のようなメリットも得られます。

  検索が可能になる

PDFファイルのままでは、画像の中のテキスト文など検索できない部分もあります。また、画像データになっているPDFファイルでは、検索自体ができません。

しかしOCRツールを導入してテキストデータを抽出しPDFファイルに埋め込めば、検索が可能となります。

  情報共有やデータ利活用が容易になる

PDFファイルの文字をテキストデータにすることで、他のアプリケーションとのデータ連係が可能です。たとえば、注文書や請求書のPDFをOCRツールでテキストデータ化し、Microsoft Excelや会計システム、自社の業務システムなど、さまざまなアプリケーションにデータとして入力することができます。テキストデータはOSや作業環境を限定せず、どのような環境でも利用可能です。

これにより、情報共有やデータの利活用が容易になります。

OCR導入のメリットは、次の記事でも紹介しています。あわせてご覧ください。

PDFのテキストを確実にコピーする方法を知って、上手に利用しよう

プレゼンテーション資料やカタログなど、PDF形式で作成される資料は多くあります。他の文書に流用したいと思っても、PDFファイルのデータはWordのようにうまくコピーできないことも少なくありません。とくに図表の入るレイアウトや改ページがあると、うまくいかないことが多いようです。また、文書が保護されている場合もコピーはできません。

そのようなときのために、PDFファイルをコピーする方法を何通りか知っておくと安心です。とくに効率的なのがOCRツールの導入です。OCRツールなら、図表が入っていたりデータが大量にあったりしてもコピーしやすく、多くの場面で活用できます。

パナソニック ソリューションテクノロジーではさまざまなOCRソリューションをご用意しています。用途にあわせて最適なOCRを選択いただけますので、ぜひ一度ご相談ください。

先に説明したとおりOCR処理によりPDFの内容をテキストデータとして抽出できるため、さまざまな業務で活用しやすくなります。次の記事で活用例を紹介していますので、ぜひご覧ください。

関連記事

パナソニック ソリューションテクノロジー株式会社では、注文書や請求書などの入力や転記作業に対応した「WisOCR for 注文書・請求書」と、申込書や作業報告書・検査表などのあらゆる紙帳票の入力や転記作業に対応した「WisOCR」という2つのAI-OCR製品をご用意しております。AI-OCRの導入を検討されている方は、ぜひ一度お問い合わせください。

AI-OCRのお役立ち資料

AI-OCRの社内導入に向けて
稟議書に記載すべき3つの要素

データ入力業務の効率化を目的に「WisOCR for 注文書・請求書」を導入する際、社内向けの稟議書作成でお役立ていただける内容となっております。

AI-OCRの導入前、必ずトライアルで
確認しておきたい3つのポイント

トラブルを未然に防ぐために、AI-OCRの導入前にトライアルでチェックしておきたい3つのポイントについて、詳しく解説します。

注文書・請求書のDXで乗り越えるべき3つのハードルとは!?

注文書・請求書のDXにおける“ハードル”と、その乗り越え方について解説していきます。
 

OCRソフトをお探しの方、OCR機能の組み込み開発をご検討中の方
お気軽にお問い合わせください!