PDFファイルからテキストを抽出するために5つのプログラムを分離します

PDF(Portable Document Format)は、ファイルを電子メールで誰かに転送したり、オンラインで読んだりするための最も一般的なファイル形式です。 PDFファイルは読み取り専用形式のままであり、簡単に編集することはできません。 Windows 8 / 8.1 / 10を含むすべての主要なオペレーティングシステムにはPDFリーダーが組み込まれているため、サードパーティのソフトウェアをインストールしなくてもPDFファイルを表示できます。 いくつかのPDFファイルがあり、それらからすべてのテキストを抽出したい場合は、サードパーティのツールなしで同じことを行うことはできません。 このガイドでは、WindowsでPDFファイルからテキストを抽出する方法またはPDFファイルをテキストファイルに変換する方法を確認します。

PDFファイルは、オンラインツールを使用して、またはコンピューターのソフトウェアを使用して、テキストファイルに抽出できます。 Windows 10 PCにサードパーティをインストールしたくない場合は、オンラインサービスを使用できます。 ただし、この投稿では、PDFファイルからテキストを抽出するためのオンラインとオフラインの両方の方法について説明します。

PDF抽出

ExtractPDFは、PDFファイルからテキストと画像を抽出するための無料のオンラインサービスです。 ExtractPDF Webサイトを閲覧した後、ボタンをクリックします ファイルの選択 そして、コンピュータからPDFファイルを選択します。 オンラインURLからファイルをダウンロードすることもできます。 ファイルがアップロードされたら、[スタート]ボタンをクリックします。 数秒以内に、選択したPDFファイルから画像とテキストが抽出されます。 これで、抽出したテキストと画像をコンピュータにダウンロードできます。 現在、最大25MBのPDFファイルサイズをサポートしています。

からExtractPDFにアクセスできます ここで .

オンラインOCR

オンラインOCRは、PDFファイルからテキストを抽出できるもうXNUMXつの無料のオンラインサービスです。 使いやすいです。 コンピューターからファイルをアップロードし、PDFファイルを使用できる言語を選択して、最後に「」ボタンをクリックするだけです。 会話" 。 変換が完了すると、Word形式(.docx)でファイルをダウンロードするように提案されます。 一度にサポートされるのは15MBのPDFファイルのみです。

これをクリックしてオンラインOCRにアクセスします リンク .

STDUビューア

STDU Viewerは、TIFF、PDF、DjVu、XPS、JBIG2、WWF、PDF、FB2、TXT、コミックブックアーカイブ(CBRまたはCBZ)、TCR、PalmDoc(PDB)などの複数のファイル形式を開いて表示するように設計された無料のプログラムです。 )、MOBI、AZW、EPub、DCXおよび画像(BMP、PCX、JPEG、GIF、PNG、WMF、EMF、PSD)、TXTファイル、TCR、PDB、FB2、PDF、XPS、MOBI、AZW、EPubまたはDjvu、等さらに、PDFファイルからのテキストコンテンツのエクスポートもサポートしています。

PDFファイルのテキストまたは画像の内容をエクスポートするには、をクリックします ファイル  > >をテキストまたは画像にエクスポート 。 プロンプトが表示されたら、新しいテキストファイルを保存する場所を選択し、「」ボタンをクリックします。 わかった" .

からSTDUビューアを選択します ここで .

A-PDFテキストエクストラクタ

A-PDF Text Extractorは、Windowsオペレーティングシステムで動作してPDFファイルからテキストを抽出するように設計されたもうXNUMXつの無料ツールです。 個人および商用利用は無料です。

PDFファイルからテキストを抽出するには、「 開く" リストからコンピュータからPDFファイルを選択し、ボタンをクリックします。」 テキスト抽出」 。 テキストの抽出が開始されます。

からA-PDFテキストエクストラクタを開く ここで .

Gaaiho PDF Reader

GaaihoPDFリーダー هو PDFリーダー Windowsオペレーティングシステムに最適です。 エレガントでわかりやすいインターフェースが付属しています。 基本的にはPDFリーダーですが、多くの追加機能があります。 この無料のツールを使用すると、マウスを数回クリックするだけでPDFファイルからテキストを抽出できます。

テキストを抽出するGaaihoPDFReaderでPDFドキュメントを開きます。 メニューをクリック ファイル オプションを選択します 名前を付けて保存 。 次に、オプションを選択します PDFからテキストへ 横のドロップダウンメニューから タイプとして保存 。 最後に、「 保存する" テキスト形式で目的の結果を取得します。

関連記事
記事を公開する

コメントを追加