PDF フォーム フィールド 値を .NET で CSV に輸出する方法

PDF フォーム フィールド 値を .NET で CSV に輸出する方法

この記事では、PDF フォーム フィールド (AcroForms) から CSV に値を輸出する方法を .NET で Aspose.PDF Form Exporter を使用して示しています。

現実世界問題

PDF フォームからスプレッドブックにデータを手動で抽出することは、退屈でエラーに耐えられます. ビジネスは、多くのフォームからのフィールド情報を報告、輸入、または自動化のための構造化された CSV ファイルに集める必要があります。

ソリューション概要

Aspose.PDF Form Exporter for .NET は、いかなる PDF からカスタマイズ可能な CSV ファイルにフォームフィールドの値を自動的に輸出し、調査、登録、または遵守作業流のデータ収集を簡素化します。

原則

  • Visual Studio 2019 以降
  • .NET 6.0 またはそれ以降
  • NuGet を介してインストールされた .NET のための Aspose.PDF
PM> Install-Package Aspose.PDF

ステップ・ステップ・実施

ステップ1:インストールおよび設定 Aspose.PDF

必要な名称を追加する:

using Aspose.Pdf.Plugins;
using System.IO;

ステップ2:PDFフォームの準備

満たされた PDF と望ましい CSV 出力へのコースを指定します。

string inputPdfPath = @"C:\Samples\filled_form.pdf";
string outputCsvPath = @"C:\Samples\form_data.csv";

ステップ3:輸出オプションを設定する(フィールドを選択、デリミッター)

すべてのフィールドをエクスポートするか、またはフィルド名を指定することができます。 SelectField必要に応じてカスタマイズデリミーターを設定します(デフォルトはcommaです):

// Export all form fields:
var selectAllFields = new SelectField(); // (leave empty for all fields)
char delimiter = ',';

var exportOptions = new FormExporterValuesToCsvOptions(selectAllFields, delimiter);
exportOptions.AddInput(new FileDataSource(inputPdfPath));
exportOptions.AddOutput(new FileDataSource(outputCsvPath));

// To export only certain fields:
var selectFields = new SelectField { PartialName = "Field1" };
var exportOptions = new FormExporterValuesToCsvOptions(selectFields, delimiter);

ステップ4:輸出プロセスを実行

使用する The FormExporter プラグインは輸出を処理するために:

var plugin = new FormExporter();
ResultContainer result = plugin.Process(exportOptions);

ステップ5:輸出されたCSVを確認する

CSVを読み、そのコンテンツを確認する:

string[] csvLines = File.ReadAllLines(outputCsvPath);
foreach (var line in csvLines)
{
    Console.WriteLine(line);
}

ステップ6:エラー処理

try
{
    ResultContainer result = plugin.Process(exportOptions);
    Console.WriteLine("Form data exported to CSV successfully.");
}
catch (Exception ex)
{
    Console.WriteLine($"Export failed: {ex.Message}");
}

完全実施例

using Aspose.Pdf.Plugins;
using System;
using System.IO;

class Program
{
    static void Main()
    {
        string inputPdfPath = @"C:\Samples\filled_form.pdf";
        string outputCsvPath = @"C:\Samples\form_data.csv";
        var selectAllFields = new SelectField();
        char delimiter = ',';

        var exportOptions = new FormExporterValuesToCsvOptions(selectAllFields, delimiter);
        exportOptions.AddInput(new FileDataSource(inputPdfPath));
        exportOptions.AddOutput(new FileDataSource(outputCsvPath));

        var plugin = new FormExporter();
        try
        {
            ResultContainer result = plugin.Process(exportOptions);
            Console.WriteLine("Exported form data to CSV.");
            string[] csvLines = File.ReadAllLines(outputCsvPath);
            foreach (var line in csvLines)
            {
                Console.WriteLine(line);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Export failed: {ex.Message}");
        }
    }
}

ケースとアプリケーションの使用

  • 数百の満たされたフォームから調査データの集合
  • CRM/ERPへの輸入のための登録または注文データの輸出
  • 合意または監査報告

共通の課題と解決策

チャレンジ: 混合フィールドタイプまたは欠けている値ソリューション: 事前に有効化されたフィールドとダウンストリーム処理におけるゼロ/空のケースを処理します。

チャレンジ: フォームデータとのデリミッター紛争ソリューション: フィールド値に commas が含まれている場合、別の delimiter (例えば、タブまたはパイプ) を設定します。

パフォーマンスと最良の実践

  • 幅広い輸出のためのロープでバッチプロセスPDF
  • 標準化されたデータセットのための明確なフィールド選択を使用する
  • 安全な処理のための輸出CSVの衛生化

結論

Aspose.PDF Form Exporter for .NET は、PDF フォームから CSV へのデータ抽出をスムーズにし、調査、登録、または遵守データの処理をより迅速かつより信頼できるようにします。

 日本語