.NET で PDF を Excel (XLS / XLS / CSV) に変換する方法

.NET で PDF を Excel (XLS / XLS / CSV) に変換する方法

この記事では、Aspose.PDF XLS Converter for .NET を使用してプログラミング的に PDF ドキュメントを Microsoft Excel フォーマット (XLS、XLSX、CSV、およびその他) に変換する方法を示しています。

現実世界問題

PDF から Excel に手動でテーブルや構造化されたデータを輸出することは、労働強度とエラー防止です この変換の自動化は、財務、レポート、分析、およびコンプライアンスのワークフローに不可欠です。

ソリューション概要

ASPOSE.PDF XLS Converter for .NET は以下の通りです。

  • 単一または複数の PDF を Excel ファイルに変換する(XLSX、XLS、CSV、ODS、XML)
  • コントロールワークシート構造とフォーマット
  • スケール可能な自動化のためのC#/NETプロジェクトと順調に統合

原則

  • Visual Studio 2019 以降
  • .NET 6.0 またはそれ以降
  • NuGet を介してインストールされた .NET のための Aspose.PDF
PM> Install-Package Aspose.PDF

ステップ・ステップ・実施

ステップ1:必要な名称スペースの参照

using Aspose.Pdf.Plugins;
using System.IO;

ステップ2:PDFをXLSXに変換する

var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";

// Use PdfXls (preferred) or XlsConverter – both expose the same conversion core.
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
    Format = PdfToXlsOptions.ExcelFormat.XLSX
};

options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));

// Perform conversion
var result = converter.Process(options);
Console.WriteLine("PDF converted to XLSX: " + outputPath);

使用ケース&アプリケーション(コード変数)

1. CSV、XLS、ODSまたはXMLへの輸出

望ましい出力フォーマットを指定する Format 財産:

options.Format = PdfToXlsOptions.ExcelFormat.CSV;  // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003;  // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS;  // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel

See PdfToXlsOptions.Excelフォーマット サポートされているすべてのフォーマット

2. Batch 複数の PDF を Excel に変換する

string[] files = Directory.GetFiles(@"C:\Docs\", "*.pdf");
foreach (var file in files)
{
    var outXlsx = Path.ChangeExtension(file, ".xlsx");
    var opts = new PdfToXlsOptions { Format = PdfToXlsOptions.ExcelFormat.XLSX };
    opts.AddInput(new FileDataSource(file));
    opts.AddOutput(new FileDataSource(outXlsx));
    using (var converter = new PdfXls())
    {
        converter.Process(opts);
    }
}

3. 作業表の数を最小限にする

デフォルトでは、すべての PDF ページが新しい Excel ワークシートになります。

options.MinimizeTheNumberOfWorksheets = true;

4. スタート時に白いコラムを入力する

特定のデータ輸入シナリオでは、最初の列として白い列を追加したいかもしれません。

options.InsertBlankColumnAtFirst = true;

最良の実践とヒント

  • プレビュー出力は、テーブルの配置とデータの完全性を確認するために、特に高度な配置オプションを使用する場合。
  • 大型ドキュメントでは、バッチ処理を使用して大量変換を効率的に自動化します。
  • CSV に変換する際は、デリミッターとダウンストリーム互換性の暗号化を確認します。
  • 高度に構造化またはスキャンされたPDFには、最良の結果を得るためのプロセス前の文書が提供されます。

完全実施例

using Aspose.Pdf.Plugins;
using System;
using System.IO;

class Program
{
    static void Main()
    {
        var inputPath = @"C:\Samples\sample.pdf";
        var outputPath = @"C:\Samples\sample.xlsx";
        var options = new PdfToXlsOptions
        {
            Format = PdfToXlsOptions.ExcelFormat.XLSX,
            MinimizeTheNumberOfWorksheets = true
        };
        options.AddInput(new FileDataSource(inputPath));
        options.AddOutput(new FileDataSource(outputPath));
        using var converter = new PdfXls();
        var result = converter.Process(options);
        Console.WriteLine("PDF converted to Excel successfully!");
    }
}

結論

Aspose.PDF XLS Converter for .NET は、C# プロジェクトにおける迅速かつ強力で柔軟な PDF-to-Excel (XLS / XLSX / CSV / XML / ODS) 自動化を可能にします。

よくある質問

Q: XLSX 以外にどのようなフォーマットを輸出できますか?A:サポートされているフォーマットには XLSX、XLSM、CSV、ODS、およびExcel 2003 XML が含まれています。 Format 選択する財産

Q:どのようにすべてのPDFコンテンツを単一のワークシートに保存できますか?A:セット MinimizeTheNumberOfWorksheets = true あなたの上で PdfToXlsOptions.

Q:より多くの例を見つけるか、サポートを得ることができますか?A: 公式 Aspose.PDF ドキュメンタリー、API リファレンス、または高度なシナリオのための連絡先サポートをご覧ください。

 日本語