Как экспортировать PDF Form Field Values в CSV в .NET

Как экспортировать PDF Form Field Values в CSV в .NET

В этой статье показывается, как экспортировать значения из полей формы PDF (AcroForms) в CSV с помощью Aspose.PDF Form Exporter в .NET. Вы научитесь собирать заполненные данные формы и выписывать их в качестве стандартного файла CSV, готового к импортированию или анализу.

Реальные мировые проблемы

Ручно выводить данные из заполненных PDF-форматов в шины является скучным и ошибочным. Бизнес часто нуждается в совокупности данных полей из множества форм в структурированный CSV-файл для отчетности, импорта или автоматизации.

Решение обзор

Aspose.PDF Form Exporter для .NET позволяет автоматически экспортировать значения полей формы из любого PDF в персонализированный CSV-файл, упрощая сбор данных для опросов, записей или соответствия рабочих потоков.

Предупреждения

  • Visual Studio 2019 или позднее
  • .NET 6.0 или более поздний
  • Aspose.PDF для .NET, установленный через NuGet
PM> Install-Package Aspose.PDF

Step-by-Step реализация

Шаг 1: Инсталляция и настройка Aspose.PDF

Добавьте необходимые номенклатуры:

using Aspose.Pdf.Plugins;
using System.IO;

Шаг 2: Подготовьте форму PDF

Определите маршрут для заполненного PDF и желаемого выхода CSV:

string inputPdfPath = @"C:\Samples\filled_form.pdf";
string outputCsvPath = @"C:\Samples\form_data.csv";

Шаг 3: Настройка опций экспорта (Выберите поля, Делимитер)

Вы можете экспортировать все поля или указать имена полей с SelectFieldНастройка персонализированного делимитера, если это необходимо (дефальт является коммой):

// Export all form fields:
var selectAllFields = new SelectField(); // (leave empty for all fields)
char delimiter = ',';

var exportOptions = new FormExporterValuesToCsvOptions(selectAllFields, delimiter);
exportOptions.AddInput(new FileDataSource(inputPdfPath));
exportOptions.AddOutput(new FileDataSource(outputCsvPath));

// To export only certain fields:
var selectFields = new SelectField { PartialName = "Field1" };
var exportOptions = new FormExporterValuesToCsvOptions(selectFields, delimiter);

Шаг 4: Продолжайте экспортный процесс

Используйте FormExporter Плагин для обработки экспорта:

var plugin = new FormExporter();
ResultContainer result = plugin.Process(exportOptions);

Шаг 5: Проверка экспортируемого CSV

Прочитайте CSV и проверите его содержание:

string[] csvLines = File.ReadAllLines(outputCsvPath);
foreach (var line in csvLines)
{
    Console.WriteLine(line);
}

Шаг 6: Управление ошибками

try
{
    ResultContainer result = plugin.Process(exportOptions);
    Console.WriteLine("Form data exported to CSV successfully.");
}
catch (Exception ex)
{
    Console.WriteLine($"Export failed: {ex.Message}");
}

Полный пример реализации

using Aspose.Pdf.Plugins;
using System;
using System.IO;

class Program
{
    static void Main()
    {
        string inputPdfPath = @"C:\Samples\filled_form.pdf";
        string outputCsvPath = @"C:\Samples\form_data.csv";
        var selectAllFields = new SelectField();
        char delimiter = ',';

        var exportOptions = new FormExporterValuesToCsvOptions(selectAllFields, delimiter);
        exportOptions.AddInput(new FileDataSource(inputPdfPath));
        exportOptions.AddOutput(new FileDataSource(outputCsvPath));

        var plugin = new FormExporter();
        try
        {
            ResultContainer result = plugin.Process(exportOptions);
            Console.WriteLine("Exported form data to CSV.");
            string[] csvLines = File.ReadAllLines(outputCsvPath);
            foreach (var line in csvLines)
            {
                Console.WriteLine(line);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Export failed: {ex.Message}");
        }
    }
}

Используйте случаи и приложения

  • Агрегация данных из сотен заполненных форм
  • Регистрация или экспорт данных заказа для импорта в CRM/ERP
  • Соответствие или отчет о аудите

Общие вызовы и решения

Проблемы: Смешанные типы полей или отсутствующие значенияРешение: Заранее валидируйте поля и обрабатывайте нулевые/пустые случаи в нижнем потоке обработки.

Проблема: ** Делимитерные конфликты с данными формыРешение:** Настроить другой делимитер (например, таблицу или трубку), если ваши поля ценностей содержат коммы.

Показания и лучшие практики

  • Батч-процессы PDF в кругу для экспорта в большом масштабе
  • Используйте explicit field selection для стандартизированных наборов данных
  • Санитизировать экспортированный CSV для безопасного обращения

Заключение

Aspose.PDF Form Exporter для .NET упрощает извлечение данных из форматов PDF в CSV, делая обследование, регистрацию или обработку данных соответствия быстрее и надежнее для ваших решений.

 Русский