Как экспортировать PDF Form Field Values в CSV в .NET
В этой статье показывается, как экспортировать значения из полей формы PDF (AcroForms) в CSV с помощью Aspose.PDF Form Exporter в .NET. Вы научитесь собирать заполненные данные формы и выписывать их в качестве стандартного файла CSV, готового к импортированию или анализу.
Реальные мировые проблемы
Ручно выводить данные из заполненных PDF-форматов в шины является скучным и ошибочным. Бизнес часто нуждается в совокупности данных полей из множества форм в структурированный CSV-файл для отчетности, импорта или автоматизации.
Решение обзор
Aspose.PDF Form Exporter для .NET позволяет автоматически экспортировать значения полей формы из любого PDF в персонализированный CSV-файл, упрощая сбор данных для опросов, записей или соответствия рабочих потоков.
Предупреждения
- Visual Studio 2019 или позднее
- .NET 6.0 или более поздний
- Aspose.PDF для .NET, установленный через NuGet
PM> Install-Package Aspose.PDF
Step-by-Step реализация
Шаг 1: Инсталляция и настройка Aspose.PDF
Добавьте необходимые номенклатуры:
using Aspose.Pdf.Plugins;
using System.IO;
Шаг 2: Подготовьте форму PDF
Определите маршрут для заполненного PDF и желаемого выхода CSV:
string inputPdfPath = @"C:\Samples\filled_form.pdf";
string outputCsvPath = @"C:\Samples\form_data.csv";
Шаг 3: Настройка опций экспорта (Выберите поля, Делимитер)
Вы можете экспортировать все поля или указать имена полей с SelectField
Настройка персонализированного делимитера, если это необходимо (дефальт является коммой):
// Export all form fields:
var selectAllFields = new SelectField(); // (leave empty for all fields)
char delimiter = ',';
var exportOptions = new FormExporterValuesToCsvOptions(selectAllFields, delimiter);
exportOptions.AddInput(new FileDataSource(inputPdfPath));
exportOptions.AddOutput(new FileDataSource(outputCsvPath));
// To export only certain fields:
var selectFields = new SelectField { PartialName = "Field1" };
var exportOptions = new FormExporterValuesToCsvOptions(selectFields, delimiter);
Шаг 4: Продолжайте экспортный процесс
Используйте FormExporter
Плагин для обработки экспорта:
var plugin = new FormExporter();
ResultContainer result = plugin.Process(exportOptions);
Шаг 5: Проверка экспортируемого CSV
Прочитайте CSV и проверите его содержание:
string[] csvLines = File.ReadAllLines(outputCsvPath);
foreach (var line in csvLines)
{
Console.WriteLine(line);
}
Шаг 6: Управление ошибками
try
{
ResultContainer result = plugin.Process(exportOptions);
Console.WriteLine("Form data exported to CSV successfully.");
}
catch (Exception ex)
{
Console.WriteLine($"Export failed: {ex.Message}");
}
Полный пример реализации
using Aspose.Pdf.Plugins;
using System;
using System.IO;
class Program
{
static void Main()
{
string inputPdfPath = @"C:\Samples\filled_form.pdf";
string outputCsvPath = @"C:\Samples\form_data.csv";
var selectAllFields = new SelectField();
char delimiter = ',';
var exportOptions = new FormExporterValuesToCsvOptions(selectAllFields, delimiter);
exportOptions.AddInput(new FileDataSource(inputPdfPath));
exportOptions.AddOutput(new FileDataSource(outputCsvPath));
var plugin = new FormExporter();
try
{
ResultContainer result = plugin.Process(exportOptions);
Console.WriteLine("Exported form data to CSV.");
string[] csvLines = File.ReadAllLines(outputCsvPath);
foreach (var line in csvLines)
{
Console.WriteLine(line);
}
}
catch (Exception ex)
{
Console.WriteLine($"Export failed: {ex.Message}");
}
}
}
Используйте случаи и приложения
- Агрегация данных из сотен заполненных форм
- Регистрация или экспорт данных заказа для импорта в CRM/ERP
- Соответствие или отчет о аудите
Общие вызовы и решения
Проблемы: Смешанные типы полей или отсутствующие значенияРешение: Заранее валидируйте поля и обрабатывайте нулевые/пустые случаи в нижнем потоке обработки.
Проблема: ** Делимитерные конфликты с данными формыРешение:** Настроить другой делимитер (например, таблицу или трубку), если ваши поля ценностей содержат коммы.
Показания и лучшие практики
- Батч-процессы PDF в кругу для экспорта в большом масштабе
- Используйте explicit field selection для стандартизированных наборов данных
- Санитизировать экспортированный CSV для безопасного обращения
Заключение
Aspose.PDF Form Exporter для .NET упрощает извлечение данных из форматов PDF в CSV, делая обследование, регистрацию или обработку данных соответствия быстрее и надежнее для ваших решений.