Как автоматизировать совокупность контента PDF с помощью ChatGPT и .NET

Как автоматизировать совокупность контента PDF с помощью ChatGPT и .NET

Автоматизация совокупности PDF-документов с ИИ открывает мощные эффективности для разработчиков .NET, работников знаний и команд автоматизации. В этом руководстве вы узнаете, как извлечь текст из файлов PDF с помощью Плугина Aspose.PDF для .Net, отправить контент в ChatGPT OpenAI, а также разделить резюме генерированных ИI — полностью программируя.

Предупреждения

  • Aspose.PDF.Plugin установлен через NuGet
  • OpenAI API доступ и ключ (или Azure OpenAI Service)
  • Программа .NET 6+
  • Доступ к Интернету для запросов ChatGPT

1.Извлечение текста из PDF

Используйте Aspose.PDF.Plugin’s TextExtractor для извлечения текста из PDF-контента для обработки искусственного искусства.

using Aspose.Pdf.Plugins;

string inputPath = @"C:\Docs\sample.pdf";
var extractor = new TextExtractor();
var options = new TextExtractorOptions();
options.AddInput(new FileDataSource(inputPath));
var resultContainer = extractor.Process(options);
string textContent = resultContainer.ResultCollection[0].ToString();

Передача контента в ChatGPT

Пожалуйста, отправьте извлеченный текст в ChatGPT для обобщения. (Используйте HttpClient, чтобы позвонить OpenAI API с вашим ключом API и промпотом.)

using System.Net.Http;
using System.Net.Http.Headers;
using System.Text;
using Newtonsoft.Json;

string apiKey = "YOUR_OPENAI_API_KEY";
string prompt = $"Summarize the following PDF content in 5 bullet points:\n{textContent}";

var httpClient = new HttpClient();
httpClient.DefaultRequestHeaders.Authorization = new AuthenticationHeaderValue("Bearer", apiKey);
var requestBody = new
{
    model = "gpt-3.5-turbo",
    messages = new[]
    {
        new { role = "system", content = "You are a helpful assistant that summarizes PDF content." },
        new { role = "user", content = prompt }
    }
};
string jsonBody = JsonConvert.SerializeObject(requestBody);
var response = await httpClient.PostAsync(
    "https://api.openai.com/v1/chat/completions",
    new StringContent(jsonBody, Encoding.UTF8, "application/json")
);
string responseString = await response.Content.ReadAsStringAsync();
// Parse summary from responseString

3.Парсинг и сбережение AI суммарей

Исключите резюме из ответа JSON API ChatGPT и сохраните его, как это необходимо (например, в базе данных, файле или обратно в новом PDF).

4 Ошибка обработки

  • Управляйте лимитами скорости API, сетевыми ошибками и неправильными ответами.
  • Проверьте полученный текст, прежде чем отправить его в AI.
  • Запись всех операций для прослеживаемости.

5 Безопасность

Никогда не отправляйте конфиденциальные PDF-файлы в облачные услуги искусственного искусства, если соблюдение не подтверждено.

Часто задаваемые вопросы

** Q: Могу ли я обобщать сканированные PDF-файлы?**Ответ: Только если они были ОКР или содержат выбранный текст. В противном случае, используйте плагины OCR в первую очередь.

** Q: Безопасно ли это для конфиденциальных документов?**Ответ: Посылайте данные ChatGPT только в том случае, если ваши требования к конфиденциальности позволяют.

 Русский