Як автоматизувати резюме контенту PDF за допомогою ChatGPT і .NET

Як автоматизувати резюме контенту PDF за допомогою ChatGPT і .NET

Автоматизація резюме PDF-документів з інтелектуальною інтелектом відкриває потужні ефективності для розробників .NET, працівників знань та автоматизаційних команд. У цьому керівництві ви дізнаєтеся, як витягти текст з файлів PDF за допомогою Aspose.PDF Plugin для .Net, надіслати вміст до ChatGPT OpenAI, а також розрізати короткі сукупності, генерувані AI — повністю програмізовано.

Передумови

  • Aspose.PDF.Plugin встановлено через NuGet
  • OpenAI API доступ і ключ (або сервіс Azure OpenAI)
  • Програма .NET 6+
  • Доступ до Інтернету для запитів ChatGPT

Витяг тексту з PDF

Використовуйте Aspose.PDF.Plugin’s TextExtractor для екстракції тексту з контенту PDF для обробки AI.

using Aspose.Pdf.Plugins;

string inputPath = @"C:\Docs\sample.pdf";
var extractor = new TextExtractor();
var options = new TextExtractorOptions();
options.AddInput(new FileDataSource(inputPath));
var resultContainer = extractor.Process(options);
string textContent = resultContainer.ResultCollection[0].ToString();

Передача контенту в ChatGPT

Надіслати витягнутий текст до ChatGPT для резюме. (Використовуйте HttpClient, щоб зателефонувати OpenAI API з вашим ключем API і поштовхом.)

using System.Net.Http;
using System.Net.Http.Headers;
using System.Text;
using Newtonsoft.Json;

string apiKey = "YOUR_OPENAI_API_KEY";
string prompt = $"Summarize the following PDF content in 5 bullet points:\n{textContent}";

var httpClient = new HttpClient();
httpClient.DefaultRequestHeaders.Authorization = new AuthenticationHeaderValue("Bearer", apiKey);
var requestBody = new
{
    model = "gpt-3.5-turbo",
    messages = new[]
    {
        new { role = "system", content = "You are a helpful assistant that summarizes PDF content." },
        new { role = "user", content = prompt }
    }
};
string jsonBody = JsonConvert.SerializeObject(requestBody);
var response = await httpClient.PostAsync(
    "https://api.openai.com/v1/chat/completions",
    new StringContent(jsonBody, Encoding.UTF8, "application/json")
);
string responseString = await response.Content.ReadAsStringAsync();
// Parse summary from responseString

Розробка та заощадження сумарних

Витягніть резюме з відповіді JSON API ChatGPT і зберігайте його, як це потрібно (наприклад, в базі даних, файлі або поверніться в новий PDF).

4 Використання помилок

  • Зробіть справу з обмеженнями швидкості API, мережевими помилками та неправильними відповідями.
  • Затверджуйте витягнутий текст, перш ніж відправити його в AI.
  • Зареєструйте всі операції для відстеження.

5 Застереження безпеки

Ніколи не відправляйте конфіденційні PDF-файли до облачних служб AI, якщо не підтверджено відповідність.

Часто задавані запитання

Q: Чи можу я резюмувати скановані PDF-файли?**Відповідь: Тільки якщо вони були OCR’d або містять вибірковий текст.

** Q: Чи є це безпечним для конфіденційних документів?**Відповідь: Надішліть дані тільки ChatGPT, якщо ваші вимоги до конфіденційності дозволяють. розглянути місцеву обробку для чутливого контенту.

 Українська