Как да автоматизирате PDF съдържание с помощта на ChatGPT и .NET
Автоматизирането на обобщението на PDF документи с AI разкрива мощни ефективности за разработчиците на .NET, работниците на знания и екипите за автоматизация.В този ръководство ще научите как да извличате текст от PDF файлове с помощта на Aspose.PDF Plugin за .Net, да изпращате съдържание на OpenAI’s ChatGPT и да споделяте съкращения, генерирани от AI - напълно програматично.
Предупреждения
- Aspose.PDF.Plugin е инсталиран чрез NuGet
- OpenAI API достъп и ключ (или Azure OpenAI Service)
- Проекти за .NET 6+
- Интернет достъп за запитвания от ChatGPT
Изтегляне на текст от PDF
Използвайте Aspose.PDF.Plugin’s TextExtractor, за да извлечете текст от PDF съдържание за обработка на AI.
using Aspose.Pdf.Plugins;
string inputPath = @"C:\Docs\sample.pdf";
var extractor = new TextExtractor();
var options = new TextExtractorOptions();
options.AddInput(new FileDataSource(inputPath));
var resultContainer = extractor.Process(options);
string textContent = resultContainer.ResultCollection[0].ToString();
Изпращане на съдържание към ChatGPT
Изпратете извлечен текст на ChatGPT за обобщение. (Използвайте HttpClient, за да се обадите на OpenAI API с вашия API ключ и prompt.)
using System.Net.Http;
using System.Net.Http.Headers;
using System.Text;
using Newtonsoft.Json;
string apiKey = "YOUR_OPENAI_API_KEY";
string prompt = $"Summarize the following PDF content in 5 bullet points:\n{textContent}";
var httpClient = new HttpClient();
httpClient.DefaultRequestHeaders.Authorization = new AuthenticationHeaderValue("Bearer", apiKey);
var requestBody = new
{
model = "gpt-3.5-turbo",
messages = new[]
{
new { role = "system", content = "You are a helpful assistant that summarizes PDF content." },
new { role = "user", content = prompt }
}
};
string jsonBody = JsonConvert.SerializeObject(requestBody);
var response = await httpClient.PostAsync(
"https://api.openai.com/v1/chat/completions",
new StringContent(jsonBody, Encoding.UTF8, "application/json")
);
string responseString = await response.Content.ReadAsStringAsync();
// Parse summary from responseString
3.Парсиране и спестяване на AI сумири
Извлечете резюме от отговор JSON API на ChatGPT и го съхранявайте, както е необходимо (напр. в база данни, файл или обратно в нов PDF).
4. грешка в обработката
- Управлявайте лимитите на скоростта на API, мрежовите грешки и неправилните отговори.
- Валидирайте извлечения текст, преди да го изпратите на AI.
- Регистрирайте всички операции за проследяване.
5 Безопасни бележки
Никога не изпращайте поверителни PDF файлове към услугите за облачно изкуство, освен ако не е потвърдено съответствието.
Често задавани въпроси
**Q: Мога ли да обобща скенираните PDF файлове?**Отговор: Само ако те са били OCR’d или съдържат селективен текст. В противен случай, използвайте плагините на ОCR първо.
**П: Безопасно ли е това за поверителни документи?**Отговор: Изпратете данни на ChatGPT само ако вашите изисквания за поверителност позволяват.