Kā automatizēt PDF satura kopsavilkumu, izmantojot ChatGPT un .NET
Automatizējot PDF dokumentu kopsavilkumu ar AI atver spēcīgas efektivitātes .NET izstrādātājiem, zināšanu darbiniekiem un automatizācijas komandām. šajā vadlīnijā jūs uzzināsiet, kā izrakstīt tekstu no PDF failiem, izmantojot Aspose.PDF Plugin.NET, nosūtot saturu OpenAI’s ChatGPT, un sīki izstrādātus AI ģenerētos apkopojumus - pilnīgi programmatiski.
Prerequisites
- Aspose.PDF.Plugin instalēts caur NuGet
- OpenAI API piekļuve un atslēga (vai Azure OpenAI pakalpojums)
- .NET 6+ projekts
- Interneta piekļuve ChatGPT pieprasījumiem
1. izņemt tekstu no PDF
Izmantojiet Aspose.PDF.Plugin TextExtractor, lai iegūtu tekstu no PDF satura AI apstrādei.
using Aspose.Pdf.Plugins;
string inputPath = @"C:\Docs\sample.pdf";
var extractor = new TextExtractor();
var options = new TextExtractorOptions();
options.AddInput(new FileDataSource(inputPath));
var resultContainer = extractor.Process(options);
string textContent = resultContainer.ResultCollection[0].ToString();
Sūtīt saturu ChatGPT
Sūtīt izņemto tekstu ChatGPT, lai apkopotu. (izmantojiet HttpClient sazvērest OpenAI API ar savu API atslēgu un prompt.)
using System.Net.Http;
using System.Net.Http.Headers;
using System.Text;
using Newtonsoft.Json;
string apiKey = "YOUR_OPENAI_API_KEY";
string prompt = $"Summarize the following PDF content in 5 bullet points:\n{textContent}";
var httpClient = new HttpClient();
httpClient.DefaultRequestHeaders.Authorization = new AuthenticationHeaderValue("Bearer", apiKey);
var requestBody = new
{
model = "gpt-3.5-turbo",
messages = new[]
{
new { role = "system", content = "You are a helpful assistant that summarizes PDF content." },
new { role = "user", content = prompt }
}
};
string jsonBody = JsonConvert.SerializeObject(requestBody);
var response = await httpClient.PostAsync(
"https://api.openai.com/v1/chat/completions",
new StringContent(jsonBody, Encoding.UTF8, "application/json")
);
string responseString = await response.Content.ReadAsStringAsync();
// Parse summary from responseString
Parsēšana un ietaupīšana AI sumari
Izvadīt kopsavilkumu no ChatGPT API JSON atbildes un uzglabāt to, kā nepieciešams (piemēram, datu bāzē, failā vai atpakaļ jaunā PDF).
4. kļūdu apstrāde
- Pārvaldīt API ātruma ierobežojumus, tīkla kļūdas un nepareizas atbildes.
- Validējiet iegūto tekstu pirms nosūtīšanas AI.
- Reģistrējiet visas darbības, lai nodrošinātu izsekojamību.
5. drošības piezīme
Nekad nesūtīt konfidenciālus PDF uz mākoņa AI pakalpojumiem, ja vien atbilstība nav apstiprināta.
Bieži uzdotie jautājumi
**Q: Vai es varu apkopot skenētos PDF dokumentus?**A: Tikai tad, ja tie ir OCR’d vai satur izvēlētu tekstu. pretējā gadījumā vispirms izmantojiet O CR plugins.
**Q: Vai tas ir drošs konfidenciālajiem dokumentiem?**A: Sūtīt datus ChatGPT tikai tad, ja jūsu konfidencialitātes prasības atļauj.