Hvordan man automatiserer PDF-indholdssummering ved hjælp af ChatGPT og .NET
Automatiseringen af PDF-dokumenter med AI blokerer kraftige effektiviteter for .NET-udviklere, videnarbejdere og automatiseringsteams. I denne guide vil du lære, hvordan man ekstrakter tekst fra PDF filer ved hjælp af Aspose.PDF Plugin til .Net, sender indhold til OpenAI’s ChatGPT, og parse smalle AI-genererede samlinger - fuldt programmeret.
Forudsætninger
- Aspose.PDF.Plugin installeret via NuGet
- OpenAI API adgang og nøgle (eller Azure OpenAI Service)
- Det nye .NET 6+ projekt
- Internetadgang til ChatGPT-forespørgsler
Udvinding af tekst fra PDF
Brug Aspose.PDF.Plugins TextExtractor til at udveksle tekst fra PDF-indhold for AI-bearbejdning.
using Aspose.Pdf.Plugins;
string inputPath = @"C:\Docs\sample.pdf";
var extractor = new TextExtractor();
var options = new TextExtractorOptions();
options.AddInput(new FileDataSource(inputPath));
var resultContainer = extractor.Process(options);
string textContent = resultContainer.ResultCollection[0].ToString();
Sende indhold til ChatGPT
Send udvundet tekst til ChatGPT for sammenfatning. ( Brug HttpClient til at kalde OpenAI API med din API-nøgle og en prompt.)
using System.Net.Http;
using System.Net.Http.Headers;
using System.Text;
using Newtonsoft.Json;
string apiKey = "YOUR_OPENAI_API_KEY";
string prompt = $"Summarize the following PDF content in 5 bullet points:\n{textContent}";
var httpClient = new HttpClient();
httpClient.DefaultRequestHeaders.Authorization = new AuthenticationHeaderValue("Bearer", apiKey);
var requestBody = new
{
model = "gpt-3.5-turbo",
messages = new[]
{
new { role = "system", content = "You are a helpful assistant that summarizes PDF content." },
new { role = "user", content = prompt }
}
};
string jsonBody = JsonConvert.SerializeObject(requestBody);
var response = await httpClient.PostAsync(
"https://api.openai.com/v1/chat/completions",
new StringContent(jsonBody, Encoding.UTF8, "application/json")
);
string responseString = await response.Content.ReadAsStringAsync();
// Parse summary from responseString
Sparer og sparer AI summaries
Ekstrakter sammendraget fra ChatGPT’s API JSON respons og gemmer det som det er nødvendigt (f.eks. i en database, fil eller tilbage til en ny PDF).
4. fejlbehandling
- Behandle API-hastighedsgrænser, netværksfejl og malformede svar.
- Validerer udvundet tekst, før det sendes til AI.
- Registrer alle operationer for sporbarhed.
5 - Sikkerhedsmæssige noter
Send aldrig fortrolige PDF’er til cloud AI-tjenester, medmindre overensstemmelse er bekræftet. for on-premises AI, overveje at implementere en lokal LLM.
Ofte stillede spørgsmål
**Q: Kan jeg sammenfatte scannede PDF’er?**A: Kun hvis de har været OCR’d eller indeholder valgfri tekst. ellers skal du først bruge oCR-plugins.
**Q: Er det sikkert for fortrolige dokumenter?**A: Send kun data til ChatGPT, hvis dine privatlivskrav tillader. overveje lokal behandling for følsomt indhold.