Kaip automatizuoti PDF turinio apibendrinimą naudojant ChatGPT ir .NET
Automatizuojant PDF dokumentų apibendrinimą su AI atveria galingą efektyvumą .NET kūrėjams, žinių darbuotojams ir automatizavimo komandoms. Šiame vadove sužinosite, kaip iš PDF failų ištraukti tekstą naudojant Aspose.PDF Plugin .Net, siųsti turinį OpenAI „ChatGPT“ ir parašyti smulkius AI generuotus santraukas – visiškai programuojamai.
Prerequisites
- Aspose.PDF.Plugin įdiegta per NuGet
- OpenAI API prieiga ir raktas (arba Azure OpenAI paslauga)
- .NET 6+ projektas
- Interneto prieiga ChatGPT prašymams
1.Teksto išleidimas iš PDF
Naudokite Aspose.PDF.Plugin TextExtractor tekstą iš PDF turinio AI apdorojimui.
using Aspose.Pdf.Plugins;
string inputPath = @"C:\Docs\sample.pdf";
var extractor = new TextExtractor();
var options = new TextExtractorOptions();
options.AddInput(new FileDataSource(inputPath));
var resultContainer = extractor.Process(options);
string textContent = resultContainer.ResultCollection[0].ToString();
2. siųsti turinį ChatGPT
Išsiųskite išvestą tekstą ChatGPT, kad gautumėte apibendrinimą. (Naudokite HttpClient skambinti „OpenAI API“ su API rakteliu ir prompt.)
using System.Net.Http;
using System.Net.Http.Headers;
using System.Text;
using Newtonsoft.Json;
string apiKey = "YOUR_OPENAI_API_KEY";
string prompt = $"Summarize the following PDF content in 5 bullet points:\n{textContent}";
var httpClient = new HttpClient();
httpClient.DefaultRequestHeaders.Authorization = new AuthenticationHeaderValue("Bearer", apiKey);
var requestBody = new
{
model = "gpt-3.5-turbo",
messages = new[]
{
new { role = "system", content = "You are a helpful assistant that summarizes PDF content." },
new { role = "user", content = prompt }
}
};
string jsonBody = JsonConvert.SerializeObject(requestBody);
var response = await httpClient.PostAsync(
"https://api.openai.com/v1/chat/completions",
new StringContent(jsonBody, Encoding.UTF8, "application/json")
);
string responseString = await response.Content.ReadAsStringAsync();
// Parse summary from responseString
Parsisiųsti ir sutaupyti AI sumarų
Iš „ChatGPT“ API JSON atsakymo ištraukite apibendrinimą ir saugokite jį, kaip reikia (pvz., duomenų bazėje, faile arba grįžkite į naują PDF).
4. klaidų tvarkymas
- Apdoroti API greičio ribas, tinklo klaidas ir klaidingus atsakymus.
- Įvertinkite ištrauktą tekstą prieš siunčiant į AI.
- Įrašykite visas operacijas, kad būtų galima sekti.
5 Saugumo pažymėjimas
Niekada nesiųskite konfidencialių PDF į debesų AI paslaugas, nebent atitiktis yra patvirtinta.
Dažnai užduodami klausimai
**Q: Ar galiu apibendrinti skanytus PDF failus?**A: Tik jei jie buvo OCR’d arba turi pasirinktą tekstą. kitaip pirmiausia naudokite „OCR“ priedus.
**Q: Ar tai saugus konfidencialiems dokumentams?**A: Duomenys siunčiami tik ChatGPT, jei jūsų privatumo reikalavimai leidžia. apsvarstykite vietos apdorojimą jautriam turiniui.