Hogyan lehet automatizálni a PDF tartalom összefoglalását a ChatGPT és a .NET használatával
A PDF dokumentumok összegyűjtésének automatizálása AI-vel hatékony hatékonyságot nyit a .NET fejlesztők, a tudásmunkások és az automációs csapatok számára.Ebben az útmutatóban megtudhatja, hogyan lehet szövegeket kivonni a PDF-fájlokból az Aspose.PDF Plugin használatával, tartalmakat küldeni az OpenAI ChatGPT-jéhez, és röviden összefoglalókat készíteni - teljesen programozva.
előfeltételek
- Aspose.PDF.Plugin telepítve a NuGet segítségével
- OpenAI API hozzáférés és kulcs (vagy Azure OpenAI Szolgáltatás)
- .NET 6+ programok
- Internet-hozzáférés a ChatGPT kérésekhez
1. A szöveg PDF-ből történő kivonása
Használja az Aspose.PDF.Plugin TextExtractor-t a szöveg PDF tartalmából történő kivonására AI feldolgozáshoz.
using Aspose.Pdf.Plugins;
string inputPath = @"C:\Docs\sample.pdf";
var extractor = new TextExtractor();
var options = new TextExtractorOptions();
options.AddInput(new FileDataSource(inputPath));
var resultContainer = extractor.Process(options);
string textContent = resultContainer.ResultCollection[0].ToString();
2. Tartalom küldése a ChatGPT-nek
Küldje el a kivonott szöveget a ChatGPT-nek az összefoglaláshoz. (HttpClient használata az OpenAI API-t az API kulcsával és egy prompt segítségével.)
using System.Net.Http;
using System.Net.Http.Headers;
using System.Text;
using Newtonsoft.Json;
string apiKey = "YOUR_OPENAI_API_KEY";
string prompt = $"Summarize the following PDF content in 5 bullet points:\n{textContent}";
var httpClient = new HttpClient();
httpClient.DefaultRequestHeaders.Authorization = new AuthenticationHeaderValue("Bearer", apiKey);
var requestBody = new
{
model = "gpt-3.5-turbo",
messages = new[]
{
new { role = "system", content = "You are a helpful assistant that summarizes PDF content." },
new { role = "user", content = prompt }
}
};
string jsonBody = JsonConvert.SerializeObject(requestBody);
var response = await httpClient.PostAsync(
"https://api.openai.com/v1/chat/completions",
new StringContent(jsonBody, Encoding.UTF8, "application/json")
);
string responseString = await response.Content.ReadAsStringAsync();
// Parse summary from responseString
3. Parsing & Saving AI szumáriumok
Távolítsa el az összefoglalót a ChatGPT API JSON válaszából, és tárolja a szükséges módon (például egy adatbázisban, fájlban vagy új PDF-be).
4. Hibaelhárítás
- Az API sebességkorlátozása, a hálózati hibák és a rosszindulatú válaszok kezelése.
- Validálja a kivont szöveget, mielőtt elküldi az AI-nek.
- Az összes műveletet a nyomkövethetőség érdekében rögzítjük.
5. Biztonsági jegyzet
Soha ne küldje el a bizalmas PDF-eket a felhő AI szolgáltatásokhoz, hacsak a megfelelés meg nem erősíthető.
Gyakran feltett kérdések
**Q: Összefoglalhatom a szkennelt PDF-eket?**A: Csak akkor, ha az OCR volt, vagy kiválasztható szöveget tartalmaz.
**Q: Ez biztonságos a bizalmas dokumentumok esetében?**A: Csak akkor küldje el az adatokat a ChatGPT-nek, ha a magánélet követelményei engedélyezik.