Како аутоматизовати сакупљање ПДФ садржаја користећи ЦхатГПТ и .НЕТ
Аутоматизација сакупљања ПДФ докумената са ИИ-ом откључује моћне ефикасности за .НЕТ програмери, стручњаке знања и тимове за аутоматизацију.У овом водичу ћете научити како да извучете текст из ПДВ датотека користећи Плугин Асписе.ПдФД за НЕТ, пошаљите садржај на ЦхатГПТ ОпенАи-а, и парсе кратке скупљености генерисане АИ - потпуно програмски.
Принципи
- Aspose.PDF.Plugin инсталиран преко NuGet
- OpenAI API pristup i ključ (ili Azure OpenAI usluga)
- Пројекат .NET 6+
- Приступ Интернету за захтеве ЦхатГПТ
1. извлачење текста из ПДФ-а
Користите Aspose.PDF.Plugin TextExtractor да бисте извукли текст из ПДФ садржаја за ИИ обраду.
using Aspose.Pdf.Plugins;
string inputPath = @"C:\Docs\sample.pdf";
var extractor = new TextExtractor();
var options = new TextExtractorOptions();
options.AddInput(new FileDataSource(inputPath));
var resultContainer = extractor.Process(options);
string textContent = resultContainer.ResultCollection[0].ToString();
Пошаљите садржај на ЦхатГПТ
Pošaljite izveden tekst ChatGPT za sažetak. (koristite HttpClient da pozovete OpenAI API sa vašim API ključem i promptom.)
using System.Net.Http;
using System.Net.Http.Headers;
using System.Text;
using Newtonsoft.Json;
string apiKey = "YOUR_OPENAI_API_KEY";
string prompt = $"Summarize the following PDF content in 5 bullet points:\n{textContent}";
var httpClient = new HttpClient();
httpClient.DefaultRequestHeaders.Authorization = new AuthenticationHeaderValue("Bearer", apiKey);
var requestBody = new
{
model = "gpt-3.5-turbo",
messages = new[]
{
new { role = "system", content = "You are a helpful assistant that summarizes PDF content." },
new { role = "user", content = prompt }
}
};
string jsonBody = JsonConvert.SerializeObject(requestBody);
var response = await httpClient.PostAsync(
"https://api.openai.com/v1/chat/completions",
new StringContent(jsonBody, Encoding.UTF8, "application/json")
);
string responseString = await response.Content.ReadAsStringAsync();
// Parse summary from responseString
Парсинг и спасавање АИ сумира
Екстрактирајте резюме из АПИ ЈСОН одговора ЦхатГПТ-а и чувајте га како је потребно (на пример, у бази података, датотеку или вратите се у нови ПДФ).
4. поступак грешака
- Управљање ограничењима брзине АПИ-а, мрежним грешкама и погрешним одговорима.
- Валидирајте извучен текст пре него што га пошаљете АИ.
- Региструјте све операције за праћеност.
5. bezbednosne beleške
Никада не пошаљите тајне ПДФ-а у облачне АИ услуге, осим ако се потврди усклађеност.
Često postavljana pitanja
**Q: Da li mogu da sažetim skenirane PDF-ove?**А: Само ако су ОЦР’д или садрже изабрани текст.
**Q: Da li je ovo bezbedno za poverljive dokumente?**А: Пошаљите податке ЦхатГПТ-у само ако ваше захтеве приватности дозвољавају. размотрите локалну обраду за осетљив садржај.