วิธีการอัตโนมัติการสรุปเนื้อหา PDF โดยใช้ ChatGPT และ .NET
การอัตโนมัติการสรุปของ คู่มือ PDF dokuments with AI unlock powerful efficiency for .NET developer, knowledge workers, and automation teams. ในคู่มือนี้คุณจะเรียนรู้วิธีการสกัดข้อความจากไฟล์ PDF โดยใช้ Aspose.PDF Plugin สําหรับ .Net, ส่งเนื้อหาไปยัง OpenAI’s ChatGPT, และ parse concise AI-generated summaries—fullly programmatically.
ข้อกําหนด
- Aspose.PDF.Plugin ติดตั้งผ่าน NuGet
- การเข้าถึง API OpenAI และคีย์ (หรือ Azure Open AI Service)
- .โครงการ .NET 6
- การเข้าถึงอินเทอร์เน็ตสําหรับคําขอ ChatGPT
1. การสกัดข้อความจาก PDF
ใช้ Aspose.PDF.Plugin’s TextExtractor เพื่อ استخراجข้อความจากเนื้อหา PDF สําหรับการประมวลผล AI.
using Aspose.Pdf.Plugins;
string inputPath = @"C:\Docs\sample.pdf";
var extractor = new TextExtractor();
var options = new TextExtractorOptions();
options.AddInput(new FileDataSource(inputPath));
var resultContainer = extractor.Process(options);
string textContent = resultContainer.ResultCollection[0].ToString();
2. ส่งเนื้อหาไปยัง ChatGPT
ส่งข้อความที่สกัดไปยัง ChatGPT สําหรับการสรุป (ใช้ HttpClient เพื่อเรียก API OpenAI ด้วยคีย์ API และ prompt.)
using System.Net.Http;
using System.Net.Http.Headers;
using System.Text;
using Newtonsoft.Json;
string apiKey = "YOUR_OPENAI_API_KEY";
string prompt = $"Summarize the following PDF content in 5 bullet points:\n{textContent}";
var httpClient = new HttpClient();
httpClient.DefaultRequestHeaders.Authorization = new AuthenticationHeaderValue("Bearer", apiKey);
var requestBody = new
{
model = "gpt-3.5-turbo",
messages = new[]
{
new { role = "system", content = "You are a helpful assistant that summarizes PDF content." },
new { role = "user", content = prompt }
}
};
string jsonBody = JsonConvert.SerializeObject(requestBody);
var response = await httpClient.PostAsync(
"https://api.openai.com/v1/chat/completions",
new StringContent(jsonBody, Encoding.UTF8, "application/json")
);
string responseString = await response.Content.ReadAsStringAsync();
// Parse summary from responseString
3. Parsing & Saving AI Summaries
extract the summary from ChatGPT’s API JSON response and store it as needed (เช่นในฐานข้อมูล, ไฟล์, หรือกลับไปเป็น PDF ใหม).
4. การจัดการข้อผิดพลาด
- การจัดการข้อ จํากัด อัตรา API, ข้อผิดพลาดเครือข่ายและตอบสนองที่ผิดปกต.
- การยืนยันข้อความที่สกัดก่อนที่จะส่งไปยัง AI.
- บันทึกการดําเนินงานทั้งหมดสําหรับการติดตาม.
5. บันทึกความปลอดภัย
อย่าส่งไฟล์ PDF ที่เชื่อถือได้ไปยังบริการ AI ของคลาวด์เว้นแต่การปฏิบัติตามที่ได้รับการยืนยัน สําหรับ AI on-premises โปรดพิจารณาการวางแผน LLM ในท้องถิ่น.
คําถามที่ถามบ่อย
**Q: ฉันสามารถสรุปไฟล์ PDF ที่สแกนได้หรือไม?**A: เพียงถ้าพวกเขามี OCR หรือมีข้อความที่สามารถเลือกได้ ในทางอื่น ๆ ใช้ปลั๊กอิน O CR ก่อน.
**Q: มันปลอดภัยสําหรับเอกสารที่เชื่อถือได้หรือไม?**A: ส่งข้อมูลไปยัง ChatGPT เท่านั้นหากข้อกําหนดความเป็นส่วนตัวของคุณอนุญาต โปรดพิจารณาการประมวลผลในท้องถิ่นสําหรับเนื้อหาที่ไว.