چگونه به اتوماسیون جمع آوری محتوای PDF با استفاده از ChatGPT و .NET
اتوماسیون جمع آوری اسناد PDF با هوش مصنوعی بهره وری قدرتمند را برای توسعه دهندگان .NET، کارکنان دانش و تیم های اتوماتیک باز می کند.در این راهنمای، شما یاد خواهید گرفت که چگونه متن را از فایل های pdf با استفاده از پلاگین Aspose.PDF برای .Net استخراج کنید، محتوا را به ChatGPT OpenAI ارسال کنید و خلاصه های مختصر تولید شده توسط AI را - به طور کامل برنامه ریزی کنید.
پیش شرط
- Aspose.PDF.Plugin نصب شده از طریق NuGet
- OpenAI API دسترسی و کلید (یا سرویس Azure OpenAI)
- پروژه .NET 6+
- دسترسی به اینترنت برای درخواست های ChatGPT
1- استخراج متن از PDF
از Aspose.PDF.Plugin TextExtractor برای استخراج متن از محتوای PDF برای پردازش هوش مصنوعی استفاده کنید.
using Aspose.Pdf.Plugins;
string inputPath = @"C:\Docs\sample.pdf";
var extractor = new TextExtractor();
var options = new TextExtractorOptions();
options.AddInput(new FileDataSource(inputPath));
var resultContainer = extractor.Process(options);
string textContent = resultContainer.ResultCollection[0].ToString();
2- ارسال محتوا به ChatGPT
ارسال متن استخراج شده به ChatGPT برای خلاصه سازی. (استفاده از HttpClient برای تماس با OpenAI API با کلید API و یک prompt.)
using System.Net.Http;
using System.Net.Http.Headers;
using System.Text;
using Newtonsoft.Json;
string apiKey = "YOUR_OPENAI_API_KEY";
string prompt = $"Summarize the following PDF content in 5 bullet points:\n{textContent}";
var httpClient = new HttpClient();
httpClient.DefaultRequestHeaders.Authorization = new AuthenticationHeaderValue("Bearer", apiKey);
var requestBody = new
{
model = "gpt-3.5-turbo",
messages = new[]
{
new { role = "system", content = "You are a helpful assistant that summarizes PDF content." },
new { role = "user", content = prompt }
}
};
string jsonBody = JsonConvert.SerializeObject(requestBody);
var response = await httpClient.PostAsync(
"https://api.openai.com/v1/chat/completions",
new StringContent(jsonBody, Encoding.UTF8, "application/json")
);
string responseString = await response.Content.ReadAsStringAsync();
// Parse summary from responseString
۳- صرفه جویی و ذخیره سازی جمع آوری ها
خلاصه را از پاسخ JSON API ChatGPT استخراج کنید و آن را در صورت لزوم ذخیره کنید (به عنوان مثال، در یک پایگاه داده، فایل یا بازگشت به یک PDF جدید).
۴- رفتار اشتباه
- محدودیت های نرخ API، خطاهای شبکه و پاسخ های نادرست را مدیریت کنید.
- متن استخراج شده را قبل از ارسال به AI تأیید کنید.
- تمام عملیات را برای ردیابی ثبت کنید.
۵- یادداشت های امنیتی
هرگز PDF های محرمانه را به سرویس های هوش مصنوعی ابر ارسال نکنید مگر اینکه انطباق تایید شود.
پرسش های مکرر
**Q: آیا می توانم فایل های اسکن شده را خلاصه کنم؟**A: فقط اگر آنها OCR بوده اند یا حاوی متن انتخابی هستند.در غیر این صورت، اول از همه از پلاگین های O CR استفاده کنید.
** Q: آیا این برای اسناد محرمانه امن است؟**A: فقط داده ها را به ChatGPT ارسال کنید اگر نیازهای حریم خصوصی شما اجازه می دهد.