كيفية تلقائي جمع المحتوى PDF باستخدام ChatGPT و .NET

كيفية تلقائي جمع المحتوى PDF باستخدام ChatGPT و .NET

أوتوماتيكية ملخص مستندات PDF مع الذكاء الاصطناعي يفتح كفاءة قوية للمطورين .NET، والموظفين المعرفة، وفريق الأتمتة.في هذا الدليل، سوف تتعلم كيفية استخراج النص من ملفات PDF باستخدام Aspose.PDF Plugin for .Net، وإرسال المحتوى إلى OpenAI ChatGPT، وتقسيم المجموعات القصيرة التي تم إنشاؤها من ذكي – بشكل برمجي تماما.

المتطلبات

  • Aspose.PDF.Plugin تم تثبيته عبر NuGet
  • OpenAI API الوصول والمفتاح (أو خدمة Azure OpenAI)
  • مشروع .NET 6+
  • الوصول إلى الإنترنت لطلبات ChatGPT

1- استخراج النص من PDF

استخدم Aspose.PDF.Plugin TextExtractor لاستخراج النص من محتوى PDF لمعالجة الذكاء الاصطناعي.

using Aspose.Pdf.Plugins;

string inputPath = @"C:\Docs\sample.pdf";
var extractor = new TextExtractor();
var options = new TextExtractorOptions();
options.AddInput(new FileDataSource(inputPath));
var resultContainer = extractor.Process(options);
string textContent = resultContainer.ResultCollection[0].ToString();

إرسال المحتوى إلى ChatGPT

إرسال النص المستخرج إلى ChatGPT للحصول على ملخص. (استخدم HttpClient للاتصال بـ OpenAI API مع مفتاح API الخاص بك ومفاتيح)

using System.Net.Http;
using System.Net.Http.Headers;
using System.Text;
using Newtonsoft.Json;

string apiKey = "YOUR_OPENAI_API_KEY";
string prompt = $"Summarize the following PDF content in 5 bullet points:\n{textContent}";

var httpClient = new HttpClient();
httpClient.DefaultRequestHeaders.Authorization = new AuthenticationHeaderValue("Bearer", apiKey);
var requestBody = new
{
    model = "gpt-3.5-turbo",
    messages = new[]
    {
        new { role = "system", content = "You are a helpful assistant that summarizes PDF content." },
        new { role = "user", content = prompt }
    }
};
string jsonBody = JsonConvert.SerializeObject(requestBody);
var response = await httpClient.PostAsync(
    "https://api.openai.com/v1/chat/completions",
    new StringContent(jsonBody, Encoding.UTF8, "application/json")
);
string responseString = await response.Content.ReadAsStringAsync();
// Parse summary from responseString

3- توزيع وتوفير الفائدة

استخراج ملخص من استجابة API JSON لـ ChatGPT وتخزينه حسب الحاجة (على سبيل المثال، في قاعدة بيانات أو ملف أو العودة إلى PDF الجديد).

4-الخطأ في التعامل

  • التعامل مع حدود معدل API ، أخطاء الشبكة ، والإجابات الخاطئة.
  • تأكيد النص المستخرج قبل إرساله إلى AI.
  • تسجيل جميع العمليات للتتبع.

5- ملاحظات الأمن

لا ترسل أبدًا ملفات PDF سرية إلى خدمات الذكاء الاصطناعي في السحابة ما لم يتم تأكيد الامتثال.

الأسئلة المتكررة

** س: هل يمكنني تلخيص ملفات PDF المسح الضوئي؟**A: فقط إذا كانت OCR’d أو تحتوي على نص قابل للاختيار.

** س: هل هذا آمن للوثائق السرية؟**A: إرسال البيانات إلى ChatGPT فقط إذا سمحت متطلبات الخصوصية الخاصة بك.

 عربي