ChatGPT 및 .NET을 사용하여 PDF 콘텐츠 요약을 자동화하는 방법

ChatGPT 및 .NET을 사용하여 PDF 콘텐츠 요약을 자동화하는 방법

AI를 사용하여 PDF 문서의 요약을 자동화하면 .NET 개발자, 지식 노동자 및 자동화를위한 강력한 효율성을 열어줍니다.이 가이드에서는 Aspose.PDF 플러그인을 통해 PDF 파일에서 텍스트를 추출하는 방법을 배우고 OpenAI의 ChatGPT에 콘텐츠를 보내고 AI로 생성 된 간단한 요소를 완전히 프로그래밍 할 수 있습니다.

원칙

  • Aspose.PDF.Plugin NuGet을 통해 설치된
  • OpenAI API 액세스 및 키 (또는 Azure OpenAI 서비스)
  • .NET 6+ 프로젝트
  • ChatGPT 요청에 대한 인터넷 액세스

1) PDF에서 텍스트 추출

Aspose.PDF.Plugin의 TextExtractor를 사용하여 AI 처리를 위해 PDF 콘텐츠에서 텍스트를 추출합니다.

using Aspose.Pdf.Plugins;

string inputPath = @"C:\Docs\sample.pdf";
var extractor = new TextExtractor();
var options = new TextExtractorOptions();
options.AddInput(new FileDataSource(inputPath));
var resultContainer = extractor.Process(options);
string textContent = resultContainer.ResultCollection[0].ToString();

2) ChatGPT에 콘텐츠를 보내기

요약을 위해 ChatGPT에 추출 된 텍스트를 보내십시오. (HttpClient를 사용하여 API 키와 prompt로 OpenAI API를 호출하십시오.)

using System.Net.Http;
using System.Net.Http.Headers;
using System.Text;
using Newtonsoft.Json;

string apiKey = "YOUR_OPENAI_API_KEY";
string prompt = $"Summarize the following PDF content in 5 bullet points:\n{textContent}";

var httpClient = new HttpClient();
httpClient.DefaultRequestHeaders.Authorization = new AuthenticationHeaderValue("Bearer", apiKey);
var requestBody = new
{
    model = "gpt-3.5-turbo",
    messages = new[]
    {
        new { role = "system", content = "You are a helpful assistant that summarizes PDF content." },
        new { role = "user", content = prompt }
    }
};
string jsonBody = JsonConvert.SerializeObject(requestBody);
var response = await httpClient.PostAsync(
    "https://api.openai.com/v1/chat/completions",
    new StringContent(jsonBody, Encoding.UTF8, "application/json")
);
string responseString = await response.Content.ReadAsStringAsync();
// Parse summary from responseString

3) 파싱 & AI 사무실을 절약

ChatGPT의 API JSON 응답에서 요약을 추출하고 필요한대로 저장하십시오 (예를 들어 데이터베이스, 파일 또는 새 PDF로 돌아갑니다).

4) 실수 처리

  • API 속도 제한, 네트워크 오류 및 잘못된 응답을 처리합니다.
  • AI에 보내기 전에 추출 된 텍스트를 확인합니다.
  • 추적 가능성을 위한 모든 작업을 기록합니다.

5) 보안 메모

충족이 확인되지 않는 한 클라우드 AI 서비스에 기밀 PDF를 보내지 마십시오.On-premises AI의 경우 현지 LLM을 배치하는 것을 고려합니다.

자주 묻는 질문들

**Q: 스캔된 PDF를 요약할 수 있습니까?**A: 오직 그들이 OCR 였거나 선택 가능한 텍스트를 포함하는 경우에만.

**Q: 이것은 기밀 문서에 대해 안전합니까?**A: 귀하의 개인 정보 보호 요구 사항이 허용되는 경우에만 ChatGPT에 데이터를 보내십시오.

 한국어