Python SDK 빠른 시작
Python SDK 빠른 시작
섹션 제목: “Python SDK 빠른 시작”PyPI에서 SDK를 설치합니다.
pip install nextpdfNextPDF Connect 엔드포인트를 대상으로 하는 클라이언트를 생성합니다.
from nextpdf import NextPDF
client = NextPDF(base_url="http://localhost:8080", api_key="your-key")
with open("document.pdf", "rb") as file: blocks = client.ast.extract_cited_text(file.read())
for block in blocks: page = block.citation.page_index confidence = block.citation.confidence print(f"[page {page}, confidence {confidence:.2f}] {block.text[:100]}")엔드포인트에서 API 키를 요구하지 않는 경우 api_key를 생략합니다.
환경 변수 사용
섹션 제목: “환경 변수 사용”CLI 및 에이전트 워크플로는 환경 변수에서 연결 설정을 읽을 수 있습니다:
export NEXTPDF_BASE_URL=http://localhost:8080export NEXTPDF_API_KEY=your-keyWindows PowerShell에서는:
$env:NEXTPDF_BASE_URL = "http://localhost:8080"$env:NEXTPDF_API_KEY = "your-key"일반적인 오류 처리
섹션 제목: “일반적인 오류 처리”추출 호출부에서 SDK 및 API 예외를 처리합니다:
from nextpdf import NextPDFfrom nextpdf.models.errors import NextPDFAPIError, NextPDFError, QuotaExceededError
client = NextPDF(base_url="http://localhost:8080", api_key="your-key")
try: with open("document.pdf", "rb") as file: blocks = client.ast.extract_cited_text(file.read())except QuotaExceededError as error: print(f"Rate limit hit: {error}")except NextPDFAPIError as error: print(f"API error {error.status_code}: {error}")except NextPDFError as error: print(f"SDK error: {error}")100 MB가 넘는 PDF의 경우 CLI를 사용합니다. 이렇게 하면 추출된 모든 블록을 한 번에 메모리에 로드하지 않고도 결과를 스트리밍할 수 있습니다.