ข้ามไปยังเนื้อหา

เริ่มต้นใช้งาน Python SDK แบบรวดเร็ว

ติดตั้ง software development kit (SDK) จาก Python Package Index (PyPI):

Terminal window
pip install nextpdf

สร้าง client สำหรับ endpoint ของ NextPDF Connect:

from nextpdf import NextPDF
client = NextPDF(base_url="http://localhost:8080", api_key="your-key")
with open("document.pdf", "rb") as file:
blocks = client.ast.extract_cited_text(file.read())
for block in blocks:
page = block.citation.page_index
confidence = block.citation.confidence
print(f"[page {page}, confidence {confidence:.2f}] {block.text[:100]}")

หาก endpoint ไม่ต้องใช้ application programming interface (API) key ให้เว้น api_key ไว้

command-line interface (CLI) และเวิร์กโฟลว์ของเอเจนต์อ่านการตั้งค่าการเชื่อมต่อจากตัวแปรสภาพแวดล้อมได้:

Terminal window
export NEXTPDF_BASE_URL=http://localhost:8080
export NEXTPDF_API_KEY=your-key

สำหรับ Windows PowerShell:

Terminal window
$env:NEXTPDF_BASE_URL = "http://localhost:8080"
$env:NEXTPDF_API_KEY = "your-key"

ดักจับ exception จาก SDK และ API เมื่อเรียกใช้เมธอดสำหรับแยกข้อมูล:

from nextpdf import NextPDF
from nextpdf.models.errors import NextPDFAPIError, NextPDFError, QuotaExceededError
client = NextPDF(base_url="http://localhost:8080", api_key="your-key")
try:
with open("document.pdf", "rb") as file:
blocks = client.ast.extract_cited_text(file.read())
except QuotaExceededError as error:
print(f"Rate limit hit: {error}")
except NextPDFAPIError as error:
print(f"API error {error.status_code}: {error}")
except NextPDFError as error:
print(f"SDK error: {error}")

สำหรับไฟล์ Portable Document Format (PDF) ที่มีขนาดเกิน 100 MB ให้ใช้ CLI วิธีนี้ช่วยให้สตรีมผลลัพธ์ได้โดยไม่ต้องโหลดบล็อกที่แยกได้ทุกบล็อกเข้าสู่หน่วยความจำพร้อมกัน