Python SDK 快速上手
Python SDK 快速上手
標題為「Python SDK 快速上手」的區段從 PyPI 安裝 SDK:
pip install nextpdf建立用來連線至你的 NextPDF Connect endpoint 的用戶端:
from nextpdf import NextPDF
client = NextPDF(base_url="http://localhost:8080", api_key="your-key")
with open("document.pdf", "rb") as file: blocks = client.ast.extract_cited_text(file.read())
for block in blocks: page = block.citation.page_index confidence = block.citation.confidence print(f"[page {page}, confidence {confidence:.2f}] {block.text[:100]}")若你的 endpoint 不需要 API key,可以省略 api_key。
使用環境變數
標題為「使用環境變數」的區段CLI 與 AI Agent(代理)工作流程可以透過環境變數讀取連線設定:
export NEXTPDF_BASE_URL=http://localhost:8080export NEXTPDF_API_KEY=your-key在 Windows PowerShell 中:
$env:NEXTPDF_BASE_URL = "http://localhost:8080"$env:NEXTPDF_API_KEY = "your-key"處理常見錯誤
標題為「處理常見錯誤」的區段請在擷取呼叫外層攔截 SDK 與 API 例外:
from nextpdf import NextPDFfrom nextpdf.models.errors import NextPDFAPIError, NextPDFError, QuotaExceededError
client = NextPDF(base_url="http://localhost:8080", api_key="your-key")
try: with open("document.pdf", "rb") as file: blocks = client.ast.extract_cited_text(file.read())except QuotaExceededError as error: print(f"Rate limit hit: {error}")except NextPDFAPIError as error: print(f"API error {error.status_code}: {error}")except NextPDFError as error: print(f"SDK error: {error}")處理超過 100 MB 的 PDF 時,請改用 CLI。這樣結果就能以串流方式輸出,不必一次將所有擷取出的區塊載入記憶體。