Snelstart voor de Python-SDK
Snelstart voor de Python-SDK
Sectie met titel “Snelstart voor de Python-SDK”Installeer de software development kit (SDK) via de Python Package Index (PyPI):
pip install nextpdfMaak een client aan voor uw NextPDF Connect-endpoint:
from nextpdf import NextPDF
client = NextPDF(base_url="http://localhost:8080", api_key="your-key")
with open("document.pdf", "rb") as file: blocks = client.ast.extract_cited_text(file.read())
for block in blocks: page = block.citation.page_index confidence = block.citation.confidence print(f"[page {page}, confidence {confidence:.2f}] {block.text[:100]}")Als uw endpoint geen application programming interface (API)-sleutel vereist, kunt u api_key weglaten.
Omgevingsvariabelen gebruiken
Sectie met titel “Omgevingsvariabelen gebruiken”De command-line interface (CLI) en agent-workflows kunnen verbindingsinstellingen lezen uit omgevingsvariabelen:
export NEXTPDF_BASE_URL=http://localhost:8080export NEXTPDF_API_KEY=your-keyIn Windows PowerShell:
$env:NEXTPDF_BASE_URL = "http://localhost:8080"$env:NEXTPDF_API_KEY = "your-key"Veelvoorkomende fouten afhandelen
Sectie met titel “Veelvoorkomende fouten afhandelen”Vang SDK- en API-uitzonderingen op wanneer u extractiemethoden aanroept:
from nextpdf import NextPDFfrom nextpdf.models.errors import NextPDFAPIError, NextPDFError, QuotaExceededError
client = NextPDF(base_url="http://localhost:8080", api_key="your-key")
try: with open("document.pdf", "rb") as file: blocks = client.ast.extract_cited_text(file.read())except QuotaExceededError as error: print(f"Rate limit hit: {error}")except NextPDFAPIError as error: print(f"API error {error.status_code}: {error}")except NextPDFError as error: print(f"SDK error: {error}")Gebruik de CLI voor Portable Document Format (PDF)-bestanden groter dan 100 MB. Daarmee kunnen resultaten als stream worden doorgegeven, zonder dat elk geëxtraheerd blok tegelijk in het geheugen wordt geladen.