Inicio rápido del SDK de Python
Inicio rápido del SDK de Python
Sección titulada «Inicio rápido del SDK de Python»Instalar el SDK desde PyPI:
pip install nextpdfCrear un cliente configurado para apuntar al punto de conexión de NextPDF Connect:
from nextpdf import NextPDF
client = NextPDF(base_url="http://localhost:8080", api_key="your-key")
with open("document.pdf", "rb") as file: blocks = client.ast.extract_cited_text(file.read())
for block in blocks: page = block.citation.page_index confidence = block.citation.confidence print(f"[page {page}, confidence {confidence:.2f}] {block.text[:100]}")Si el punto de conexión no requiere una clave de API, se puede omitir api_key.
Usar variables de entorno
Sección titulada «Usar variables de entorno»La CLI y los flujos de trabajo de agentes pueden leer la configuración de conexión desde variables de entorno:
export NEXTPDF_BASE_URL=http://localhost:8080export NEXTPDF_API_KEY=your-keyEn Windows PowerShell:
$env:NEXTPDF_BASE_URL = "http://localhost:8080"$env:NEXTPDF_API_KEY = "your-key"Gestionar errores comunes
Sección titulada «Gestionar errores comunes»Capturar las excepciones del SDK y de la API al ejecutar las llamadas de extracción:
from nextpdf import NextPDFfrom nextpdf.models.errors import NextPDFAPIError, NextPDFError, QuotaExceededError
client = NextPDF(base_url="http://localhost:8080", api_key="your-key")
try: with open("document.pdf", "rb") as file: blocks = client.ast.extract_cited_text(file.read())except QuotaExceededError as error: print(f"Rate limit hit: {error}")except NextPDFAPIError as error: print(f"API error {error.status_code}: {error}")except NextPDFError as error: print(f"SDK error: {error}")Para archivos PDF de más de 100 MB, usar la CLI. Así, los resultados pueden transmitirse en streaming sin cargar todos los bloques extraídos en memoria de una sola vez.