İçeriğe geç

Python SDK

Python uygulamanız, asyncio hizmetiniz, yapay zeka aracınız veya terminal iş akışınız kaynak bilgisiyle PDF çıkarma gerektirdiğinde NextPDF Python SDK’sını kullanın. SDK, alıntı bağlantı noktaları içeren yapılandırılmış bloklar döndürür: sayfa dizini, güven değeri, isteğe bağlı sınırlayıcı kutu ve bir anlamsal düğüm tanımlayıcısı. Çıkarılan her değeri kaynak konumuna kadar izleyebilirsiniz.

Paket; betikler ve not defterleri için eşzamanlı bir NextPDF istemcisi, asyncio çalışma zamanları için eşzamansız bir AsyncNextPDF istemcisi, büyük dosyalardan akışlı çıkarma için bir nextpdf komut satırı arabirimi (CLI) ve yapay zeka aracılarının çıkarma araçlarını doğrudan çağırmasına olanak tanıyan isteğe bağlı bir Model Context Protocol (MCP) sunucusu içerir. Dört yolun tamamı, bir NextPDF Connect uç noktası üzerinden aynı soyut sözdizimi ağacı (AST) yüzeyini kullanır.

Python 3.10 veya daha yenisi ve üretim ortamında çıkarma için bir NextPDF Connect uç noktası gerekir. SDK’yı pip install nextpdf ile kurun. Aracı sunucusu için pip install nextpdf[mcp] komutunu kullanın.

SayfaKullanım amacı
Genel bakışSDK’nın neler sunduğu, hangi arka ucun seçileceği ve sınırların nerede olduğu.
Hızlı başlangıçSDK’yı kurun ve sayfa düzeyinde kaynak bilgisiyle alıntılanan metni çıkarın.
API başvurusuİstemciler, AST metot zincirleri, Pydantic modelleri, CLI komutları ve özel durumlar.
Geliştirici kılavuzuMimari sınırlar, çalışma zamanı yaşam döngüsü, eşzamansız toplu işleme ve hata işleme.
CLITerminalden alıntıya duyarlı çıkarma işlemi çalıştırın ve büyük belgeleri akışla aktarın.
MCP sunucusuÇıkarma araçlarını MCP’yi destekleyen yapay zeka aracılarına sunun.
Sembolİşlev
NextPDFBetikler, toplu işler ve not defterleri için eşzamanlı istemci.
AsyncNextPDFasyncio çalışma zamanları için eşzamansız istemci ve eşzamansız bağlam yöneticisi.
client.ast.get_document_ast()PDF baytlarından tam anlamsal AST’yi oluşturur.
client.ast.extract_cited_text()Metin bloklarını alıntı bağlantı noktalarıyla çıkarır.
client.ast.extract_cited_tables()Tabloları hücre düzeyinde alıntı bağlantı noktalarıyla çıkarır.
client.ast.search_ast_nodes()Düğümleri türe, sayfaya veya metin sorgusuna göre bulur.
client.ast.get_ast_diff()İki PDF sürümünü yapısal olarak karşılaştırır.
nextpdfTerminal ve işlem hattı üzerinden çıkarma için komut satırı arabirimi.