Python SDK
Bir bakışta
“Bir bakışta” başlıklı bölümPython uygulamanız, asyncio hizmetiniz, yapay zeka aracınız veya terminal iş akışınız kaynak bilgisiyle PDF çıkarma gerektirdiğinde NextPDF Python SDK’sını kullanın. SDK, alıntı bağlantı noktaları içeren yapılandırılmış bloklar döndürür: sayfa dizini, güven değeri, isteğe bağlı sınırlayıcı kutu ve bir anlamsal düğüm tanımlayıcısı. Çıkarılan her değeri kaynak konumuna kadar izleyebilirsiniz.
Paket; betikler ve not defterleri için eşzamanlı bir NextPDF istemcisi, asyncio çalışma zamanları için eşzamansız bir AsyncNextPDF istemcisi, büyük dosyalardan akışlı çıkarma için bir nextpdf komut satırı arabirimi (CLI) ve yapay zeka aracılarının çıkarma araçlarını doğrudan çağırmasına olanak tanıyan isteğe bağlı bir Model Context Protocol (MCP) sunucusu içerir. Dört yolun tamamı, bir NextPDF Connect uç noktası üzerinden aynı soyut sözdizimi ağacı (AST) yüzeyini kullanır.
Python 3.10 veya daha yenisi ve üretim ortamında çıkarma için bir NextPDF Connect uç noktası gerekir. SDK’yı pip install nextpdf ile kurun. Aracı sunucusu için pip install nextpdf[mcp] komutunu kullanın.
Bölüm haritası
“Bölüm haritası” başlıklı bölüm| Sayfa | Kullanım amacı |
|---|---|
| Genel bakış | SDK’nın neler sunduğu, hangi arka ucun seçileceği ve sınırların nerede olduğu. |
| Hızlı başlangıç | SDK’yı kurun ve sayfa düzeyinde kaynak bilgisiyle alıntılanan metni çıkarın. |
| API başvurusu | İstemciler, AST metot zincirleri, Pydantic modelleri, CLI komutları ve özel durumlar. |
| Geliştirici kılavuzu | Mimari sınırlar, çalışma zamanı yaşam döngüsü, eşzamansız toplu işleme ve hata işleme. |
| CLI | Terminalden alıntıya duyarlı çıkarma işlemi çalıştırın ve büyük belgeleri akışla aktarın. |
| MCP sunucusu | Çıkarma araçlarını MCP’yi destekleyen yapay zeka aracılarına sunun. |
Birincil API’ler
“Birincil API’ler” başlıklı bölüm| Sembol | İşlev |
|---|---|
NextPDF | Betikler, toplu işler ve not defterleri için eşzamanlı istemci. |
AsyncNextPDF | asyncio çalışma zamanları için eşzamansız istemci ve eşzamansız bağlam yöneticisi. |
client.ast.get_document_ast() | PDF baytlarından tam anlamsal AST’yi oluşturur. |
client.ast.extract_cited_text() | Metin bloklarını alıntı bağlantı noktalarıyla çıkarır. |
client.ast.extract_cited_tables() | Tabloları hücre düzeyinde alıntı bağlantı noktalarıyla çıkarır. |
client.ast.search_ast_nodes() | Düğümleri türe, sayfaya veya metin sorgusuna göre bulur. |
client.ast.get_ast_diff() | İki PDF sürümünü yapısal olarak karşılaştırır. |
nextpdf | Terminal ve işlem hattı üzerinden çıkarma için komut satırı arabirimi. |
Ayrıca bkz.
“Ayrıca bkz.” başlıklı bölüm- Python SDK genel bakışı — yetenekler, arka uçlar ve sınırlar.
- Python SDK hızlı başlangıcı — ilk çıkarma işleminiz.
- Python API başvurusu — tüm genel semboller.