Ga naar inhoud

Zelfstudie voor getagde PDF via Connect

Conformiteitsgrens (lees dit eerst). NextPDF levert de getagde structuur, alternatieve tekst en metadata die PDF/UA-2 verwacht. Daardoor is de uitvoer bedoeld om te voldoen aan PDF/UA-2 (ISO 14289-2). Daarmee is het document op zichzelf niet “conform”. Een onafhankelijke controletool, veraPDF in de strikte PDF/UA-2-modus, bepaalt de conformiteit. Lees elke vermelding van “PASS”, “conform” of “compliant” hieronder als “het document is bedoeld om te voldoen; veraPDF bepaalt de uitkomst”.

In deze zelfstudie maakt u met de Connect-transports een getagd Portable Document Format-bestand (PDF). U schakelt de getagde modus in, stelt een titel in, voegt semantische HTML toe en verifieert het resultaat met de standards-check-tool en veraPDF. De getagde-modus- en contenttools die hier worden gebruikt, horen bij core. De standards-check-verificatietool valt onder het Pro/Enterprise-niveau. Hij registreert zich via class_exists() uitsluitend wanneer nextpdf/premium naast de server is geïnstalleerd.

Terminal window
composer require nextpdf/server

Een logische structuur in combinatie met een specificatie van de natuurlijke taal maakt content navigeerbaar in leesvolgorde (ISO 32000-2 §14.7). De vermelding /Alt bevat een alternatieve beschrijving voor niet-tekstuele content (ISO 32000-2 §14.8). Content moet worden weerspiegeld in de structuurboom en een controletool bepaalt de conformiteit (PDF/UA-2 §8.2.4). Wanneer u goed gestructureerde semantische HTML schrijft, produceert de pijplijn de juiste structuur voor u. Deze zelfstudie bouwt voort op die werkwijze, in plaats van u te vragen de structuur handmatig op te bouwen.

Toolnamen worden geverifieerd aan de hand van het actieve register via tools/list. De gezaghebbende catalogus staat op /connect/tool-catalog/. Deze zelfstudie herhaalt het aantal tools niet.

Dit is de kortste route. Schakel de getagde modus in met een taal, stel een titel in en voeg daarna content toe.

{
"jsonrpc": "2.0",
"id": 3,
"method": "tools/call",
"params": {
"name": "enable_tagged_pdf",
"arguments": { "document_id": "<id>", "language": "en" }
}
}

Schakel de getagde modus in vóór uw eerste contentaanroep. De writer bevriest de modus zodra hij de eerste pagina levert. Als u hem later inschakelt, gaat NextPDF niet terug om content te taggen die al is geleverd. Een documenttitel is verplicht voor PDF/UA-2 en de getagde modus stelt de titelvoorkeur van de viewer in.

Voeg semantische HTML toe. De pijplijn wijst koppen, lijsten, tabellen met <th scope>, koppelingen en figuren met alt toe aan de juiste structuurtypen:

{
"jsonrpc": "2.0",
"id": 5,
"method": "tools/call",
"params": {
"name": "add_html",
"arguments": {
"document_id": "<id>",
"html": "<h1>Annual Report</h1><h2>Summary</h2><p>Revenue grew.</p><table><caption>Revenue</caption><thead><tr><th scope=\"col\">Region</th><th scope=\"col\">Q1</th></tr></thead><tbody><tr><th scope=\"row\">EMEA</th><td>120</td></tr></tbody></table><figure><img src=\"chart.png\" alt=\"Revenue by region bar chart\" /><figcaption>Figure 1.</figcaption></figure>"
}
}
}

Voer vervolgens de standards-check uit voor PDF/UA-2 en voer veraPDF --flavour ua2 uit op de uitvoer. Het controleresultaat en het veraPDF-oordeel zijn beoordelingen. Ze geven aan of het document bedoeld is om te voldoen. veraPDF, en niet NextPDF, bepaalt de conformiteit.

  • Getagde modus ingeschakeld na content. Alle content die u toevoegt voordat u de modus inschakelt, blijft ongetagd. De controle meldt dat als fout voor getagde content. Schakel de modus direct in nadat u het document hebt gemaakt.
  • Informatieve afbeelding zonder alt. De controle meldt een fout over alternatieve tekst voor een figuur. Geef alt-tekst op of markeer een decoratieve afbeelding als artefact (/cookbook/connect/page-artifacts/).
  • Kopniveau overgeslagen. Een niveau overslaan, bijvoorbeeld H1 gevolgd door H3, is een fout in de kopvolgorde. Daal telkens met maximaal één niveau af.
  • <th> zonder scope. Een kopcel zonder bijbehorende gegevenscellen is een fout in de tabelstructuur. Geef voor elke <th> ofwel scope="col" ofwel scope="row" op.
  • Ontbrekende titel. Een document zonder titel is een metadatafout. Stel de titel in nadat u de getagde modus hebt ingeschakeld.

Het budget in de frontmatter is een documentatielimiet. Taggen maakt deel uit van de normale lay-outfase.

Hier gelden geen aanvullende regels naast de algemene richtlijnen voor het Connect-transport: log documentcontent of de HTML-body niet op een logniveau dat extern wordt verzonden.

Semantische HTML wordt toegewezen aan de standaardstructuurtypen van PDF/UA-2 (H1H6, P, L/LI/Lbl/LBody, Table/TR/TH/TD, Link, Figure/Caption, Aside). De toewijzing verloopt automatisch. Uw deel van het contract is het schrijven van semantische HTML.

BeweringClausulereference_id
Logische structuur + taal → navigeerbaar in leesvolgordeISO 32000-2 §14.7
Alternatieve beschrijving opgenomen in /AltISO 32000-2 §14.8
Content in de structuurboom; een controletool bepaalt de conformiteitPDF/UA-2 §8.2.4

De structuur ondersteunt WCAG 2.2 SC 1.1.1, 1.3.1, 2.4.1 en 2.4.6 op contentniveau. Als contentauteur blijft u verantwoordelijk voor de auteurskeuzes op WCAG-niveau.

NextPDF produceert uitvoer die bedoeld is om te voldoen aan PDF/UA-2. NextPDF bevestigt geen conformiteit. veraPDF, of een andere controletool, stelt de conformiteit vast. Een geslaagde controle of veraPDF-run is bewijs dat de uitvoer bedoeld is om te voldoen, geen certificering door NextPDF.

De getagde-modus- en contenttools horen bij core. De standards-check-verificatietool valt onder het Pro/Enterprise-niveau en registreert zich uitsluitend wanneer nextpdf/premium naast de server is geïnstalleerd.

Beschikbaarheid van transports (MCP / REST / gRPC)

Sectie met titel “Beschikbaarheid van transports (MCP / REST / gRPC)”

U roept elke tool in deze zelfstudie op dezelfde manier aan via MCP tools/call, het REST-tooleindpunt en de gRPC-service. Ze lopen allemaal via de gedeelde tool-executor.

Het inschakelen van de getagde modus en het gebruik van de contenttools vallen onder het waarschuwingsniveau. De standards-check is alleen-lezen. Het uitvoerpad dat naar een bestand schrijft, vereist goedkeuring; de base64-modus niet. Zie /connect/hitl-risk-niveaus/.

Wanneer het uitvoerpad dat naar een bestand schrijft achter een gate staat, retourneert de gate een challenge-envelop en een token voor eenmalig gebruik. Het token is gebonden aan de toolnaam, een nonce en een time-to-live (TTL) van 300 seconden. Roep de tool opnieuw aan met arguments._confirmation_token om door te gaan. Zie /connect/hitl-risk-niveaus/.

  • /cookbook/connect/conformance-mode/ — de modusdiscriminator achter de getagde modus.
  • /cookbook/connect/aria-tagged-pdf/ — toewijzing van landmark-rollen.
  • /cookbook/connect/page-artifacts/ — decoratieve content uit de structuurboom uitsluiten.
  • /connect/tool-catalog/ — berekening van de toolset per niveau.