Glossário
Visão geral
Seção intitulada “Visão geral”Este glossário define os termos do NextPDF que aparecem ao longo da documentação, incluindo perfis de assinatura, modos de criptografia, camadas do pipeline da HyperText Markup Language (HTML), estruturas de acessibilidade, modelo de eventos e operações de privacidade nas edições comerciais. Cada termo tem a própria âncora, para que outras páginas possam apontar diretamente para a definição. As definições parafraseiam o glossário canônico assinado e os padrões que o NextPDF implementa; consulte o padrão citado quando precisar da redação normativa exata.
AES-GCM
Seção intitulada “AES-GCM”O Advanced Encryption Standard in Galois/Counter Mode (AES-GCM) é um modo de criptografia autenticada que combina o AES em modo contador com um código de autenticação de mensagem em campo de Galois, fornecendo confidencialidade e integridade em uma única passagem. A ISO 32000-2 o introduz por meio da ISO/TS 32002 como o esquema preferencial de criptografia autenticada, substituindo o Advanced Encryption Standard Cipher Block Chaining (AES-CBC).
descriptografia autenticada
Seção intitulada “descriptografia autenticada”A descriptografia autenticada verifica uma tag de integridade antes de retornar o texto claro. O NextPDF mantém uma falha estrutural de descriptografia, como um problema de configuração ou de transporte, separada de uma falha na verificação de integridade, em que o conteúdo não foi verificado. Ele ramifica a execução conforme a classe da exceção, em vez de reduzir as duas condições a uma só.
O CMS Advanced Electronic Signatures (CAdES) é a família de perfis de assinatura do European Telecommunications Standards Institute (ETSI) para conteúdo binário arbitrário, definida pela ETSI EN 319 122. Ele se baseia na estrutura Cryptographic Message Syntax (CMS) do Request for Comments (RFC) 5652, com atributos para carimbo de tempo e validação de longo prazo. O PDF Advanced Electronic Signatures (PAdES) usa o modelo de atributos do CAdES e o incorpora ao dicionário de assinatura do Portable Document Format (PDF).
cobertura CJK
Seção intitulada “cobertura CJK”A cobertura de chinês, japonês e coreano (CJK) é a proporção dos blocos Unicode necessários a um sistema de escrita CJK que o mapa Unicode de uma fonte cobre. O NextPDF estima a cobertura por amostragem de code points e sinaliza como intervalos ausentes os blocos abaixo de um limiar de 50 por cento. O número ajuda na seleção de fontes; não é uma auditoria exata em bytes.
O Cryptographic Message Syntax (CMS) é o contêiner de assinatura do RFC 5652 que envolve a estrutura de dados assinados usada pelo CAdES e pelo PAdES. O NextPDF emite blobs CMS SignedData e os incorpora como o Contents do dicionário de assinatura do PDF.
exceção sensível ao contexto
Seção intitulada “exceção sensível ao contexto”Uma exceção sensível ao contexto é uma exceção do NextPDF que implementa ContextAwareExceptionInterface e expõe um método getContext(). O método retorna um mapa em snake_case de campos primitivos de diagnóstico que você pode serializar em um log ou em um payload de application performance monitoring (APM) sem precisar analisar a string da mensagem.
Tabela de referências cruzadas
Seção intitulada “Tabela de referências cruzadas”Uma tabela de referências cruzadas mapeia, no final de um arquivo PDF, cada número de objeto indireto para o respectivo deslocamento em bytes. O NextPDF prefere os cross-reference streams, a forma do PDF 2.0, porque comprimem melhor e se integram de forma limpa aos object streams.
módulo CSS
Seção intitulada “módulo CSS”Um módulo Cascading Style Sheets (CSS) é um produto de trabalho do World Wide Web Consortium (W3C) que define uma parte do CSS, como Selectors, Values, Fonts ou Flexbox. O pipeline HTML do NextPDF implementa um subconjunto selecionado de módulos CSS fixados em versões Editor’s Draft específicas, documentado na auditoria de cobertura de CSS.
Desidentificação
Seção intitulada “Desidentificação”A desidentificação é o processo geral de remover ou reduzir o vínculo entre os dados e a pessoa a que eles se referem. O NextPDF Enterprise realiza desidentificação com escopo por padrão por meio de redação, supressão de linhas ou pseudonimização reversível. Isso não é anonimização e não elimina o risco residual de reidentificação. Os atributos remanescentes ainda podem representar risco.
política de degradação
Seção intitulada “política de degradação”Uma política de degradação decide o que o NextPDF faz quando um recurso opera em modo degradado. Uma política estrita lança exceção diante de um impacto de conformidade, semântico ou bloqueador. Uma política balanceada lança exceção apenas diante de um impacto bloqueador. Uma política permissiva registra um aviso e nunca lança exceção.
Uma data encryption key (DEK) é uma chave com escopo de coleção cujos metadados são retornados pela fábrica de provedores do key management system (KMS). O provedor local do Enterprise a deriva com HKDF-SHA256 e retorna apenas metadados, nunca os bytes brutos da chave.
O Document Security Store (DSS) é uma entrada de catálogo do PDF 2.0 que agrega os certificados, as certificate revocation lists (CRLs), as respostas do Online Certificate Status Protocol (OCSP) e os tokens de carimbo de tempo necessários para validar cada assinatura no documento. O PAdES B-LT e o B-LTA o preenchem, e os validadores o consultam antes de acessar a rede.
modo FIPS
Seção intitulada “modo FIPS”O modo Federal Information Processing Standards (FIPS) é um estado configurado em que o NextPDF Core opera contra uma build de OpenSSL do host que carregou um provedor validado por FIPS. O próprio NextPDF não é certificado por FIPS; o modo restringe quais primitivas o Core invoca, para que o provedor validado realize o trabalho criptográfico. Uma sondagem de melhor esforço com três estados informa a postura do host como ativa, ausente ou indeterminada, e trata o estado indeterminado como não comprovado.
subconjunto de fontes
Seção intitulada “subconjunto de fontes”A criação de subconjunto de fontes monta um programa de fonte reduzido que contém apenas os glifos referenciados por um documento. Ela reconstrói as tabelas de fonte necessárias e preserva a numeração original dos glifos para que um Identity CIDToGIDMap continue válido. “Subsetting” nomeia a operação; “font subset” nomeia o programa resultante.
A Hash-based Message Authentication Code (HMAC)-based Key Derivation Function (HKDF) é a função de derivação de chave que o provedor KMS local do Enterprise usa, em sua forma HKDF-SHA256, para derivar uma data encryption key específica da coleção a partir de uma chave-raiz configurada.
Um hardware security module (HSM) é um dispositivo resistente à violação que armazena chaves privadas e realiza a assinatura sem nunca expor a chave à memória do host. O NextPDF Enterprise integra-se a hardware security modules por meio da abstração Public-Key Cryptography Standards #11 (PKCS#11) e de um modelo de driver controller/worker.
pipeline html
Seção intitulada “pipeline html”O pipeline html é o pipeline de renderização de quatro camadas sob src/Html/ que converte HTML e CSS em content streams de PDF. Suas camadas são análise de CSS, estado de estilo, layout e paint (ADR-010). É o maior subsistema do motor e também o de maior risco.
Atualização incremental
Seção intitulada “Atualização incremental”Uma atualização incremental é uma revisão de PDF acrescentada após os bytes originais, mantendo o conteúdo anterior inalterado para que as assinaturas existentes permaneçam válidas.
Um key management system (KMS) é um cofre de chaves hospedado na nuvem, como AWS KMS, Google Cloud KMS ou Azure Key Vault, que assina em nome de um locatário usando chaves que nunca libera. O NextPDF Enterprise trata um key management system como um backend alternativo de assinatura diferida, ao lado dos hardware security modules.
O layout é a terceira camada do pipeline HTML de quatro camadas do ADR-010. Ele calcula as posições e os tamanhos das caixas a partir dos estilos resolvidos, produz um plano de paint e nunca emite operadores de PDF diretamente. Reside sob os auxiliares de layout de flex, float, context e tabelas em src/Html/.
provedor de listeners
Seção intitulada “provedor de listeners”O componente NextPDF\Event\ListenerProvider mapeia uma classe de evento para uma lista de callables de listener ordenada por prioridade. Ele percorre a hierarquia de classes e as interfaces do evento, de modo que um listener registrado em um tipo pai observa todos os subtipos. O estado tem escopo de instância e não há estado estático, de modo que os workers permanecem isolados.
A long-term validation (LTV) é a propriedade de um PDF assinado que permite que a assinatura permaneça verificável indefinidamente, mesmo depois que as credenciais do signatário expiram ou os serviços de revogação desaparecem. O NextPDF alcança isso capturando o material de revogação no Document Security Store e renovando os carimbos de tempo de arquivamento antes que o algoritmo de cada carimbo de tempo anterior se enfraqueça.
O reconhecimento óptico de caracteres (OCR) converte imagens de página em texto legível por máquina. Essa é uma categoria de problema distinta da geração de PDF. O NextPDF gera e inspeciona documentos estruturalmente, em vez de interpretar pixels como significado, de modo que o trabalho de OCR pertence a um pipeline dedicado.
output intent
Seção intitulada “output intent”Um output intent é uma entrada de catálogo do PDF que declara a condição de saída pretendida para o documento, normalmente um perfil International Color Consortium (ICC) que caracteriza o dispositivo de impressão de destino ou o espaço de cor de exibição. O PDF/A-4 o exige para documentos que usam cor dependente de dispositivo, e os perfis PDF/X o exigem para declarar a condição de impressão.
O PDF Advanced Electronic Signatures (PAdES) é a família de perfis de assinatura do ETSI para documentos PDF, definida pela ETSI EN 319 142. Ele se baseia no CMS e no CAdES com regras de codificação específicas de PDF. Compreende quatro níveis baseline (B-B, B-T, B-LT, B-LTA) que adicionam progressivamente carimbos de tempo e material de validação de longo prazo à assinatura incorporada.
PAdES B-T
Seção intitulada “PAdES B-T”O PAdES B-T é o baseline do PAdES que adiciona um token de carimbo de tempo RFC 3161 sobre o valor da assinatura, comprovando que a assinatura existia no instante carimbado. Ele se baseia diretamente no PAdES B-B.
nível PAdES
Seção intitulada “nível PAdES”Um nível PAdES é um patamar de conformidade de assinatura, por exemplo B-B, B-T, B-LT ou B-LTA, que determina qual material uma assinatura carrega. O NextPDF falha de forma fechada quando um nível solicitado é inatingível, lançando SignatureLevelUnreachableException em vez de produzir silenciosamente um nível inferior enquanto anuncia o superior.
O paint é a quarta camada do pipeline HTML de quatro camadas do ADR-010. Ele consome o plano de paint do layout e emite operadores de PDF por meio do writer. É a única camada autorizada a chamar as primitivas de desenho.
flags de permissão
Seção intitulada “flags de permissão”As flags de permissão são um campo de bits no dicionário de criptografia do PDF que controla quais operações um leitor autenticado pode executar: impressão em baixa ou alta resolução, cópia de conteúdo, modificação de anotações, preenchimento de formulários e montagem. O autor do documento as define ao criptografar com uma senha de usuário ou um certificado. O NextPDF expõe um value object PermissionFlags tipado.
Personally identifiable information (PII) é qualquer dado que possa identificar uma pessoa física por si só ou combinado com outras informações, incluindo nome, endereço, identificador fiscal, dados biométricos e endereço de e-mail. O recurso de redação do NextPDF Pro remove de forma irrecuperável as regiões de PII de um PDF, de modo que nenhuma ferramenta posterior consiga recuperar os dados.
O Public-Key Cryptography Standards #11 (PKCS#11) é a interface de token criptográfico da OASIS, atualmente na versão 3.1, que oferece às aplicações uma application programming interface (API) estável para se comunicar com hardware security modules e smart cards. O subsistema de drivers de signatário do NextPDF Enterprise usa o PKCS#11 como o caminho de menor denominador comum para chaves em hardware.
Pseudonimização
Seção intitulada “Pseudonimização”A pseudonimização substitui um valor identificador por um alias. Ela é reversível por definição e usa um mapeamento mantido separadamente. O NextPDF Enterprise deriva pseudônimos determinísticos e cientes do formato a partir de um HMAC sobre o valor original e uma seed por sessão. Ele sela o mapa de original-para-pseudônimo em repouso com AES-256-GCM sob uma chave versionada. Não é anonimização e não deve ser apresentada como irreversível.
A PHP Standard Recommendation 14 (PSR-14) é o padrão do PHP Framework Interop Group (PHP-FIG) que define um dispatcher de eventos, um provedor de listeners e eventos interrompíveis. O módulo Event do NextPDF segue esse modelo e declara interfaces compatíveis por duck typing, de modo que o motor não carrega nenhuma dependência de runtime psr/event-dispatcher.
A PHP Standard Recommendation 20 (PSR-20) é o padrão do PHP-FIG que define uma interface de relógio cuja única operação de leitura retorna o horário atual como um valor de data e hora imutável. O SystemClock do NextPDF a implementa; injetar um relógio fixo remove o não determinismo de wall-clock da saída reproduzível.
retained vs streaming
Seção intitulada “retained vs streaming”Retained vs streaming descreve se um renderizador monta uma representação em memória de todo o documento antes de emitir a saída (retained) ou processa os tokens à medida que chegam (streaming). O NextPDF é streaming de ponta a ponta, enquanto motores concorrentes como o dompdf são retained.
asserção de revogação
Seção intitulada “asserção de revogação”Uma asserção de revogação é a declaração de status de certificado que um respondedor OCSP ou uma CRL fornece, incorporada para os níveis de assinatura de validação de longo prazo. O NextPDF se recusa a tratar uma resposta OCSP malsucedida como uma asserção positiva de confiança; um status unknown ou error nunca é promovido a good.
carimbo de tempo RFC 3161
Seção intitulada “carimbo de tempo RFC 3161”Um carimbo de tempo RFC 3161 é um TimeStampToken que uma Time-Stamping Authority emite sobre um hash dos dados que estão sendo carimbados. O PAdES B-T o usa para vincular uma assinatura a um instante verificável. O NextPDF o incorpora como um blob CMS SignedData dentro de um atributo não assinado no signer info.
PDF pesquisável
Seção intitulada “PDF pesquisável”Um PDF pesquisável carrega uma camada de texto invisível sobre as imagens de página de um documento digitalizado, de modo que a página passe a permitir seleção de texto e pesquisa. O NextPDF Enterprise orquestra isso acionando um backend de OCR injetado, com a rasterização e a injeção de texto delegadas a um sidecar separado. O resultado é um documento derivado: as assinaturas existentes são invalidadas e a conformidade deve ser revalidada. O recurso não assegura nenhuma precisão de OCR nem cobertura de extração.
streaming de passagem única
Seção intitulada “streaming de passagem única”O streaming de passagem única é o modelo de renderização do pipeline HTML (ADR-001) no qual o tokenizador produz uma lista de tokens em uma única passagem e o parser a consome da esquerda para a direita, emitindo operadores de content stream sem montar uma árvore Document Object Model (DOM) retida. A memória do lado da entrada é limitada pela profundidade de aninhamento, e não pela contagem de elementos, com um teto rígido para o total de elementos. O lookahead usa arrays de índice de pré-varredura limitados, não um DOM retido.
evento interrompível
Seção intitulada “evento interrompível”Um evento interrompível é um evento de ciclo de vida que um listener pode deter: chamar stopPropagation() faz o dispatcher ignorar os listeners restantes naquele ciclo de despacho. Todo evento de ciclo de vida do NextPDF é interrompível porque AbstractEvent implementa StoppableEventInterface, espelhando a semântica de evento interrompível da PSR-14.
árvore de estrutura
Seção intitulada “árvore de estrutura”Uma árvore de estrutura é a árvore de elementos semânticos que confere a um PDF marcado sua ordem lógica de leitura e sua estrutura acessível. Ela tem sua raiz no catálogo do documento, sob /StructTreeRoot. O NextPDF constrói a árvore de estrutura em tempo real, enquanto os tokens fluem pelo pipeline HTML.
PDF marcado
Seção intitulada “PDF marcado”Um PDF marcado carrega uma árvore de estrutura lógica paralela ao content stream visual, de modo que a tecnologia assistiva leia a estrutura, e não o layout visual, conforme a seção 14.7 da ISO 32000-2.
wither tipado
Seção intitulada “wither tipado”Um wither tipado é um método de cópia dedicado e seguro quanto a tipos em um objeto imutável, por exemplo Config::withPageSize(), que reconstrói o objeto com argumentos nomeados e retorna uma nova instância. O NextPDF usa withers tipados em vez de um setter genérico with(string, mixed), de modo que a análise estática e os integrated development environments (IDEs) permaneçam precisos.
value object
Seção intitulada “value object”Um value object é uma primitiva de domínio imutável, com igualdade por valor, sem identidade e sem input/output (I/O). O NextPDF modela geometria como PageSize, Dimension, Position e Margin como value objects readonly e final, de modo que as instâncias são seguras para compartilhar. Cada transformação retorna uma nova instância.
O dicionário Validation-Related Information (VRI) sob o Document Security Store mapeia o hash de uma assinatura específica para os certificados, as CRLs e as respostas OCSP usados para validá-la no momento da ampliação de longo prazo. Ele é opcional, mas recomendado para verificadores de arquivamento.