Przejdź do głównej zawartości

Słownik

Ten słownik definiuje terminy NextPDF pojawiające się w całej dokumentacji: profile podpisów, tryby szyfrowania, warstwy potoku HyperText Markup Language (HTML), struktury dostępności, model zdarzeń oraz operacje prywatności w edycjach komercyjnych. Każdy termin ma własną kotwicę, dzięki czemu inne strony mogą odsyłać bezpośrednio do jego definicji. Definicje są parafrazą kanonicznego, podpisanego słownika oraz standardów implementowanych przez NextPDF; gdy potrzebne jest dokładne brzmienie normatywne, należy sięgnąć do cytowanego standardu.

Advanced Encryption Standard in Galois/Counter Mode (AES-GCM) to tryb szyfrowania uwierzytelnionego, który łączy AES w trybie licznika z kodem uwierzytelniania wiadomości opartym na ciele Galois, zapewniając poufność i integralność w jednym przebiegu. ISO 32000-2 wprowadza go poprzez ISO/TS 32002 jako preferowany schemat szyfrowania uwierzytelnionego w miejsce Advanced Encryption Standard Cipher Block Chaining (AES-CBC).

Deszyfrowanie uwierzytelnione weryfikuje znacznik integralności przed zwróceniem tekstu jawnego. NextPDF odróżnia strukturalny błąd deszyfrowania, taki jak problem z konfiguracją lub transportem, od niepowodzenia kontroli integralności, gdy treść nie przeszła weryfikacji. Logika rozgałęzia się na podstawie klasy wyjątku, zamiast sprowadzać oba warunki do jednego.

CMS Advanced Electronic Signatures (CAdES) to rodzina profili podpisu European Telecommunications Standards Institute (ETSI) dla dowolnej treści binarnej, zdefiniowana przez ETSI EN 319 122. Opiera się na strukturze Cryptographic Message Syntax (CMS) z Request for Comments (RFC) 5652, uzupełnionej o atrybuty znakowania czasem i długoterminowej walidacji. PDF Advanced Electronic Signatures (PAdES) korzysta z modelu atrybutów CAdES i osadza go w słowniku podpisu formatu Portable Document Format (PDF).

Pokrycie chińskiego, japońskiego i koreańskiego (CJK) to odsetek bloków Unicode wymaganych przez pismo CJK, które obejmuje mapa Unicode danej czcionki. NextPDF szacuje pokrycie, próbkując punkty kodowe, i oznacza bloki poniżej progu 50 procent jako brakujące zakresy. Wartość ta wspiera dobór czcionek; nie jest audytem z dokładnością do bajta.

Cryptographic Message Syntax (CMS) to kontener podpisu z RFC 5652, który opakowuje strukturę signed-data używaną przez CAdES i PAdES. NextPDF generuje obiekty CMS SignedData i osadza je jako pole Contents słownika podpisu PDF.

Wyjątek świadomy kontekstu to wyjątek NextPDF, który implementuje ContextAwareExceptionInterface i udostępnia metodę getContext(). Metoda zwraca mapę w stylu snake_case z prymitywnymi polami diagnostycznymi, które można zserializować do logu lub ładunku application performance monitoring (APM) bez parsowania treści komunikatu.

Tablica odsyłaczy odwzorowuje każdy numer obiektu pośredniego na końcu pliku PDF na jego przesunięcie w bajtach. NextPDF preferuje strumienie odsyłaczy, czyli postać z PDF 2.0, ponieważ lepiej się kompresują i czyściej integrują ze strumieniami obiektów.

Moduł Cascading Style Sheets (CSS) to dokument roboczy World Wide Web Consortium (W3C), który definiuje jeden wycinek CSS, taki jak Selectors, Values, Fonts lub Flexbox. Potok HTML NextPDF implementuje wybrany podzbiór modułów CSS przypisany do ustalonych wersji Editor’s Draft, udokumentowany w audycie pokrycia CSS.

Deidentyfikacja to ogólny proces usuwania lub osłabiania powiązania między danymi a osobą, której dotyczą. NextPDF Enterprise przeprowadza deidentyfikację w zakresie wyznaczonym wzorcem poprzez redakcję, usuwanie wierszy lub odwracalną pseudonimizację. Nie jest to anonimizacja i nie eliminuje resztkowego ryzyka ponownej identyfikacji. Pozostałe atrybuty mogą nadal nieść ryzyko.

Polityka degradacji decyduje, co robi NextPDF, gdy dana funkcja działa w trybie zdegradowanym. Polityka rygorystyczna zgłasza wyjątek, gdy degradacja wpływa na zgodność, semantykę albo ma charakter blokujący. Polityka zrównoważona zgłasza wyjątek tylko przy wpływie blokującym. Polityka liberalna zapisuje ostrzeżenie i nigdy nie zgłasza wyjątku.

Klucz szyfrowania danych (DEK) to klucz o zasięgu kolekcji, którego metadane zwraca fabryka dostawcy systemu zarządzania kluczami (KMS). Lokalny dostawca w edycji Enterprise wyprowadza go za pomocą HKDF-SHA256 i zwraca wyłącznie metadane, nigdy surowe bajty klucza.

Document Security Store (DSS) to wpis w katalogu PDF 2.0, który agreguje certyfikaty, listy unieważnionych certyfikatów (CRL), odpowiedzi Online Certificate Status Protocol (OCSP) oraz tokeny znacznika czasu potrzebne do walidacji każdego podpisu w dokumencie. PAdES B-LT i B-LTA wypełniają ten wpis, a walidatory sprawdzają go, zanim sięgną do sieci.

Tryb Federal Information Processing Standards (FIPS) to skonfigurowany stan, w którym NextPDF Core działa na kompilacji OpenSSL hosta, która załadowała dostawcę zwalidowanego pod kątem FIPS. Sam NextPDF nie ma certyfikatu FIPS; tryb ten ogranicza prymitywy wywoływane przez Core, tak aby pracę kryptograficzną wykonywał zwalidowany dostawca. Trójstanowa sonda działająca na zasadzie najlepszego wysiłku zgłasza stan hosta jako aktywny, nieobecny lub nieokreślony, a stan nieokreślony traktuje jako niepotwierdzony.

Podczas tworzenia podzbioru czcionki powstaje zredukowany program czcionki, który zawiera tylko te glify, do których odwołuje się dokument. Proces odtwarza wymagane tablice czcionki i zachowuje oryginalną numerację glifów, dzięki czemu Identity CIDToGIDMap pozostaje prawidłowe. Tworzenie podzbioru oznacza operację; podzbiór czcionki oznacza powstały program.

Hash-based Message Authentication Code (HMAC)-based Key Derivation Function (HKDF) to funkcja wyprowadzania kluczy, której w postaci HKDF-SHA256 używa lokalny dostawca KMS w edycji Enterprise, aby ze skonfigurowanego klucza głównego wyprowadzić klucz szyfrowania danych właściwy dla danej kolekcji.

Sprzętowy moduł bezpieczeństwa (HSM) to odporne na manipulacje urządzenie, które przechowuje klucze prywatne i wykonuje podpisywanie, nie ujawniając klucza w pamięci hosta. NextPDF Enterprise integruje się ze sprzętowymi modułami bezpieczeństwa poprzez abstrakcję Public-Key Cryptography Standards #11 (PKCS#11) oraz model sterownika controller/worker.

Potok HTML to czterowarstwowy potok renderowania w katalogu src/Html/, który przekształca HTML i CSS w strumienie treści PDF. Jego warstwy to parsowanie CSS, stan stylu, układ i malowanie (ADR-010). Jest to największy i obarczony najwyższym ryzykiem podsystem silnika.

Aktualizacja przyrostowa to wersja PDF dołączona po oryginalnych bajtach, pozostawiająca wcześniejszą treść bez zmian, dzięki czemu istniejące podpisy pozostają ważne.

System zarządzania kluczami (KMS) to hostowany w chmurze magazyn kluczy, taki jak AWS KMS, Google Cloud KMS lub Azure Key Vault, który podpisuje w imieniu najemcy za pomocą kluczy, których nigdy nie udostępnia. NextPDF Enterprise traktuje system zarządzania kluczami jako alternatywny backend podpisywania odroczonego obok sprzętowych modułów bezpieczeństwa.

Układ to trzecia warstwa czterowarstwowego potoku HTML z ADR-010. Oblicza pozycje i rozmiary pudełek na podstawie rozstrzygniętych stylów, tworzy plan malowania i nigdy nie emituje operatorów PDF bezpośrednio. Znajduje się wśród pomocników układu flex, float, kontekstu i tabel w katalogu src/Html/.

Komponent NextPDF\Event\ListenerProvider odwzorowuje klasę zdarzenia na uporządkowaną według priorytetu listę wywoływalnych nasłuchiwaczy. Przechodzi przez hierarchię klas i interfejsy zdarzenia, dzięki czemu nasłuchiwacz zarejestrowany na typie nadrzędnym obserwuje każdy podtyp. Stan jest ograniczony do instancji i nie obejmuje stanu statycznego, więc procesy robocze pozostają odizolowane.

Walidacja długoterminowa (LTV) to właściwość podpisanego pliku PDF, która pozwala podpisowi pozostać weryfikowalnym bezterminowo, nawet po wygaśnięciu poświadczeń podpisującego lub zniknięciu usług unieważniania. NextPDF osiąga to, utrwalając materiał unieważniania w Document Security Store i odnawiając archiwalne znaczniki czasu, zanim algorytm każdego poprzedniego znacznika czasu osłabnie.

Optyczne rozpoznawanie znaków (OCR) zamienia obrazy stron w tekst nadający się do odczytu maszynowego. Jest to odrębna kategoria problemów niż generowanie PDF. NextPDF generuje i strukturalnie bada dokumenty, zamiast interpretować piksele jako znaczenie, więc zadanie OCR należy do dedykowanego potoku.

Docelowy warunek wyjściowy to wpis w katalogu PDF, który deklaruje zamierzony warunek wyjściowy dokumentu, zwykle profil International Color Consortium (ICC) charakteryzujący docelowe urządzenie drukujące lub przestrzeń barw wyświetlacza. PDF/A-4 wymaga go dla dokumentów używających kolorów zależnych od urządzenia, a profile PDF/X wymagają go do zadeklarowania warunku druku.

PDF Advanced Electronic Signatures (PAdES) to rodzina profili podpisu ETSI dla dokumentów PDF, zdefiniowana przez ETSI EN 319 142. Opiera się na CMS i CAdES z regułami kodowania właściwymi dla PDF. Obejmuje cztery poziomy bazowe (B-B, B-T, B-LT, B-LTA), które stopniowo dodają znaczniki czasu i materiał walidacji długoterminowej do osadzonego podpisu.

PAdES B-T to poziom bazowy PAdES, który dodaje token znacznika czasu RFC 3161 obejmujący wartość podpisu, dowodząc, że podpis istniał w oznaczonej chwili. Opiera się bezpośrednio na PAdES B-B.

Poziom PAdES to warstwa zgodności podpisu, na przykład B-B, B-T, B-LT lub B-LTA, która określa, jaki materiał niesie podpis. NextPDF zachowuje zasadę bezpiecznej odmowy, gdy żądany poziom jest nieosiągalny, zgłaszając SignatureLevelUnreachableException zamiast po cichu wytwarzać niższy poziom, jednocześnie deklarując wyższy.

Malowanie to czwarta warstwa czterowarstwowego potoku HTML z ADR-010. Pobiera plan malowania z układu i emituje operatory PDF poprzez moduł zapisu. Jest to jedyna warstwa uprawniona do wywoływania prymitywów rysujących.

Flagi uprawnień to pole bitowe w słowniku szyfrowania PDF, które kontroluje, jakie operacje może wykonać uwierzytelniony czytelnik: drukowanie w niskiej lub wysokiej rozdzielczości, kopiowanie treści, modyfikowanie adnotacji, wypełnianie formularzy oraz składanie dokumentu. Autor dokumentu ustawia je podczas szyfrowania hasłem użytkownika lub certyfikatem. NextPDF udostępnia typowany obiekt wartości PermissionFlags.

Dane osobowe umożliwiające identyfikację (PII) to wszelkie dane, które mogą zidentyfikować osobę fizyczną samodzielnie lub w połączeniu z innymi informacjami, w tym imię i nazwisko, adres, identyfikator podatkowy, dane biometryczne oraz adres e-mail. Funkcja redakcji w NextPDF Pro nieodwracalnie usuwa obszary PII z pliku PDF, tak aby żadne narzędzie na dalszym etapie łańcucha nie mogło odzyskać danych.

Public-Key Cryptography Standards #11 (PKCS#11) to interfejs tokenów kryptograficznych OASIS, obecnie w wersji 3.1, który daje aplikacjom stabilny interfejs programowania aplikacji (API) do komunikacji ze sprzętowymi modułami bezpieczeństwa i kartami inteligentnymi. Podsystem sterowników podpisujących NextPDF Enterprise używa PKCS#11 jako najwspólniejszej ścieżki dostępu do kluczy sprzętowych.

Pseudonimizacja zastępuje wartość identyfikującą aliasem. Jest z definicji odwracalna i korzysta z osobno przechowywanego odwzorowania. NextPDF Enterprise wyprowadza deterministyczne, świadome formatu pseudonimy za pomocą HMAC z oryginalnej wartości i ziarna właściwego dla sesji. Pieczętuje przechowywane odwzorowanie oryginał-na-pseudonim za pomocą AES-256-GCM pod kluczem z wersją. Nie jest to anonimizacja i nie wolno przedstawiać jej jako nieodwracalnej.

PHP Standard Recommendation 14 (PSR-14) to standard PHP Framework Interop Group (PHP-FIG), który definiuje dyspozytor zdarzeń, dostawcę nasłuchiwaczy oraz zdarzenia zatrzymywalne. Moduł Event w NextPDF stosuje ten model i deklaruje interfejsy zgodne z duck-type, więc silnik nie ma zależności wykonawczej psr/event-dispatcher.

PHP Standard Recommendation 20 (PSR-20) to standard PHP-FIG, który definiuje interfejs zegara, którego jedyna operacja odczytu zwraca bieżący czas jako niezmienną wartość daty i czasu. SystemClock w NextPDF implementuje ten interfejs; wstrzyknięcie stałego zegara usuwa niedeterminizm czasu rzeczywistego z odtwarzalnego wyniku.

Tryb retained a strumieniowy opisuje, czy renderer buduje w pamięci reprezentację całego dokumentu przed wyemitowaniem wyniku (retained), czy przetwarza tokeny w miarę ich napływania (strumieniowy). NextPDF jest strumieniowy od początku do końca, podczas gdy konkurencyjne silniki, takie jak dompdf, działają w trybie retained.

Asercja unieważnienia to oświadczenie o statusie certyfikatu, które dostarcza responder OCSP lub CRL, osadzane dla poziomów podpisu z walidacją długoterminową. NextPDF odmawia traktowania nieudanej odpowiedzi OCSP jako pozytywnej asercji zaufania; status nieznany ani błędny nigdy nie jest awansowany do dobrego.

Znacznik czasu RFC 3161 to TimeStampToken, który urząd znakowania czasem wystawia dla skrótu znakowanych danych. PAdES B-T używa go, aby powiązać podpis z weryfikowalną chwilą. NextPDF osadza go jako obiekt CMS SignedData wewnątrz niepodpisanego atrybutu w informacji o podpisującym.

PDF z możliwością wyszukiwania zawiera niewidoczną warstwę tekstu nad obrazami stron zeskanowanego dokumentu, dzięki czemu tekst na stronie można zaznaczać i przeszukiwać. NextPDF Enterprise orkiestruje to, sterując wstrzykniętym backendem OCR, przy czym rasteryzacja i wstrzykiwanie tekstu są delegowane do osobnego sidecara. Wynikiem jest dokument pochodny: istniejące podpisy zostają unieważnione, a zgodność trzeba ponownie zwalidować. Funkcja nie gwarantuje żadnego poziomu dokładności OCR ani kompletności ekstrakcji.

Strumieniowanie jednoprzebiegowe to model renderowania potoku HTML (ADR-001), w którym tokenizer wytwarza listę tokenów w jednym przebiegu, a parser konsumuje ją od lewej do prawej, emitując operatory strumienia treści bez budowania utrzymywanego drzewa Document Object Model (DOM). Pamięć po stronie wejścia jest ograniczona głębokością zagnieżdżenia, a nie liczbą elementów, z twardym limitem łącznej liczby elementów. Wyprzedzanie korzysta z ograniczonych tablic indeksów wstępnego skanowania, a nie z utrzymywanego DOM.

Zdarzenie zatrzymywalne to zdarzenie cyklu życia, które nasłuchiwacz może wstrzymać: wywołanie stopPropagation() sprawia, że dyspozytor pomija pozostałe nasłuchiwacze w danym przebiegu dyspozycji. Każde zdarzenie cyklu życia NextPDF jest zatrzymywalne, ponieważ AbstractEvent implementuje StoppableEventInterface, odzwierciedlając semantykę zdarzeń zatrzymywalnych PSR-14.

Drzewo struktury to drzewo elementów semantycznych, które nadaje oznaczonemu PDF logiczną kolejność czytania i dostępną strukturę. Jest zakorzenione w katalogu dokumentu pod /StructTreeRoot. NextPDF buduje drzewo struktury w locie, gdy tokeny przepływają przez potok HTML.

Oznaczony PDF zawiera równoległe logiczne drzewo struktury obok wizualnego strumienia treści, dzięki czemu technologia wspomagająca czyta strukturę, a nie układ wizualny, zgodnie z ISO 32000-2 sekcja 14.7.

Typowany wither to dedykowana, bezpieczna pod względem typów metoda kopiująca na obiekcie niezmiennym, na przykład Config::withPageSize(), która odtwarza obiekt z argumentami nazwanymi i zwraca nową instancję. NextPDF używa typowanych witherów zamiast generycznego settera with(string, mixed), tak aby analiza statyczna i zintegrowane środowiska programistyczne (IDE) pozostawały precyzyjne.

Obiekt wartości to niezmienny prymityw domenowy o równości według wartości, bez tożsamości i bez operacji input/output (I/O). NextPDF modeluje geometrię, taką jak PageSize, Dimension, Position i Margin, jako finalne, tylko do odczytu obiekty wartości, więc instancje można bezpiecznie współdzielić. Każda transformacja zwraca nową instancję.

Słownik Validation-Related Information (VRI) w Document Security Store odwzorowuje skrót konkretnego podpisu na certyfikaty, listy CRL oraz odpowiedzi OCSP użyte do jego walidacji w chwili uzupełnienia długoterminowego. Jest opcjonalny, ale zalecany dla weryfikatorów archiwalnych.