Перейти к содержимому

Глоссарий

Этот глоссарий даёт определения терминов NextPDF, которые встречаются в документации: профилей подписи, режимов шифрования, слоёв конвейера HyperText Markup Language (HTML), структур доступности, модели событий и операций конфиденциальности в коммерческих редакциях. У каждого термина есть собственный якорь, поэтому другие страницы могут ссылаться прямо на его определение. Определения основаны на каноническом подписанном глоссарии и стандартах, которые реализует NextPDF; за точными нормативными формулировками обращайтесь к цитируемому стандарту.

Advanced Encryption Standard in Galois/Counter Mode (AES-GCM) — это режим аутентифицированного шифрования, который сочетает AES в режиме счётчика с кодом аутентификации сообщения на основе поля Галуа и обеспечивает конфиденциальность и целостность за один проход. ISO 32000-2 вводит его через ISO/TS 32002 как предпочтительную схему аутентифицированного шифрования вместо Advanced Encryption Standard Cipher Block Chaining (AES-CBC).

Аутентифицированная расшифровка проверяет тег целостности перед тем, как вернуть открытый текст. NextPDF различает структурный сбой расшифровки, например проблему конфигурации или транспорта, и неудачную проверку целостности, когда содержимое её не прошло. Он выбирает ветку обработки по классу исключения, а не сводит эти два условия в одно.

CMS Advanced Electronic Signatures (CAdES) — это семейство профилей подписи European Telecommunications Standards Institute (ETSI) для произвольного двоичного содержимого, определённое стандартом ETSI EN 319 122. Оно построено на структуре Request for Comments (RFC) 5652 Cryptographic Message Syntax (CMS) и дополняет её атрибутами для меток времени и долгосрочной проверки. PDF Advanced Electronic Signatures (PAdES) использует модель атрибутов CAdES и встраивает её в словарь подписи Portable Document Format (PDF).

Покрытие Chinese, Japanese, and Korean (CJK) — это доля блоков Unicode, необходимых для письменностей CJK, которые охватывает карта Unicode шрифта. NextPDF оценивает покрытие через выборку кодовых точек и помечает блоки ниже порога в 50 процентов как отсутствующие диапазоны. Этот показатель помогает выбрать шрифт; это не побайтовая проверка.

Cryptographic Message Syntax (CMS) — это контейнер подписи RFC 5652, который оборачивает структуру signed-data, используемую CAdES и PAdES. NextPDF формирует объекты CMS SignedData и встраивает их в Contents словаря подписи PDF.

Контекстно-зависимое исключение — это исключение NextPDF, которое реализует ContextAwareExceptionInterface и предоставляет метод getContext(). Этот метод возвращает карту диагностических полей-примитивов в snake_case; её можно сериализовать в журнал или полезную нагрузку application performance monitoring (APM) без разбора строки сообщения.

Таблица перекрёстных ссылок сопоставляет каждый номер косвенного объекта в конце файла PDF с его байтовым смещением. NextPDF предпочитает потоки перекрёстных ссылок — форму PDF 2.0, потому что они лучше сжимаются и аккуратно интегрируются с потоками объектов.

Модуль Cascading Style Sheets (CSS) — это рабочий продукт World Wide Web Consortium (W3C), который определяет отдельный срез CSS, например Selectors, Values, Fonts или Flexbox. Конвейер HTML NextPDF реализует выверенное подмножество модулей CSS, закреплённое за фиксированными версиями Editor’s Draft; это задокументировано в аудите покрытия CSS.

Обезличивание — это общий процесс удаления или ослабления связи между данными и лицом, которого они касаются. NextPDF Enterprise выполняет обезличивание по заданным шаблонам с помощью редактирования, подавления строк или обратимой псевдонимизации. Это не анонимизация, и она не устраняет остаточный риск повторной идентификации. Оставшиеся атрибуты по-прежнему могут создавать риск.

Политика деградации определяет, что делает NextPDF, когда возможность работает в режиме пониженной функциональности. Строгая политика выбрасывает исключение при влиянии на соответствие, семантику или блокирующем влиянии. Сбалансированная политика выбрасывает исключение только при блокирующем влиянии. Разрешающая политика записывает предупреждение и никогда не выбрасывает исключение.

Data encryption key (DEK) — это ключ с областью действия коллекции; его метаданные возвращает фабрика провайдеров key management system (KMS). Локальный провайдер Enterprise выводит его с помощью HKDF-SHA256 и возвращает только метаданные, но никогда не сырые байты ключа.

Document Security Store (DSS) — это запись каталога PDF 2.0, которая агрегирует сертификаты, certificate revocation lists (CRLs), ответы Online Certificate Status Protocol (OCSP) и токены меток времени, необходимые для проверки каждой подписи в документе. PAdES B-LT и B-LTA заполняют его, а валидаторы сверяются с ним, прежде чем обращаться к сети.

Режим Federal Information Processing Standards (FIPS) — это настроенное состояние, в котором NextPDF Core работает поверх хостовой сборки OpenSSL, загрузившей провайдера, прошедшего проверку FIPS. Сам NextPDF не сертифицирован по FIPS; режим ограничивает примитивы, которые вызывает Core, чтобы криптографическую работу выполнял проверенный провайдер. Зонд с тремя состояниями по принципу наилучших усилий сообщает состояние хоста как active, absent или indeterminate и трактует indeterminate как недоказанное.

Формирование подмножества шрифта создаёт сокращённую программу шрифта, содержащую только глифы, на которые ссылается документ. Оно перестраивает требуемые таблицы шрифта и сохраняет исходную нумерацию глифов, чтобы Identity CIDToGIDMap оставалась действительной. Subsetting обозначает операцию; font subset — получаемую программу.

Hash-based Message Authentication Code (HMAC)-based Key Derivation Function (HKDF) — это функция вывода ключей. Локальный провайдер KMS в редакции Enterprise использует её в форме HKDF-SHA256, чтобы вывести специфичный для коллекции ключ шифрования данных из настроенного корневого ключа.

Hardware security module (HSM) — это устройство с защитой от взлома, которое хранит закрытые ключи и выполняет подписание, ни разу не раскрывая ключ в памяти хоста. NextPDF Enterprise интегрируется с аппаратными модулями безопасности через абстракцию Public-Key Cryptography Standards #11 (PKCS#11) и драйверную модель controller/worker.

Конвейер html — это четырёхслойный конвейер отрисовки в src/Html/, который преобразует HTML и CSS в потоки содержимого PDF. Его слои — разбор CSS, состояние стилей, макет и отрисовка (ADR-010). Это крупнейшая подсистема движка с самым высоким уровнем риска.

Инкрементное обновление — это редакция PDF, добавленная после исходных байтов. Она оставляет прежнее содержимое неизменным, чтобы существующие подписи оставались действительными.

Key management system (KMS) — это размещённое в облаке хранилище ключей, например AWS KMS, Google Cloud KMS или Azure Key Vault. Оно подписывает от имени арендатора, используя ключи, которые никогда не выдаёт. NextPDF Enterprise рассматривает key management system как альтернативный бэкенд отложенного подписанта наряду с аппаратными модулями безопасности.

Макет — это третий слой четырёхслойного конвейера HTML из ADR-010. Он вычисляет позиции и размеры блоков по разрешённым стилям, формирует план отрисовки и никогда не выдаёт операторы PDF напрямую. В src/Html/ он размещается среди помощников макета для flex, float, контекста и таблиц.

Компонент NextPDF\Event\ListenerProvider сопоставляет класс события с упорядоченным по приоритету списком вызываемых слушателей. Он обходит иерархию классов и интерфейсы события, поэтому слушатель, зарегистрированный для родительского типа, наблюдает каждый подтип. Его состояние ограничено экземпляром и не использует статическое состояние, поэтому рабочие процессы остаются изолированными.

Long-term validation (LTV) — это свойство подписанного PDF, позволяющее подписи оставаться проверяемой неограниченно долго, даже после истечения срока действия учётных данных подписанта или исчезновения служб отзыва. NextPDF достигает этого, фиксируя материал отзыва в Document Security Store и обновляя архивные метки времени до того, как алгоритм каждой предыдущей метки времени станет слабым.

Optical character recognition (OCR) превращает изображения страниц в машиночитаемый текст. Это отдельная категория задач, отличная от генерации PDF. NextPDF генерирует документы и структурно анализирует их, а не интерпретирует пиксели как смысл, поэтому работа с OCR относится к отдельному конвейеру.

Выходное намерение — это запись каталога PDF, которая объявляет предполагаемое выходное условие для документа: обычно профиль International Color Consortium (ICC), характеризующий целевое печатающее устройство или цветовое пространство дисплея. PDF/A-4 требует его для документов, использующих цвет, зависящий от устройства, а профили PDF/X — для объявления условия печати.

PDF Advanced Electronic Signatures (PAdES) — это семейство профилей подписи ETSI для документов PDF, определённое стандартом ETSI EN 319 142. Оно построено на CMS и CAdES с правилами кодирования, специфичными для PDF. Семейство включает четыре базовых уровня (B-B, B-T, B-LT, B-LTA), которые постепенно добавляют к встроенной подписи метки времени и материал долгосрочной проверки.

PAdES B-T — это базовый уровень PAdES, который добавляет токен метки времени RFC 3161 поверх значения подписи и доказывает, что подпись существовала в момент, отмеченный меткой времени. Он построен непосредственно на PAdES B-B.

Уровень PAdES — это уровень соответствия подписи, например B-B, B-T, B-LT или B-LTA, который определяет, какой материал несёт подпись. NextPDF завершается отказом, когда запрошенный уровень недостижим: выбрасывает SignatureLevelUnreachableException, вместо того чтобы молча выдать более низкий уровень, заявляя при этом более высокий.

Отрисовка — это четвёртый слой четырёхслойного конвейера HTML из ADR-010. Она получает план отрисовки от макета и выдаёт операторы PDF через писатель. Это единственный слой, которому разрешено вызывать примитивы рисования.

Флаги разрешений — это битовое поле в словаре шифрования PDF, которое управляет тем, какие операции может выполнять аутентифицированный читатель: печать с низким или высоким разрешением, копирование содержимого, изменение аннотаций, заполнение форм и сборку. Автор документа задаёт это поле при шифровании с пользовательским паролем или сертификатом. NextPDF предоставляет типизированный объект-значение PermissionFlags.

Personally identifiable information (PII) — это любые данные, которые могут идентифицировать физическое лицо сами по себе или в сочетании с другой информацией, включая имя, адрес, налоговый идентификатор, биометрические данные и адрес электронной почты. Функция редактирования NextPDF Pro безвозвратно удаляет области PII из PDF, так что ни один последующий инструмент не сможет восстановить эти данные.

Public-Key Cryptography Standards #11 (PKCS#11) — это интерфейс криптографических токенов OASIS, в настоящее время версии 3.1, который даёт приложениям стабильный application programming interface (API) для взаимодействия с аппаратными модулями безопасности и смарт-картами. Подсистема драйверов подписанта NextPDF Enterprise использует PKCS#11 как путь наименьшего общего знаменателя для доступа к аппаратным ключам.

Псевдонимизация заменяет идентифицирующее значение псевдонимом. Она обратима по определению и использует отдельно хранимое сопоставление. NextPDF Enterprise выводит детерминированные псевдонимы с учётом формата из HMAC по исходному значению и затравке для каждой сессии. Она запечатывает сопоставление “оригинал — псевдоним” в состоянии покоя с помощью AES-256-GCM под версионированным ключом. Это не анонимизация, и её нельзя представлять как необратимую.

PHP Standard Recommendation 14 (PSR-14) — это стандарт PHP Framework Interop Group (PHP-FIG), который определяет диспетчер событий, провайдер слушателей и останавливаемые события. Модуль Event NextPDF следует этой модели и объявляет интерфейсы, совместимые по принципу утиной типизации, поэтому движок не имеет зависимости времени выполнения от psr/event-dispatcher.

PHP Standard Recommendation 20 (PSR-20) — это стандарт PHP-FIG, который определяет интерфейс часов; его единственная операция чтения возвращает текущее время как неизменяемое значение даты-времени. NextPDF SystemClock реализует этот стандарт; внедрение фиксированных часов устраняет недетерминизм настенных часов из воспроизводимого вывода.

Хранимый против потокового описывает, строит ли отрисовщик представление всего документа в памяти перед выдачей вывода (хранимый) или обрабатывает токены по мере их поступления (потоковый). NextPDF работает в потоковом режиме на всём протяжении процесса, тогда как конкурирующие движки, такие как dompdf, являются хранимыми.

Утверждение об отзыве — это сообщение о статусе сертификата, которое предоставляет ответчик OCSP или CRL и которое встраивается для уровней подписи с долгосрочной проверкой. NextPDF не трактует неуспешный ответ OCSP как положительное утверждение о доверии; статус unknown или error никогда не повышается до good.

Метка времени RFC 3161 — это TimeStampToken, который Time-Stamping Authority выпускает над хешем данных, для которых проставляется метка времени. PAdES B-T использует её, чтобы привязать подпись к проверяемому моменту. NextPDF встраивает её как объект CMS SignedData внутри неподписанного атрибута в сведениях о подписанте.

PDF с возможностью поиска несёт невидимый текстовый слой поверх изображений страниц отсканированного документа, так что на странице можно выделять текст и искать по нему. NextPDF Enterprise оркестрирует это, управляя внедрённым бэкендом OCR, а растеризация и внедрение текста делегируются отдельному сайдкару. Результат — производный документ: существующие подписи становятся недействительными, и соответствие необходимо проверить повторно. Эта функция не гарантирует ни точности OCR, ни полноты извлечения.

Однопроходная потоковая обработка — это модель отрисовки конвейера HTML (ADR-001), в которой токенизатор создаёт список токенов за один проход, а парсер потребляет его слева направо и выдаёт операторы потока содержимого без построения хранимого дерева Document Object Model (DOM). Память на стороне ввода ограничена глубиной вложенности, а не числом элементов, с жёстким пределом на общее число элементов. Опережающий просмотр использует ограниченные массивы индексов предварительного сканирования, а не хранимый DOM.

Останавливаемое событие — это событие жизненного цикла, которое слушатель может остановить: вызов stopPropagation() заставляет диспетчер пропустить остальных слушателей в этом цикле диспетчеризации. Каждое событие жизненного цикла NextPDF является останавливаемым, потому что AbstractEvent реализует StoppableEventInterface и отражает семантику останавливаемых событий PSR-14.

Дерево структуры — это дерево семантических элементов, которое задаёт тегированному PDF логический порядок чтения и доступную структуру. Оно укоренено в каталоге документа под /StructTreeRoot. NextPDF строит дерево структуры на лету, пока токены проходят через конвейер HTML.

Тегированный PDF несёт параллельное логическое дерево структуры наряду с визуальным потоком содержимого, так что вспомогательные технологии читают структуру, а не визуальный макет, согласно разделу 14.7 ISO 32000-2.

Типизированный wither — это специальный типобезопасный метод копирования на неизменяемом объекте, например Config::withPageSize(), который воссоздаёт объект с именованными аргументами и возвращает новый экземпляр. NextPDF использует типизированные withers вместо обобщённого сеттера with(string, mixed), чтобы статический анализ и integrated development environments (IDEs) оставались точными.

Объект-значение — это неизменяемый доменный примитив с равенством по значению, без идентичности и без input/output (I/O). NextPDF моделирует геометрию, такую как PageSize, Dimension, Position и Margin, как финальные readonly объекты-значения, поэтому экземпляры можно безопасно использовать совместно. Каждое преобразование возвращает новый экземпляр.

Словарь Validation-Related Information (VRI) в составе Document Security Store сопоставляет хеш конкретной подписи с сертификатами, CRLs и ответами OCSP, использованными для её проверки в момент долгосрочного дополнения. Он необязателен, но рекомендуется для архивных верификаторов.