Bỏ qua để đến nội dung

Bảng thuật ngữ

Bảng thuật ngữ này định nghĩa các thuật ngữ NextPDF xuất hiện trong toàn bộ tài liệu, bao gồm hồ sơ chữ ký, chế độ mã hóa, các lớp của pipeline HyperText Markup Language (HTML), cấu trúc hỗ trợ khả năng truy cập, mô hình sự kiện và thao tác quyền riêng tư trong các phiên bản thương mại. Mỗi thuật ngữ có neo riêng, nên các trang khác có thể liên kết trực tiếp đến định nghĩa tương ứng. Các định nghĩa diễn giải lại bảng thuật ngữ chuẩn đã ký và những tiêu chuẩn mà NextPDF triển khai; hãy tham khảo tiêu chuẩn được trích dẫn khi bạn cần câu chữ quy phạm chính xác.

Advanced Encryption Standard in Galois/Counter Mode (AES-GCM) là chế độ mã hóa có xác thực, kết hợp AES ở chế độ counter với mã xác thực thông điệp dựa trên trường Galois để cung cấp tính bảo mật và tính toàn vẹn trong một lượt. ISO 32000-2 giới thiệu chế độ này thông qua ISO/TS 32002 như một sơ đồ mã hóa có xác thực được ưu tiên, thay thế cho Advanced Encryption Standard Cipher Block Chaining (AES-CBC).

Giải mã có xác thực xác minh thẻ toàn vẹn trước khi trả về văn bản gốc. NextPDF tách riêng lỗi giải mã mang tính cấu trúc, chẳng hạn như sự cố cấu hình hoặc truyền tải, với trường hợp kiểm tra toàn vẹn thất bại khi nội dung không xác minh được. Hệ thống phân nhánh theo lớp ngoại lệ thay vì gộp hai điều kiện thành một.

CMS Advanced Electronic Signatures (CAdES) là họ hồ sơ chữ ký của European Telecommunications Standards Institute (ETSI) dành cho nội dung nhị phân tùy ý, được định nghĩa bởi ETSI EN 319 122. CAdES dựa trên cấu trúc Request for Comments (RFC) 5652 Cryptographic Message Syntax (CMS), cùng các thuộc tính cho dấu thời gian và xác thực dài hạn. PDF Advanced Electronic Signatures (PAdES) sử dụng mô hình thuộc tính CAdES và nhúng mô hình đó vào bên trong từ điển chữ ký Portable Document Format (PDF).

Phạm vi hỗ trợ Chinese, Japanese, and Korean (CJK) là tỷ lệ các khối Unicode mà một hệ chữ viết CJK cần có trong bản đồ Unicode của một phông chữ. NextPDF ước tính phạm vi hỗ trợ bằng cách lấy mẫu các điểm mã và đánh dấu các khối dưới ngưỡng 50 phần trăm là khoảng thiếu. Con số này hỗ trợ việc chọn phông chữ; đây không phải là kiểm toán chính xác đến từng byte.

Cryptographic Message Syntax (CMS) là vùng chứa chữ ký RFC 5652 bao bọc cấu trúc signed-data được CAdES và PAdES sử dụng. NextPDF phát ra các blob CMS SignedData và nhúng chúng làm Contents của từ điển chữ ký PDF.

Ngoại lệ nhận biết ngữ cảnh là ngoại lệ của NextPDF triển khai ContextAwareExceptionInterface và cung cấp phương thức getContext(). Phương thức này trả về một bản đồ snake_case gồm các trường chẩn đoán nguyên thủy mà bạn có thể tuần tự hóa vào bản ghi nhật ký hoặc payload application performance monitoring (APM) mà không cần phân tích chuỗi thông điệp.

Bảng tham chiếu chéo ánh xạ từng số đối tượng gián tiếp ở cuối một tệp PDF tới byte offset tương ứng. NextPDF ưu tiên các luồng tham chiếu chéo, dạng PDF 2.0, vì chúng nén tốt hơn và tích hợp gọn gàng với các luồng đối tượng.

Mô-đun Cascading Style Sheets (CSS) là sản phẩm công việc của World Wide Web Consortium (W3C) định nghĩa một phần của CSS, chẳng hạn như Selectors, Values, Fonts hoặc Flexbox. Pipeline HTML của NextPDF triển khai một tập con được chọn lọc từ các mô-đun CSS, gắn với các phiên bản Editor’s Draft cố định và được ghi lại trong kiểm toán phạm vi hỗ trợ CSS.

Khử nhận dạng là quá trình chung nhằm loại bỏ hoặc giảm bớt liên kết giữa dữ liệu và người liên quan đến dữ liệu đó. NextPDF Enterprise thực hiện khử nhận dạng theo phạm vi mẫu thông qua biên tập che, ẩn dòng hoặc giả danh hóa có thể đảo ngược. Đây không phải là ẩn danh hóa và không loại bỏ rủi ro tái nhận dạng còn sót lại. Các thuộc tính còn lại vẫn có thể mang rủi ro.

Chính sách suy giảm quyết định NextPDF sẽ làm gì khi một khả năng chạy ở chế độ suy giảm. Chính sách nghiêm ngặt ném ngoại lệ khi có tác động về tuân thủ, ngữ nghĩa hoặc tác động chặn. Chính sách cân bằng chỉ ném ngoại lệ khi có tác động chặn. Chính sách dễ dãi ghi lại một cảnh báo và không bao giờ ném ngoại lệ.

Data encryption key (DEK) là khóa có phạm vi theo bộ sưu tập, với siêu dữ liệu được nhà máy nhà cung cấp key management system (KMS) trả về. Nhà cung cấp cục bộ Enterprise dẫn xuất khóa này bằng HKDF-SHA256 và chỉ trả về siêu dữ liệu, không bao giờ trả về các byte khóa thô.

Document Security Store (DSS) là mục danh mục PDF 2.0 tập hợp chứng chỉ, danh sách thu hồi chứng chỉ (CRL), phản hồi Online Certificate Status Protocol (OCSP) và token dấu thời gian cần thiết để xác thực mọi chữ ký trong tài liệu. PAdES B-LT và B-LTA điền dữ liệu vào DSS, còn các trình xác thực tham vấn DSS trước khi kết nối ra mạng.

Chế độ Federal Information Processing Standards (FIPS) là trạng thái cấu hình trong đó NextPDF Core chạy dựa trên một bản dựng OpenSSL của máy chủ đã nạp nhà cung cấp được xác thực FIPS. Bản thân NextPDF không được chứng nhận FIPS; chế độ này ràng buộc các primitive mà Core gọi để nhà cung cấp được xác thực xử lý công việc mật mã. Một phép thăm dò ba trạng thái theo nỗ lực tốt nhất báo cáo trạng thái của máy chủ là đang hoạt động, vắng mặt hoặc không xác định, và xem không xác định là chưa được chứng minh.

Tạo tập con phông chữ xây dựng một chương trình phông chữ rút gọn, chỉ chứa các glyph mà tài liệu tham chiếu đến. Quá trình này xây dựng lại các bảng phông chữ cần thiết và bảo toàn cách đánh số glyph gốc để một Identity CIDToGIDMap vẫn hợp lệ. Tạo tập con là tên của thao tác; tập con phông chữ là tên của chương trình kết quả.

Hash-based Message Authentication Code (HMAC)-based Key Derivation Function (HKDF) là hàm dẫn xuất khóa mà nhà cung cấp KMS cục bộ Enterprise sử dụng, ở dạng HKDF-SHA256, để dẫn xuất một data encryption key riêng cho bộ sưu tập từ khóa gốc được cấu hình.

Hardware security module (HSM) là thiết bị chống giả mạo, lưu trữ khóa riêng và thực hiện việc ký mà không bao giờ để lộ khóa ra bộ nhớ máy chủ. NextPDF Enterprise tích hợp với các hardware security module thông qua lớp trừu tượng Public-Key Cryptography Standards #11 (PKCS#11) và mô hình trình điều khiển controller/worker.

Pipeline html là pipeline kết xuất bốn lớp nằm dưới src/Html/, chuyển đổi HTML và CSS thành các luồng nội dung PDF. Các lớp của pipeline này gồm phân tích CSS, trạng thái kiểu, bố cục và vẽ (ADR-010). Đây là hệ thống con lớn nhất và có rủi ro cao nhất của engine.

Cập nhật gia tăng là bản sửa đổi PDF được nối vào sau các byte gốc, giữ nguyên nội dung trước đó để các chữ ký hiện có vẫn hợp lệ.

Key management system (KMS) là kho khóa được lưu trữ trên đám mây, chẳng hạn như AWS KMS, Google Cloud KMS hoặc Azure Key Vault, ký thay mặt cho một người thuê bằng các khóa mà nó không bao giờ giải phóng. NextPDF Enterprise xem key management system là một backend trình ký trì hoãn thay thế bên cạnh các hardware security module.

Bố cục là lớp thứ ba của pipeline HTML bốn lớp ADR-010. Lớp này tính toán vị trí và kích thước hộp từ các kiểu đã giải quyết, tạo kế hoạch vẽ và không bao giờ phát ra trực tiếp các toán tử PDF. Nó nằm dưới các trình trợ giúp bố cục flex, float, context và bảng trong src/Html/.

Thành phần NextPDF\Event\ListenerProvider ánh xạ một lớp sự kiện tới danh sách các callable listener được sắp xếp theo độ ưu tiên. Thành phần này duyệt cây phân cấp lớp và các interface của sự kiện để một listener đăng ký trên kiểu cha có thể quan sát mọi kiểu con. Trạng thái của nó có phạm vi theo thể hiện, không có trạng thái tĩnh, nên các worker vẫn được cô lập.

Long-term validation (LTV) là thuộc tính của một PDF đã ký, cho phép chữ ký vẫn có thể xác minh vô thời hạn ngay cả sau khi thông tin xác thực của người ký hết hạn hoặc các dịch vụ thu hồi biến mất. NextPDF đạt được điều này bằng cách thu thập tài liệu thu hồi trong Document Security Store và làm mới các dấu thời gian lưu trữ trước khi thuật toán của từng dấu thời gian trước đó suy yếu.

Optical character recognition (OCR) biến hình ảnh trang thành văn bản máy đọc được. Đây là một loại bài toán tách biệt với việc tạo PDF. NextPDF tạo và kiểm tra cấu trúc tài liệu thay vì diễn giải pixel thành ý nghĩa, nên công việc OCR thuộc về một pipeline chuyên dụng.

Output intent là mục danh mục PDF khai báo điều kiện đầu ra dự kiến cho tài liệu, thường là hồ sơ International Color Consortium (ICC) đặc trưng hóa thiết bị in mục tiêu hoặc không gian màu hiển thị. PDF/A-4 yêu cầu mục này cho các tài liệu sử dụng màu phụ thuộc thiết bị, còn các hồ sơ PDF/X yêu cầu nó để khai báo điều kiện in.

PDF Advanced Electronic Signatures (PAdES) là họ hồ sơ chữ ký ETSI dành cho tài liệu PDF, được định nghĩa bởi ETSI EN 319 142. PAdES dựa trên CMS và CAdES với các quy tắc mã hóa dành riêng cho PDF. Nó gồm bốn mức cơ sở (B-B, B-T, B-LT, B-LTA), lần lượt bổ sung dấu thời gian và tài liệu xác thực dài hạn vào chữ ký được nhúng.

PAdES B-T là mức cơ sở PAdES bổ sung một token dấu thời gian RFC 3161 trên giá trị chữ ký, chứng minh chữ ký đã tồn tại tại thời điểm được đóng dấu thời gian. Mức này dựa trực tiếp trên PAdES B-B.

Mức PAdES là bậc tuân thủ chữ ký, ví dụ B-B, B-T, B-LT hoặc B-LTA, xác định tài liệu mà một chữ ký mang theo. NextPDF thất bại đóng (fail closed) khi một mức được yêu cầu không thể đạt tới, ném ra SignatureLevelUnreachableException thay vì âm thầm tạo một mức thấp hơn trong khi quảng bá mức cao hơn.

Vẽ là lớp thứ tư của pipeline HTML bốn lớp ADR-010. Lớp này tiêu thụ kế hoạch vẽ từ bố cục và phát ra các toán tử PDF thông qua trình ghi. Đây là lớp duy nhất được phép gọi vào các primitive vẽ.

Cờ quyền là trường bit trong từ điển mã hóa PDF, kiểm soát các thao tác mà một trình đọc đã xác thực có thể thực hiện: in độ phân giải thấp hoặc cao, sao chép nội dung, sửa đổi chú thích, điền biểu mẫu và lắp ghép. Tác giả tài liệu đặt trường này khi mã hóa bằng mật khẩu người dùng hoặc chứng chỉ. NextPDF cung cấp một value object PermissionFlags có kiểu.

Personally identifiable information (PII) là bất kỳ dữ liệu nào tự nó, hoặc khi kết hợp với thông tin khác, có thể nhận dạng một thể nhân, bao gồm tên, địa chỉ, mã số thuế, dữ liệu sinh trắc học và địa chỉ email. Tính năng biên tập che của NextPDF Pro loại bỏ không thể khôi phục các vùng PII khỏi một PDF để không công cụ hạ nguồn nào có thể khôi phục dữ liệu.

Public-Key Cryptography Standards #11 (PKCS#11) là giao diện token mật mã của OASIS, hiện ở phiên bản 3.1, cung cấp cho ứng dụng một application programming interface (API) ổn định để giao tiếp với các hardware security module và thẻ thông minh. Hệ thống con trình ký - trình điều khiển của NextPDF Enterprise sử dụng PKCS#11 làm đường dẫn mẫu số chung nhỏ nhất tới các khóa phần cứng.

Giả danh hóa thay thế một giá trị nhận dạng bằng một bí danh. Theo định nghĩa, quá trình này có thể đảo ngược và sử dụng một ánh xạ được giữ riêng. NextPDF Enterprise dẫn xuất các bí danh xác định, nhận biết định dạng từ một HMAC trên giá trị gốc và một seed theo phiên. Hệ thống niêm phong ánh xạ gốc-sang-bí-danh khi lưu trữ bằng AES-256-GCM dưới một khóa có phiên bản. Đây không phải là ẩn danh hóa và không được trình bày như là không thể đảo ngược.

PHP Standard Recommendation 14 (PSR-14) là tiêu chuẩn của PHP Framework Interop Group (PHP-FIG), định nghĩa trình điều phối sự kiện, nhà cung cấp listener và các sự kiện có thể dừng. Mô-đun Event của NextPDF tuân theo mô hình này và khai báo các interface tương thích kiểu duck-type, nên engine không mang phụ thuộc lúc chạy psr/event-dispatcher.

PHP Standard Recommendation 20 (PSR-20) là tiêu chuẩn của PHP-FIG, định nghĩa một interface đồng hồ mà thao tác đọc duy nhất trả về thời gian hiện tại dưới dạng giá trị ngày-giờ bất biến. NextPDF SystemClock triển khai interface này; việc tiêm một đồng hồ cố định loại bỏ tính không xác định theo thời gian thực khỏi đầu ra có thể tái lập.

Giữ trong bộ nhớ so với truyền luồng mô tả việc một trình kết xuất xây dựng biểu diễn trong bộ nhớ của toàn bộ tài liệu trước khi phát ra đầu ra (giữ trong bộ nhớ), hay xử lý các token khi chúng đến (truyền luồng). NextPDF truyền luồng từ đầu đến cuối, trong khi các engine cạnh tranh chẳng hạn như dompdf thì giữ trong bộ nhớ.

Khẳng định thu hồi là tuyên bố trạng thái chứng chỉ do trình phản hồi OCSP hoặc CRL cung cấp, được nhúng cho các mức chữ ký xác thực dài hạn. NextPDF từ chối xem một phản hồi OCSP không thành công như một khẳng định tin cậy tích cực; trạng thái unknown hoặc error không bao giờ được nâng lên thành good.

Dấu thời gian RFC 3161 là một TimeStampToken mà Time-Stamping Authority phát hành trên hàm băm của dữ liệu đang được đóng dấu thời gian. PAdES B-T sử dụng dấu thời gian này để gắn một chữ ký với một thời điểm có thể xác minh. NextPDF nhúng nó như một blob CMS SignedData bên trong một thuộc tính chưa ký trên thông tin người ký.

PDF có thể tìm kiếm mang một lớp văn bản vô hình trên hình ảnh trang của tài liệu được quét, nên trang có thể được chọn và tìm kiếm dưới dạng văn bản. NextPDF Enterprise điều phối việc này bằng cách điều khiển một backend OCR được tiêm, với việc raster hóa và tiêm văn bản được ủy thác cho một sidecar riêng. Kết quả là một tài liệu dẫn xuất: các chữ ký hiện có bị vô hiệu và sự tuân thủ phải được xác thực lại. Tính năng này không khẳng định bất kỳ độ chính xác OCR hoặc khả năng trích xuất nào.

Truyền luồng một lượt là mô hình kết xuất pipeline HTML (ADR-001) trong đó trình token hóa tạo danh sách token trong một lượt, còn trình phân tích tiêu thụ danh sách đó từ trái sang phải và phát ra các toán tử luồng nội dung mà không xây dựng cây Document Object Model (DOM) được giữ trong bộ nhớ. Bộ nhớ phía đầu vào bị giới hạn bởi độ sâu lồng nhau thay vì số lượng phần tử, với một giới hạn cứng trên tổng số phần tử. Việc nhìn trước (lookahead) sử dụng các mảng chỉ mục tiền quét có giới hạn, không phải một DOM được giữ trong bộ nhớ.

Sự kiện có thể dừng là sự kiện vòng đời mà một listener có thể chặn lại: gọi stopPropagation() khiến trình điều phối bỏ qua các listener còn lại trong chu kỳ điều phối đó. Mọi sự kiện vòng đời của NextPDF đều có thể dừng vì AbstractEvent triển khai StoppableEventInterface, phản chiếu ngữ nghĩa sự kiện có thể dừng của PSR-14.

Cây cấu trúc là cây các phần tử ngữ nghĩa, cung cấp cho một PDF có thẻ thứ tự đọc logic và cấu trúc hỗ trợ khả năng truy cập. Cây này được đặt gốc tại danh mục tài liệu dưới /StructTreeRoot. NextPDF xây dựng cây cấu trúc tại chỗ trong khi các token chảy qua pipeline HTML.

PDF có thẻ mang một cây cấu trúc logic song song bên cạnh luồng nội dung trực quan, nên công nghệ trợ giúp đọc cấu trúc thay vì bố cục trực quan, theo ISO 32000-2 mục 14.7.

Typed wither là phương thức sao chép chuyên dụng, an toàn về kiểu trên một đối tượng bất biến; ví dụ Config::withPageSize() dựng lại đối tượng với các đối số có tên và trả về một thể hiện mới. NextPDF sử dụng các typed wither thay vì một setter with(string, mixed) chung để phân tích tĩnh và các môi trường phát triển tích hợp (IDE) vẫn chính xác.

Value object là một domain primitive bất biến, bình đẳng theo giá trị, không có danh tính và không có input/output (I/O). NextPDF mô hình hóa hình học, chẳng hạn như PageSize, Dimension, PositionMargin, dưới dạng các value object final readonly, nên các thể hiện an toàn để chia sẻ. Mỗi phép biến đổi trả về một thể hiện mới.

Từ điển Validation-Related Information (VRI) dưới Document Security Store ánh xạ hàm băm của một chữ ký cụ thể tới các chứng chỉ, CRL và phản hồi OCSP được dùng để xác thực chữ ký đó tại thời điểm tăng cường dài hạn. VRI là tùy chọn nhưng được khuyến nghị cho các trình xác minh lưu trữ.