İçeriğe geç

Veri işleme, PII ve telemetri

Bu sayfa, çekirdek motorun verileri nasıl işlediğini açıklar: neyi okuduğunu, süreç belleğinde neyi tuttuğunu, neyi yazdığını, denetim paketlerine uyguladığı deterministik kişisel olarak tanımlanabilir bilgi (PII) temizleme dönüşümünü ve isteğe bağlı telemetri yolunun nasıl çalıştığını.

Sınır. Bu sayfa kitaplık davranışını açıklar. Dağıtım düzeyindeki veri ikameti; belgelerinizin hangi yargı bölgesinde işlendiğini, geçici dosyaların nerede saklandığını, çıktının ne kadar süre tutulduğunu ve varsa span’leri hangi telemetri arka ucunun aldığını kapsar. Bu seçimler, kitaplığın değil entegratörün sorumluluğundadır. Motor, size güvenli kapanan (fail-closed) varsayılanlar ve bir temizleme dönüşümü sağlar. Sizin yerinize veri ikameti veya yasal dayanak kararı veremez.

Terminal window
composer require nextpdf/core:^3

PII temizleyicisi ve telemetri yakalayıcısı, core paketinin bir parçasıdır. Bir OpenTelemetry SDK mevcut olmadıkça ve çağıran taraf yakalayıcıyı bağlamadıkça telemetri yolu etkinleşmez.

Motor, kendisine verdiğiniz veriler için ISO/IEC 29100 anlamında bir işleyici olarak hareket eder (iso_iec_29100#3.x56): belge içeriği üzerinde entegratörün talimatı doğrultusunda çalışır. Kendi sunucusuna bilgi göndermez, içeriği istediğiniz çıktının ötesinde kalıcı hale getirmez veya belge içeriğini NextPDF tarafından işletilen herhangi bir uç noktaya iletmez.

Üç veri yüzeyi önem taşır:

  1. Belge input/output (I/O). Motor, sağladığınız yoldan veya akıştan girdiyi okur ve sağladığınız yola veya akışa çıktıyı yazar. Geçici arabellekler, işleme süresi boyunca süreç belleğinde kalır ve işleme tamamlandığında serbest bırakılır.
  2. Denetim paketleri. Denetim etkinleştirildiğinde motor, bir tanılama paketi üretebilir. Serileştirmeden önce bu paket, deterministik bir PII temizleyicisinden geçer.
  3. Telemetri. İsteğe bağlı bir OpenTelemetry yakalayıcısı, span’ler ve metrikler üretebilir. SDK kurulup yakalayıcı oluşturulmadıkça kapalı kalır; span öznitelikleri bir öznitelik temizleyicisinden geçer.

Gizlilik duruşu, GDPR Madde 32’nin sözde anonimleştirme ve en aza indirmenin örnek koruma önlemleri olduğu ilkesini izler. Bu koruma önlemlerini uygulamak, denetleyicinin sorumluluğundadır (eu_gdpr#x50). Kitaplık, temizleme mekanizmasını sağlar. Yasal dayanak, saklama süresi ve ikamet konusunda denetleyici karar verir.

Bu sayfa, denetim veya telemetri API’lerini yeniden belgelemez (bkz. /modules/core/audit/). Güvenlikle ilgili bileşenler, denetim paketlerine uygulanan varsayılan PII temizleyicisi ile OpenTelemetry yakalayıcısının öznitelik temizleyicisidir. Aşağıdaki bölümler, bunların imzalarını değil etkilerini açıklar.

Varsayılan olarak, siz istemedikçe süreç dışına hiçbir şey çıkmaz. Ağ çıkışını etkinleştiren herhangi bir kod yoktur; kod eklememek varsayılan durumdur:

<?php
declare(strict_types=1);
require_once __DIR__ . '/vendor/autoload.php';
use NextPDF\Core\Document;
// Input read from disk, output written to disk. No telemetry SDK loaded,
// so the telemetry path completes in sub-microsecond no-ops. No content
// is transmitted anywhere.
$doc = Document::open('input.pdf');
$doc->save('output.pdf');

Bir denetim paketi üretildiğinde deterministik PII temizleyicisi, serileştirmeden önce yaygın kategorileri maskeler. Dönüşüm saftır (zamana bağımlılık yok, rastgelelik yok); bu nedenle bir paket, belirli bir giriş için bayt düzeyinde kararlıdır:

<?php
declare(strict_types=1);
require_once __DIR__ . '/vendor/autoload.php';
use NextPDF\Audit\DefaultPiiSanitiser;
$scrubber = new DefaultPiiSanitiser();
// E-mail → [EMAIL], IPv4 → [IPV4], IPv6 → [IPV6], X.500 DN attributes
// beyond CN → keyword preserved, value [REDACTED]. Deterministic.
$safe = $scrubber->sanitise($rawAuditField);
  • Temizleyici, bir garanti değil en iyi çaba esasına dayanır. DefaultPiiSanitiser, bildiği kategorileri maskeler: RFC 5321 e-posta adresleri, IPv4/IPv6 ve birkaç RFC 4514 ayırt edici ad (DN) özniteliği. Bu desenlerin dışında kalan bir ad veya tanımlayıcı içeren serbest metin alanı maskelenmez. Temizleyiciyi, operatörün inceleme görevini ortadan kaldıran bir uyumluluk denetimi olarak değil, derinlemesine savunma katmanı olarak değerlendirin.
  • Geçici dosyalar, dağıtımın sorumluluğundadır. Motor, güvenli geçici dosya işleme kullanır. TMPDIR’ınızın nerede bulunduğu ve TMPDIR’ın doğru yargı bölgesinde şifreli depolamada olup olmadığı, dağıtım kararlarıdır. Kitaplık, veri ikametini zorunlu kılamaz.
  • Telemetri isteğe bağlıdır ve temizlenir; risksiz değildir. Bağlandığında OpenTelemetry yakalayıcısı, span özniteliklerini sıfır güven veri ilkesi uygulayan bir öznitelik temizleyicisinden geçirir. Verileri dışa aktardığınız arka uç, saklama süresi ve konum tamamen entegratörün tercihidir.
  • Yasal dayanak, kitaplığın vereceği bir karar değildir. Belirli bir belgenin işlenmesinin GDPR / yerel hukuk kapsamında yasal olup olmadığını ve hangi dayanağa göre yasal olduğunu denetleyici belirler (eu_gdpr#x50); kitaplığın buna görünürlüğü yoktur.

PII temizleyicisi, I/O içermeyen saf regex dönüşümleri kullanır. Telemetri yakalayıcısı, oluşturma sırasında SDK’nın varlığını bir kez denetler ve sonucu önbelleğe alır. Hiçbir SDK kurulu olmadığında her telemetri çağrısı mikrosaniyenin altında bir sürede tamamlanır; bu nedenle gizliliği koruyan varsayılan (telemetri kapalı), aynı zamanda ek yükü sıfır olan varsayılandır.

İnceleyenler için veri işleme sınırlarıyla ilgili kurallar şunlardır:

  1. Gizli veri çıkışı yoktur. Motor, NextPDF tarafından işletilen herhangi bir uç noktaya hiçbir belge içeriği iletmez. Giden ağ erişimi yalnızca açıkça etkinleştirilmiş, şema ile kısıtlanmış kaynak getirme işlemlerinde ve yapılandırılmış zaman damgası yetkilisi (TSA), Çevrimiçi Sertifika Durumu Protokolü (OCSP) ve sertifika iptal listesi (CRL) uç noktalarında gerçekleşir; bunların her biri sunucu tarafı istek sahteciliği (SSRF) korumasının arkasındadır.
  2. Deterministik, sınırlı temizleme. Denetim paketi PII dönüşümü deterministiktir ve serileştirmeden önce çalışır. Bu, GDPR Madde 32 ruhuna uygun bir en aza indirme yardımcısıdır (eu_gdpr#x50), anonimleştirmenin bir belgelendirmesi değildir.
  3. İkamet, entegratörün sorumluluğundadır. Verilerin nerede işlendiğinin envanteri ve eşlemesi, NIST Privacy framework uyarınca kurumsal etkinliklerdir (nist_privacy_framework_1_1#x9.x1.p3); kitaplık denetimleri sunar, eşlemeyi ise entegratör gerçekleştirir.
  4. Roller dışsaldır. Dağıtımın bir denetleyici mi yoksa işleyici mi olduğu ve hangi yükümlülüklerin geçerli olduğu, kitaplığın yapamayacağı bir ISO/IEC 29100 rol belirlemesidir (iso_iec_29100#3.x56).

Bu, bir uyumluluk profili değildir. Bu sayfa, kitaplık davranışı ile denetleyici sorumluluğu arasındaki sınırı belirlemek amacıyla GDPR Madde 32’ye, ISO/IEC 29100’e ve NIST Privacy framework’e atıfta bulunur. GDPR uyumluluğu, ISO/IEC 29100 uygunluğu veya herhangi bir gizlilik belgelendirmesi iddiasında bulunmaz. Bu belirlemeleri kitaplık değil, veri denetleyicisi dağıtım düzeyinde yapar.