Pseudoanonimizacja danych: dwie warstwy ochrony prywatności pacjenta
Twój terapeuta wie o tobie rzeczy, których nie piszesz nigdzie indziej.
Gdy platforma AI analizuje te rozmowy; co dokładnie jest przesyłane do modelu?
W TherapySupport postawiliśmy sobie to pytanie wprost. Bez dodatkowego zabezpieczenia do Azure OpenAI trafiałyby imiona pacjentów, numery telefonów, numery PESEL, adresy; wszystko w jednym żądaniu do modelu.
Zbudowaliśmy więc dwuwarstwowy system ochrony danych, zgodny z wymogami RODO oraz standardami HIPAA i SOC 2.
Warstwa pierwsza - szyfrowanie w bazie danych
Wszystkie dane pacjentów są przechowywane z wykorzystaniem mechanizmu Always Encrypted w SQL Server. Oznacza to, że nawet administrator bazy danych nie ma dostępu do treści kolumn zawierających dane wrażliwe. Klucze szyfrowania pozostają wyłącznie w Azure Key Vault i nigdy nie opuszczają zaufanego środowiska.
Warstwa druga - pseudonimizacja przed przesłaniem do AI
Zanim transkrypcja sesji zostanie przesłana do modelu AI, przechodzi przez trzy warstwy weryfikacji. System identyfikuje dane z profilu pacjenta, rozpoznaje osoby trzecie wspomniane podczas rozmowy; partnerów, współpracowników; oraz wykrywa numery telefonów i adresy.
Każda zidentyfikowana osoba otrzymuje pseudonim. Jan Kowalski staje się [PACJENT]. Anna, koleżanka z pracy; [OSOBA_1]. Do modelu trafia spójna historia sesji, jednak bez żadnego prawdziwego imienia, numeru ani adresu.
Model AI otrzymuje pełny kontekst kliniczny. Terapeuta otrzymuje rzetelną analizę. Dane pacjenta pozostają w naszym systemie.

Dlaczego dwie warstwy, nie jedna
Szyfrowanie chroni dane w spoczynku; w bazie danych. Pseudonimizacja chroni dane w ruchu; w prompcie, w logach, w embeddingach przesyłanych do modelu. To dwa niezależne mechanizmy rozwiązujące dwa różne problemy. Żaden z nich nie zastępuje drugiego.
W obszarze zdrowia psychicznego naruszenie prywatności oznacza konkretną krzywdę wyrządzoną konkretnemu człowiekowi; w chwili, gdy jest on najbardziej narażony. Dlatego każda warstwa ochrony ma znaczenie.
#RODO #HIPAA #SOC2 #AI #HealthTech #Prywatność #Pseudonimizacja #Microsoft #AlwaysEncrypted #SQLServer #TherapySupport