Motor de anonimização / pseudoanonimização

Está previsto o desenvolvimento de um motor de anonimização que garanta a (pseudo)anonimização dos dados ingeridos ou exportados pelo datalake. Tendo em conta o estado da arte em (pseudo)anonimização, o motor deverá implementar um conjunto de funcionalidades que permitam facilitar a partilha e a análise de dados em ambientes de datalake. Por exemplo, a implementação de mecanismos facilitadores para a aplicação de soluções de Federated Learning. O motor deverá ainda ser construído de forma modular a fim de permitir o seu uso em (pseudo) anonimizações pontuais (e.g., projetos de pesquisa), (pseudo) anonimizações contínuas (e.g., biobancos) ou como plugin do sistema fonte (para anonimização na fonte). Por fim, deverá ser capaz de lidar com diferentes tipos de dados, tanto no domínio dos dados estruturados quanto nos dados não estruturados. Esse produto será utilizado em pipelines de (pseudo)anonimização que visam remover ou substituir (no caso de pseudônimos) dados identificadores e sensíveis, ajudando a cumprir a legislação aplicável (por exemplo, o RGPD).

Data de Início

3 de Janeiro de 2023

Data de Fim

31 de Dezembro de 2025

Grau de Realização

Última atualização: 1 de Outubro de 2024