Dados Abertos em Saúde Pública: Transparência, Pesquisa e Limitações Éticas
Como dados abertos em saúde contribuem para transparência e pesquisa, com análise das limitações éticas, privacidade e desafios de implementação.
# Dados Abertos em Saúde Pública: Transparência, Pesquisa e Limitações Éticas
O Brasil produz volumes imensos de dados em saúde pública: internações, procedimentos, mortalidade, nascimentos, vacinação, notificações compulsórias. Parte desses dados está disponível publicamente, alimentando pesquisa, jornalismo investigativo e controle social. Mas o equilíbrio entre transparência e privacidade é delicado — e frequentemente mal resolvido.
O ecossistema de dados abertos em saúde no Brasil
Principais bases disponíveis
DATASUS / TabNet:
- SIH (Sistema de Informações Hospitalares) — internações por AIH
- SIA (Sistema de Informações Ambulatoriais) — produção ambulatorial
- SIM (Sistema de Informações sobre Mortalidade) — óbitos
- SINASC (Sistema de Informações de Nascidos Vivos) — nascimentos
- SINAN (Sistema de Informação de Agravos de Notificação) — doenças notificáveis
- SI-PNI (Sistema de Informação do Programa Nacional de Imunizações) — vacinação
Na prática: A conformidade regulatória em saúde digital não é obstáculo à inovação — é requisito que protege pacientes, profissionais e instituições de riscos evitáveis.
CNES:
- Cadastro Nacional de Estabelecimentos de Saúde
- Dados de infraestrutura, equipamentos e profissionais por estabelecimento
ANS:
- Dados de saúde suplementar
- Beneficiários, operadoras, reclamações
Plataforma de Ciência de Dados (PCDaS / Fiocruz):
- Dados integrados de múltiplas fontes
- Ferramentas de análise online
Formatos e acesso
- TabNet: interface web com consultas tabuladas
- Microdados: arquivos para download (CSV, DBF)
- APIs: acesso programático (em evolução)
- OpenDataSUS: portal de dados abertos do Ministério da Saúde
Valor dos dados abertos para pesquisa
Epidemiologia
Dados do SIM, SINASC e SINAN permitem:
- Análise de tendências de mortalidade por causa
- Identificação de clusters geográficos de doenças
- Avaliação de impacto de políticas públicas (vacinação, saneamento)
- Vigilância epidemiológica em tempo quase real
Avaliação de serviços
Dados do SIH e SIA permitem:
- Comparação de indicadores entre hospitais e regiões
- Identificação de vazios assistenciais
- Análise de tempo de permanência e reinternação
- Avaliação de acesso a procedimentos de alta complexidade
Economia da saúde
- Custo de internações por patologia
- Distribuição de recursos entre regiões
- Impacto econômico de doenças preveníveis
- Custo-efetividade de intervenções
Jornalismo e controle social
Jornalistas investigativos utilizam dados abertos para:
- Identificar desvios de recursos
- Mapear desigualdades regionais
- Monitorar filas de procedimentos
- Acompanhar cobertura vacinal
Limitações dos dados disponíveis
Qualidade e completude
- Campos obrigatórios deixados em branco ou preenchidos com "ignorado"
- Codificação incorreta de CID (diagnósticos genéricos como "outras causas")
- Subnotificação (nem tudo que acontece é registrado nos sistemas)
- Atraso na alimentação (dados disponíveis com meses de defasagem)
- Variação de qualidade entre municípios
Viés de seleção
- Dados do SIH cobrem apenas internações SUS (não inclui saúde suplementar)
- Dados ambulatoriais dependem do registro de produção (há incentivo para registrar procedimentos que geram repasse, não necessariamente tudo que é feito)
- Populações sem acesso ao sistema de saúde não aparecem em nenhuma base
Fragmentação
- Cada sistema tem sua lógica, periodicidade e granularidade
- Linkage entre bases (cruzar o mesmo paciente em diferentes sistemas) é tecnicamente difícil
- Identificadores inconsistentes entre sistemas
- Mudanças de schema ao longo do tempo dificultam séries históricas
Limitações éticas e de privacidade
Reidentificação
Mesmo dados "anonimizados" podem permitir reidentificação:
- Combinação de idade + sexo + município + diagnóstico raro pode identificar indivíduos
- Em municípios pequenos, qualquer internação específica é potencialmente identificável
- Doenças estigmatizantes (HIV, transtornos psiquiátricos, tentativa de suicídio) requerem proteção especial
O dilema granularidade versus privacidade
- Dados mais detalhados (por município, por faixa etária estreita) são mais úteis para pesquisa
- Mas são também mais facilmente reidentificáveis
- A agregação que protege a privacidade pode ocultar desigualdades locais
LGPD e dados de saúde pública
A LGPD (Lei 13.709/2018) prevê bases legais para tratamento de dados em saúde pública:
- Art. 7, inciso III: tratamento pela administração pública para políticas públicas
- Art. 11, inciso II, f: tutela da saúde em procedimento realizado por profissionais de saúde
- Art. 13: estudos em saúde pública com anonimização
Mas a lei não isenta de responsabilidade: o tratamento deve ser proporcional, necessário e com medidas de segurança.
Consentimento em dados secundários
Dados coletados no atendimento são reutilizados para fins estatísticos e epidemiológicos sem consentimento individual — isso é previsto em lei. Mas o cidadão deve ser informado sobre essa possibilidade (transparência).
Boas práticas em dados abertos de saúde
Para quem publica
- Documentação clara — dicionário de variáveis, metodologia de coleta, limitações conhecidas
- Temporalidade — data de referência e data de disponibilização
- Granularidade adequada — detalhe suficiente para análise sem permitir reidentificação
- Formato acessível — CSV, JSON, API — não apenas PDFs ou sistemas proprietários
- Regularidade — atualização em cronograma previsível
- Metadados — o que mudou entre versões, descontinuidades metodológicas
Para quem usa
- Entender limitações — dados administrativos não são dados epidemiológicos puros
- Validar achados — cruzar com outras fontes antes de publicar conclusões
- Contextualizar — subnotificação, viés de acesso e mudanças de definição afetam séries
- Ética na publicação — não publicar análises que permitam identificação
- Reconhecer incertezas — intervalos de confiança, não números absolutos
O futuro: RNDS e dados integrados
A Rede Nacional de Dados em Saúde (RNDS) promete integrar dados de saúde de múltiplas fontes (pública e privada) em um ecossistema conectado. Para dados abertos, isso pode significar:
- Dados mais completos (inclui saúde suplementar)
- Maior padronização (FHIR como linguagem comum)
- Possibilidade de análises longitudinais (seguir o paciente entre serviços)
- Mas também maiores riscos de privacidade se mal implementado
Dados abertos e equidade
O paradoxo
Dados abertos podem tanto revelar quanto perpetuar desigualdades:
- Revelar: mostrar que determinada região tem mortalidade infantil acima da média
- Perpetuar: se dados de populações marginalizadas são piores (por subnotificação), conclusões baseadas nesses dados podem subestimar necessidades
Necessidade de contextualização
Publicar dados sem contexto pode gerar interpretações prejudiciais:
- "Hospital X tem mais mortes" pode significar que atende casos mais graves, não que presta pior assistência
- "Região Y tem menos diagnósticos" pode refletir falta de acesso, não saúde melhor
Perguntas Frequentes
Quais dados do prontuário são protegidos pela LGPD?
Todos os dados que identificam ou podem identificar o paciente: nome, CPF, dados clínicos, resultados de exames, imagens médicas e até metadados de acesso. A LGPD classifica dados de saúde como "dados pessoais sensíveis", exigindo base legal específica e medidas de proteção reforçadas para qualquer tratamento.
O prontuário eletrônico precisa de consentimento do paciente pela LGPD?
Nem sempre. A base legal mais comum para o prontuário é a "tutela da saúde" (Art. 11, II, f), que não exige consentimento. Porém, usos secundários (pesquisa, compartilhamento com terceiros) podem exigir bases legais adicionais. O mapeamento de bases legais por finalidade é obrigação da instituição.
O que acontece se houver vazamento de dados do prontuário?
A instituição deve: notificar a ANPD e os titulares afetados quando houver risco relevante, investigar a causa, implementar medidas de contenção e documentar todo o processo. Sanções podem incluir multas de até 2% do faturamento (limitadas a R$ 50 milhões por infração), além de danos reputacionais e processos judiciais.
Conclusão
Dados abertos em saúde são um instrumento poderoso de transparência, pesquisa e controle social. O Brasil tem um acervo imenso de informações públicas, ainda subutilizado por pesquisadores e gestores. Porém, a publicação responsável exige equilíbrio: detalhe suficiente para análise útil, proteção adequada da privacidade individual e honestidade sobre limitações. Dados abertos são meio, não fim — o valor está no que fazemos com eles para melhorar a saúde da população.