top of page

Trabalho, Estado e Violência de gênero: Dados Públicos

Há alguns questionamentos que vou tentar responder nesse artigo e, vale ressaltar, que pode ocorrer que algum deles não sejam respondidos de uma forma clara e TÃO objetiva como eu queira, mas a ideia é responder com dados, bastante conversa e aprendizados.


E por que você está se dando o trabalho de fazer isso, Fê?

Uma forma de aprender com entusiasmo é conseguir ter uma questão de pesquisa e tentar respondê-la através dos meus conhecimentos. Estudando dessa forma eu aprendo, passo conhecimento e consigo responder (ou não) os questionamentos que faço durante conversas com amigues, em roda de conversa no trabalho e, muitas vezes, uma falha tentativa de tentar entender esse sistema tão complexo que estamos inseridos. E claro, fazer por fazer também seria uma boa resposta (rs).


Os questionamentos que venho fazendo é um recorte do atual cenário do estado do Rio Grande do Sul (RS) quando o tema é força de trabalho, segurança pública e violência contra minorias. Caso você não saiba, faz um tempinho que faço parte do time de Assessoria Técnica da Secretaria de Planejamento, Governança e Gestão do RS, apoiando decisões com dados e também colaborando com o Departamento de Economia e Estatística na divisão de Dados e Indicadores.


Haaaaa! Então é por isso que você está escrevendo sobre o tema?

Não! A decisão de escrever e analisar o tema é a constante publicação de indicadores e números absolutos SEM o devido cuidado e racialização necessária para entender o contexto. Mas, é claro que estar inserida nesse ambiente "político" dá um empurrãozinho.


Vamos lá?

Os questionamentos aos quais me refiro são:


  1. Há muitas publicações, entrevistas com pessoas do meio político, meios de comunicação SUPER tradicionais da capital Porto Alegre que enfatizam a violência de gênero, mas cá entre nós:

    1. Essa violência tem raça?

    2. Tem corpos dissidentes?

  2. Em relação aos corpos dissidentes, será que quando são estes os violentados, há estatísticas?

    1. É maior?

    2. É menor?

    3. Não é levada em consideração?

  3. Quando o assunto é relações homoafetivas, qual a porcentagem de violências desse gênero?

    1. E antes de tudo, há violência?


A que não podia faltar:

  1. O quanto a relação do trabalho afeta essas violências?

    1. Renda está correlacionada?


E a mais óbvia:

  1. Qual o papel da segurança pública?

    1. O racismo é um ponto decisor?


Eu poderia elencar V-Á-R-I-O-S outros questionamentos, mas só com esses já temos muito o que conversar e analisar. E isso significa que esse post vai ser longo e bem didático. Vai ter programação, indicação de leitura e escuta, perguntas que você mesmo vai ter que responder e, como tenho costume de dizer, o cantinho do pensamento vai ser bem visitado.


Tá, mas e os dados?

Dados a gente tem, e todos eles serão de bases públicas. Essa é chance de você aprender ou enlouquecer com eles. Eu gosto bastante da base de dados do Sistema de Informações de Agravos de Notificação (SINAN), visto que ele é alimentado pela notificação e investigação de casos de doenças e agravos que contam na lista nacional de doenças de notificação compulsória (Portaria de Consolidação n° 4, de 28 de Setembro de 2017), mas é facultado a estados e municípios incluir outros problemas de saúde importantes para a sua região. A base de dados do SINAN está disponível de 2018 a 2024, infelizmente o ano de 2025 ainda não foi divulgado. Agora preste B-E-M atenção,


  Sua utilização efetiva permite a realização do diagnóstico dinâmico da ocorrência de um evento na população, podendo fornecer subsídios para explicações causais dos agravos de notificação compulsória, além de vir a indicar riscos aos quais as pessoas estão sujeitas, contribuindo assim, para a identificação da realidade epidemiológica de determinada área geográfica. 

Fê, eu nem sabia que o SINAN tinha dados de violência, é sério isso?

SIMMMM! Trata-se de dados de grande relevância, e neste momento vou apresentar o processo de download dos dados do SINAN diretamente na IDE RStudio. De antemão, estou utilizando R version 4.5.2 (2025-10-31 ucrt). Agora, vem uma grande questão, aliás duas:


  1. Vai acompanhar pelo notebook pessoal?

  2. Ou tá aqui só pra conseguir baixar os dados no computador da empresa e continuar o seu trabalho?


No 1° você não teria grandes problemas, mas se tiver pode me mandar no linkedin, tá? Te ajudo a resolver. Já o 2° vai ter um probleminha de proxy (e, dependendo, pode não ter também). Se você tiver esse problema de proxy ou de recusa da instalação do pacote com erro de porta ao executar o código abaixo, faça a configuração necessária do GitHub com as suas credenciais. Indico o meu post e, se necessário, troca uma ideia comigo que te ajudo lá no linkedin.


install.packages("remotes")
remotes::install_github("danicat/read.dbc")

Contextualizando, a maravilhosa Daniela Petruzalek desenvolvei o pacote read.dbc com o objetivo e ação da leitura de arquivos com extensão .dbc.


E o por que disso?

Ora! Ora! Ora! Se não é o querido DATASUS que tem esse formatinho miserável (rs) de dados. Ou seja, você, em algum momento, ia se deparar com esse tipo de extensão e, uma das saídas, é utilizar esse pacote. E te adianto, apanhei um pouco pra conseguir instalar na máquina do trabalho, e sabe o por quê? Os arquivos do SINAN são em formato FTP.


FTP, do inglês File Transfer Protocol, significa Protocolo de Transferência de Arquivo. Essencialmente, um "protocolo" ou protocolo de internet é um conjunto de procedimentos ou regras que permitem que dispositivos eletrônicos se comuniquem entre si

Pois é, a gente ainda tem essa missão e é por isso que tive tanto problema com proxy e/ou permissão de portas/acesso. Para a leitura dos dados do ano 2024, o link ftp é:


Esse link você consegue aproximando o cursos encima do nome VIOLBR24.dbc e copiando o endereço do link.



O código para leitura em R se encontra abaixo. Veja que estou filtrando a UF igual a 43 que é referente ao estado do Rio Grande do Sul, mas você pode usar o BR ou a do estado que você interesse. A lista de códigos você pode ver aqui.


ftp_url <- "ftp://ftp.datasus.gov.br/dissemin/publicos/SINAN/DADOS/FINAIS/VIOLBR18.dbc"
destfile_sinan <- "DOBR2024.dbc"
download.file(ftp_url,  destfile_sinan, mode = "wb")
dados_2024 <- read.dbc("DOBR2024.dbc") %>% 
  dplyr::filter(SG_UF_NOT == 43)

Prontinho! Você já aprendeu a dar essa futricada e já tem dados. Salve da forma que você preferir. E atenção: a ftp é um link disponibilizado pelo IBGE e, às vezes, ele pode sair do ar. Então, de preferência, baixe os dados sem filtro e acomode os dados em um cantinho acessível. A documentação desses dados, como dicionário e questionário, se encontra na área de transferência, a construção do código vou deixar contigo, mas é idêntica do exemplo.


Agora temos uma pergunta bem importante...


Qual é a prerrogativa desses dados estarem no DATASUS?

Os dados do SINAN são preenchidos em caso suspeito ou confirmado de violência doméstica/intrafamiliar, sexual, autoprovocada, tráfico de pessoas, trabalho escravo, trabalho infantil, tortura, intervenção legal e violências homofóbicas contra mulheres e homens em todas as idades. No caso de violência extrafamiliar/comunitária, somente serão objetos de notificação as violências contra crianças, adolescentes, mulheres, pessoas idosas, pessoa com deficiência, indígenas e população LGBT.


As bases da Segurança Pública são bem diferentes. O que sabemos deles é que são processados através do Sistema de Informações Policiais (SIP), uma plataforma que integra dados e ferramentas para gestão, investigação e estratégia em segurança pública. Há dados de T-O-D-O e qualquer jeito. Dados que não tem muitas explicações, mas são bons e demonstram um pouco da realidade do estado.


E é igual em todos os estados, Fê?

Não! Mas todos são obrigados a disponibilizar os números absolutos de alguma forma. Talvez não seja tão fácil de achar aí no seu estado, mas vai no site oficial da Secretaria de Segurança Pública (SSP) e futrica até achar. E depois de futricar, dá uma olhada na Secretaria Nacional de Segurança Pública (SENASP) e veja como essa banda toca e entenda a sua hierarquização.


Aqui no Rio Grande do Sul, temos o site da SSP e conseguimos baixar dados referentes a Lei Maria da Penha. Tirei um print pra você conseguir visualizar o problema de excel com imagens e células com merge.


Fonte: Autora
Fonte: Autora

A leitura desses dados pode ser a MAIS normal de todas, sem firulas e muito requinte. É entrar no site, baixar e fazer a leitura no R. É bem o que já estamos acostumados a fazer no dia a dia OU, caso você queira um requinte, você pode "brincar" com webscrapping. Particularmente decidi trabalhar da maneira mais fácil, afinal esses dados não são alterados após a sua publicação. O máximo que pode ocorrer é a atualização dos dados referente a meses que não foram divulgados, mas, mesmo assim, eles vão publicar uma nova planilha em Excel. Sendo assim, você já vai ter em mãos os dados com informações absolutas referente a Lei Maria da Penha, certo? Mas,


Você sabe o que é a Lei N° 11.340?

Provavelmente SIM! A Lei Nº 11.340, de 7 de Agosto de 2006, popularmente conhecida como Lei Maria da Penha, é muito difundida e comentada desde a sua criação. Há argumentos contra e a favor dessa Lei, visto que ela reconhece a violência contra a mulher como violação de direitos humanos. A proposta dessa Lei é,


Criar mecanismos para coibir a violência doméstica e familiar contra a mulher, nos termos do § 8º do art. 226 da Constituição Federal, da Convenção sobre a Eliminação de Todas as Formas de Discriminação contra as Mulheres e da Convenção Interamericana para Prevenir, Punir e Erradicar a Violência contra a Mulher; dispõe sobre a criação dos Juizados de Violência Doméstica e Familiar contra a Mulher; altera os Decretos-Lei nºs 3.689, de 3 de outubro de 1941 (Código de Processo Penal), e 2.848, de 7 de dezembro de 1940 (Código Penal), e a Lei nº 7.210, de 11 de julho de 1984 (Lei de Execução Penal); e dá outras providências (Lei Maria da Penha).

É um tantão de coisa, né? E se você ler o que é a Lei em si, vai ver que é mais ainda do que ouvimos falar por aí. A violência abordada pela Lei e, de acordo com o Art. 5º, para os efeitos desta Lei, configura violência doméstica e familiar contra a mulher qualquer ação ou omissão baseada no gênero que lhe cause morte, lesão, sofrimento físico, sexual ou psicológico e dano moral ou patrimonial. O Estado também tem obrigações a cumprir com essas mulheres. O Art. 8º reforça que a política pública que visa coibir a violência doméstica e familiar contra a mulher far-se-á por meio de um conjunto articulado de ações da União, dos Estados, do Distrito Federal e dos Municípios e de ações não governamentais, tendo uma delas por diretrizes a seguinte:


  • II - a promoção de estudos e pesquisas, estatísticas e outras informações relevantes, com a perspectiva de gênero e de raça ou etnia, concernentes às causas, às consequências e à frequência da violência doméstica e familiar contra a mulher, para a sistematização de dados, a serem unificados nacionalmente, e a avaliação periódica dos resultados das medidas adotadas.


Há vários artigos e incisos extremamente importantes, mas eu quis ressaltar estes para que você entenda o porque dos dados divulgados pela SSP/RS estarem agregados entre feminicídio tentado, feminicídio consumado, ameaça, estupro e lesão corporal. Eles estão disponível desde o ano de 2018 até 2025. E você pode estar se perguntando...


Fer, e os casos de abuso psicológico e dano moral ou patrimonial?

Pois é, eles deveriam estar nesse mesmo arquivo, mas para ter acesso a esses dados, mesmo que eles façam parte da Lei Maria da Penha, nós precisamos acessar através da Lei nº 15.610/2021.


Que Lei é essa?

A Lei nº 15.610/2021 é comumente conhecida como Lei de Dados Abertos. É ela que nos dá o "poder" de ter acesso a esses dados, mas não se engane, a Lei de Dados Aberto nos dá o direito de solicitar os dados e não o de receber, ou seja, você pode solicitar e o departamento ou secretaria pode recusar o envio dos dados.


E fica por isso?

Sim! Fica por isso. Mas, aqui no Rio Grande do Sul, a Secretaria da Segurança Pública disponibiliza nesta página relatórios no formato de dados abertos, com informações de registros criminais, de forma desagregada. E a SSP RS, conforme os parâmetros da referida legislação, a publicação se dará em dois conjuntos com diferentes periodicidades: mensal (contendo as informações elencadas no artigo 3º da lei) e semestral (contendo as informações listadas no artigo 6°).


Esses artigos são:


  • Art. 3º Até o décimo quinto dia útil de cada mês, a Secretaria da Segurança Pública deverá publicar, na forma de dados abertos, todos os registros criminais realizados no mês anterior pelas polícias, seja por meio de Boletim de Ocorrência ou por Termo Circunstanciado, de forma desagregada, contendo pelo menos as seguintes informações do fato:

    • I - dia e hora;

    • II - tipo do crime ou contravenção penal;

    • III - cidade;

    • IV - local onde ocorreu;

    • V - número de vítimas;

    • VI - idade, sexo e cor das vítimas.


  • Art. 6º Sem prejuízo de outros indicadores e de informações consideradas de interesse público, constituem informações de segurança pública que deverão ser divulgadas semestralmente:

    • III - os crimes contra a mulher que caracterizam violência doméstica e familiar, segundo disposto na legislação vigente.


O Art. 6º da legislação possui 29 incisos, mas o terceiro inciso é referente aos crimes contra a mulher. Talvez você tenha se perguntado se esses dados preenchidos de uma forma catalogada, justa e, de uma certa forma, com atenção, mas sinto em lhe dizer que esse não é o caso, visto que esses registros são administrativos. Vou deixar aqui a nota metodológica.


E como são esses dados?

Novamente caímos em arquivos .xlsx. Você tem a opção de baixá-los ou de usar webscrapping. Como no último caso, vou baixar e fazer a leitura no R através do pacote readxlsx(). O Art. 6º é uma das maiores bases que temos e com informações de diversos órgãos, como: Brigada Militar (BM), Casa Civil, Instituto Geral de Perícias (IGP), Policia Civil (PC) e da Secretaria de Sistemas Penal e Socioeducativo (SSPS). O nosso interesse é na pasta da PC, mas em alguns semestres pode estar como Casa Civil.


No Art. 3º nós temos essa carinha aqui dos dados,


Fonte: Autora
Fonte: Autora


e do Art. 6°,


Fonte: Autora.
Fonte: Autora.

ou seja, tem bastante informação para filtrar. Na tabela do Art 3°, nós temos informações desde o segundo semestre de 2021, totalizando dados referentes a 48 meses desde então, ou seja, temos dados a partir do segundo semestre de 2021 e primeiro semestre 2025. O segundo semestre de 2025 ainda não foi divulgado. A ideia é conseguir empilhar todos esses dados. Você pode ver que na imagem do Art 3° temos a variável Data Fato e, através dela, vamos conseguir distinguir os anos e meses. O mesmo vai acontecer com os dados do Art 6°.


E a força de trabalho? O que T-U-D-O isso tem em comum com violência?

Eu fui por um lógica bem de senso comum, sabe? De levar a violência de gênero a questão econômica e, por isso, a Pesquisa Nacional por Amostra de Domicílios Contínua é uma base de dados M-U-I-T-O importante e que vai conseguir nos fornecer dados sobre trabalho, horas trabalhadas, educação, renda e condições de moradia. Em 2021, houve também a pesquisa anual da PNAD Contínua com o tema de Sensação de Segurança, que traz questões relacionadas a violência, agressões e policiamento.


Fer, como faz pra baixar esses dados?

Os dados da PNADc são mais complicadinhos de baixar e é necessário que você tenha um pouco computador relativamente bom, visto que a PNADc é um mini censo do trabalho e este é um tipo de base de dados que constitui um plano amostral bem desenhado. Nós temos as pesquisas suplementares anuais, dados acumulados em determinada visita e dados concentrados em determinado trimestrais.


Os acumulados em determinada visita são um conjunto de 5 visitas. Há notas técnicas que reforçam o uso da 5° visita para os anos de 2020, 2021 e 2022, para os demais utiliza-se a 1° visita. As visitas são tratadas como dados anuais. Os dados trimestrais são utilizados a nível de comparação entre trimestres, mas é importante ressaltar que a soma dos trimestres não resulta nos dados anuais.


Lembre-se SEMPRE que a PNADc é uma pesquisa amostral complexa, com plano amostral estratificado e em múltiplos estágios. Isso significa que, para calcular médias, proporções, totais, é necessário usar pesos e variáveis de estrato e unidade amostral, caso contrário, as estimativas ficam enviesadas. Essas variáveis são chamadas de variáveis de design (survey design variables).

Para baixar os dados da PNADc você vai precisar de do pacote PNADcIBGE. Ele será o nosso rei da PNADc. Mas, um rei só é um rei com a corte toda, não é mesmo? O pacote survey é o nosso príncipe porque através dele é possível analisar dados sob amostragem complexa.


Só isso, Fer?

Não! Ainda tem o "deuso" do pacote srvyr. Esse é o pacote que salva todos os analistas/cientistas de dados que já estão fluentes no universo tidyverse. O srvyr consegue juntar a complexidade do pacote PNADcIBGE com o do pacote survey e, ainda mais, traz o pacote dplyr com ele.


install.packages("PNADcIBGE")
install.packages("survey")

O intuito é conseguir comparar trimestres mais violentos, tentar entender suas causas e correlacionar com os dados que falamos anteriormente, então vamos baixar os dados trimestrais, tá? São 4 trimestres por ano. A PNADc possui dados desde 2012, mas vamos baixar somente os anos que coincidem com os dados que já temos.


# Vetor com os trimestres
trimestres <- 1:4
# Função para baixar os dados de cada trimestre
baixar_pnad <- function(t) {
  get_pnadc(year = 2012,
            quarter = t, 
            design = FALSE)
}

Aplicando a função para todos os trimestres e nomeando cada elemento da lista,

dadosPNADc2012 <- map(trimestres, baixar_pnad)
names(dadosPNADc2012) <- paste0("Trimestre_", trimestres)

Partiu empilhar os trimestres,

dadosPNADc2012_completo <- dplyr::bind_rows(dadosPNADc2012, .id = "Trimestre")

Fer, eu posso empilhar todos os anos?

Não! Lembra que estamos trabalhando com dados amostrais com designer amostral? Pois é, cada ano tem o seu. Empilhar anos da PNADc faz com que você perca a identidade de cada um dos anos. Eles meio que se confundem nos pesos amostrais, entende? E é por isso que vamos baixar ano a ano e deixá-los em alguma pasta de fácil acesso.


Agora eu preciso que você se atente a função PNADcIBGE::get_pnadc. Essa função é a central do pacote. Com apenas essa função a gente consegue baixar um microdado da PNADc de um ano ou trimestre e ter um objeto de projeto de amostra pronto para uso com funções do pacote survey. Ele funciona como uma API, ou seja, se você tiver problema com proxy, internet, bloqueio que vem do além no PC do trabalho, você vai ter que solicitar essa permissão de conexão com a API do IBGE. Eu tive MUITOS problemas com proxy e, se você tiver, entra em contato comigo via Linkedin que a gente troca uma ideia.


Bem, acredito que já te ensinei a baixar os dados importantes pra conseguir me acompanhar nessa saga. Talvez você tenha lido também só pra aprender a baixar algum desses dados, o que é bem legal também. O importante é que você saia deste post se perguntando sobre quais violências estão sendo naturalizadas e entendendo o potencial de cada uma dessas bases de dados e das informações que elas carregam. Abaixo os anos disponíveis de cada uma delas.


BASE

2018

2019

2020

2021

2022

2023

2024

2025

SINAN

X

X

X

X

X

X

X


LEI MARIA DA PENHA

X

X

X

X

X

X

X

X

LEI DE DADOS ABERTOS




X

X

X

X

X

PNADc

X

X

X

X

X

X

X

X

PNADc - Segurança




X






No próximo post do Trabalho, Estado e Violência de Gênero irei abordar de uma forma mais quantitativa esses dados trazendo (ou não) a solução dos meus questionamentos. Talvez até trazendo mais questionamentos. Esse é o poder dos dados.


A gente se encontra logo mais.

Bons estudos!


Fernanda Kelly | Estatística

Comentários


Em um mundo onde tudo pode ser monitorado e medido, os dados são apenas a matéria-prima do conhecimento.

© 2020 - 2025 por

Fernanda Kelly R. Silva.
 

Em um mundo onde tudo pode ser monitorado e medido, os dados são apenas a matéria-prima do conhecimento. 

Follow

  • git
  • Linkedin

Follow

Follow

bottom of page