#data4good: ciência de dados vs riscos das barragens 🇧🇷

 

Usando a ciência de dados para mapear as barragens do Brasil

 Um grupo de cientistas de dados trabalhou por alguns dias com objetivo de criar um mapa de riscos das barragens de mineração do Brasil. Foram analisadas variáveis como localização das barragens,  distância dos municípios, inspeções, entre outras.O objetivo principal foi identificar, por meio de modelos matemáticos, os potenciais riscos dessas barragens. Foram criados mapas dinâmicos baseados em dados abertos, e neste documento estão disponibilizados as descobertas e os códigos que foram criados para as análises. Os pesquisadores acreditam que compartilhar essa construção/código pode estimular e acelerar outras iniciativas do mesmo tipo ao redor do Brasil.

  1. Descobertas

Utilizando o relatório de Classificação de Barragens de Mineração Brasileiras, gerado pela Superintendência de Produção Mineral, extraído em Janeiro/19, foram criadas análises com a intenção de mapear localização e risco das barragens.Uma análise preliminar do relatório mostrou que a maioria delas é de Minério de Ferro. São 210 barragens deste minério, que correspondentem a 29,41% do total de barragens mapeadas pelo relatório. Entre elas está a barragem que rompeu em Brumadinho (MG) no dia 25 de janeiro de 2019, vitimando centenas de pessoas, animais e destruindo o ecossistema da região.Figura 1 - Quadro resumo por tipo de minério extraído em cada barragem, conforme Superintendência de Produção Mineral (Dataviz:PowerBI)A Categoria de Risco (CRI) representa os aspectos das barragens que podem influenciar na propabilidade de um acidente, como projeto, estrutura, conservação, operação, manutenção e atendimento ao plano de segurança. O Dano Potencial Associado (DPA) é o dano que pode ocorrer devido a rompimento, vazamento, infiltração no solo ou mau funcionamento de uma barragem, e é graduado de acordo com as perdas de vidas humanas e impactos sociais, econômicos e ambientais. A análise detalhada destes dois fatores mostra três barragens na categoria de alto risco (CRI) e 197 com alto potencial de danos (DPA).Figura 2 - Análise Categoria de Risco (CRI) x Dano Potencial(DPA). (Dataviz: Power BI)2.1 Mapa de Calor das BarragensAinda sobre os fatores  risco e dano potencial das barragens, foi construído um mapa de calor para representar a relação entre a CRI e o DPA com relação a altura (m) e volume (m3) das barragens.Na imagem abaixo a classificação de risco e o dano potencial foram relacionados com a altura média das barragens. No mapa é possível observar uma concentração percentual maior nos cruzamentos de alto e baixo risco com elevado dano potencial. Não existe registro de barragem com categoria de risco alta e dano potencial associado baixo.Figura 3 - Mapa de calor Categoria de Risco e Dano Potencial Associado por Altura  Média das Barragens (Dataviz:R - ggplot)Também foi feita a relação entre o CRI e o DPA com o volume médio das barragens. Neste mapa, é possível observar maior concentração percentual de volume nas categorias de baixo risco e dano potencial associado alto. Não foi registrado informação de barragem com categoria de risco alta e dano potencial associado baixo.Figura 4 - Mapa de calor Categoria de Risco e Dano Potencial Associado por Volume médio das Barragens (Dataviz:R - ggplot)O próximo passo foi analisar a localização das barragens em um mapa geográfico do território brasileiro, com foco em descobrir onde mais se concentram e onde podem oferecer maior risco.Esta representação traz também os dados de volume, classificação de risco, dano potencial, além de mostrar a proximidade das barragens com as pequenas cidades e os grandes centros urbanos.O mapa abaixo mostra a localização das barragens no Brasi com seus níveis de risco associado, representados pelas bolhas de calor. Figura 5 - Mapa de calor mostrando o nível de risco das barragens, conforme Superintendência de Produção Mineral (Dataviz:PowerBI)O Estado de Minas Gerais se destaca pela maior concentração de barragens, com cerca de 45,38% do total do país. Também é o Estado onde estão as barragens de maior risco e volume associado, com mais de 2 milhões de m³, que correspondem a aproximadamente 831 mil piscinas olímpicas cheias.. No mapa abaixo, as bolhas de calor representam o volume das barragens.Figura 6 - Concentração de Barragens Minas Gerais - Barragens concentradas no entorno de Belo Horizonte (DataViz: Power BI)Figura 7 - Tabela Resumo: Análise da quantidade de barragens por estado, e principais números . (DataViz: Power BI)Uma análise mais detalhada na região  de Brumadinho mostraa grande concentração de barragens nas redondezas do município. São 26 barragens, sendo 21 utilizadas para extração de minério de ferro. Entre elas está a barragem rompida na região do Córrego do Feijão.Figura 8 - Mapa de Calor município de Brumadinho: concentração de barragens no município mineiro. (DataViz: Power BI)O mapa abaixo mostra a proximidade das barragens de maior volume (tamanho dos círculos) e maior dano potencial elevado (cor dos círculos, sendo vermelho o risco alto) com os domicílios das regiões  de Brumadinho e metropolitana de Belo Horizonte.Figura 9 - Região Metropolitana de BH, com suas barragens e domicílios das cidades próximas à região de Brumadinho (Dataviz:Kepler.gl)Um recorte mais fechado na região de Brumadinho mostra (imagem abaixo) vários domicílios na chamada “linha de fogo” de barragens com alto potencial de dano associado, apesar de algumas delas terem classificação de risco baixo em relação à probabilidade de rompimento, como no caso da barragem I que se rompeu recentemente.Figura 10 - Região de Brumadinho, com suas barragens e domicílios das cidades próximas à região (Dataviz:Kepler.gl)Por fim, o foco no complexo de barragens do Córrego do Feijão permite observar no mapa a diferença de volume entre a barragem I, rompida no final de janeiro, e a barragem VI, que ameaçou romper posteriormente. O tamanho do círculo (volume) mostra a barragem I quase imperceptível no mapa, onde é possível ver bem a representação do volume da barragem VI. Os pontos verde escuro e claro na imagem abaixo representam os domicílios das cidades de Brumadinho e Mário Campos, respectivamente.Figura 11 - Região de Brumadinho e Mário Campos mostrando a representatividade das Barragens I e VI no mapa, em termos de volume (tamanho círculo) e dano potencial associado (vermelho, alto). (Dataviz:Kepler.gl)Considerações Finais Utilizando dados abertos, foi realizada uma análise com intenção de gerar um mapa de risco de barragens de mineração, por meio da indicação da localização geográfica dessas barragens.Foi feita uma análise exploratória, com o objetivo de demonstrar quais minérios são explorados por essas barragens. Com os mapas de calor, a intenção maior é demonstrar que existem grandes danos ao meio ambiente e comunidade, mesmo a maioria das barragens estando com baixo risco de rompimento.Foi o caso da barragem I, no município de Brumadinho, que está classificada com baixo risco de rompimento, e dano potencial alto. Infelizmente, não foi levado em consideração o potencial de Danos, apenas a classificação de risco. Uma avaliação muito errada.Com as descobertas encontradas, foi possível notar que vários municípios estão cercados de barragens com alto potencial de danos. Caso não sejam avaliadas com maior seriedade, outras tragédias poderão ocorrer.Esse estudo tem a intenção de iniciar uma plataforma de código aberto, com finalidade de evitar futuras tragédias, deixando disponível a todos uma informação de fácil consumo para uma fiscalização maior sobre essas barragens em nosso país.Metodologia:Para gerar as descobertas, utilizamos fontes de dados abertas já disponíveis por órgãos oficiais do Brasil, como Agência Nacional de Mineração (ANM) e Instituto Brasileiro de Geografia e Estatística (IBGE). Os dados obtidos foram tratados apenas com o objetivo de formatar os valores das coordenadas geográficas (latitude e longitude). Após esse tratamento, os dados foram exportados para um formato *.CSV.De posse da base no formato ideal, utilizamos técnicas de análise exploratória de dados (estatística descritiva), utilizando as linguagens Python e R. Tais análises permitiram um maior entendimento dos dados, possibilitando, assim, gerar descobertas interessantes que foram materializadas em ferramentas de visualização de dados. A ferramenta de data-viz utilizada para construção do mapa de calor foi da biblioteca ggplot2, função ggplot, do R e, para gerar as visualizações de geolocalização, utilizamos o PowerBI (Versão: 2.65.5313.841 64-bit (dezembro de 2018)) e o Kepler.gl (open source).Abordagem de análise exploratória baseado em ciência de dados desenvolvida por CAPPRA.INSTITUTELinks:

Grupo de pesquisadores: