Correlação, Regressão e Causalidade: Alcance e limites das técnicas de análise de Big Data

Versão para impressãoVersão para impressão
Palestrante: 
Mariana Vitti Rodrigues
Ettore Bresciani Filho
Data: 
sexta-feira, Abril 17, 2020 - 10:00

O objetivo do presente trabalho é investigar o alcance das novas tecnologias de Big Data na detecção de relações causais no contexto da pesquisa científica. A questão que direcionará nossa apresentação pode ser assim formulada: Que critérios estão envolvidos na escolha de relações (causais e/ou correlacionais) presentes em massiva quantidade de dados disponíveis para análise científica? Para investigar tal questão, apresentamos conceitos básicos da Estatística discutindo em que medida esse quadro conceitual é transposto para análise de massiva quantidade de dados. Em seguida, discutimos duas abordagens contemporâneas, propostas por Piestch (2013, 2014) e Pearl (2013, 2015, 2018), acerca de métodos para detecção de relações causais no contexto das técnicas de Big Data. Pietsch (2013) reivindica que as técnicas de análise de Big Data, aliadas ao raciocínio por indução eliminativa, constituem um critério para o desvelamento de relações causais. Segundo o autor, o método por indução eliminativa permite desvendar quais propriedades são relevantes em um determinado contexto, de acordo com os parâmetros estabelecidos, a partir de intervenções realizadas no objeto de estudo. De acordo com Pearl (2013), além do estabelecimento de relevância/irrelevância entre variáveis, a detecção de relações causais exige o desvelamento da direcionalidade entre eventos. O autor entende que o raciocínio diagramático possibilita a visualização da direcionalidade das variáveis analisadas, por exemplo, pelo método de intervenção proposto por Pietsch. Assim, Pearl (2013) propõe que a detecção de relações causais é possível a partir da elaboração e manipulação de diagramas por raciocínio contrafactual. Entendemos que as duas propostas se complementam, possibilitando nossa investigação sobre o alcance das novas tecnologias de Big Data na detecção de relações causais na pesquisa científica. Por fim, faremos um balanço geral das propostas apresentadas, trazendo exemplos ilustrativos sobre o alcance da aplicação de técnicas de Big Data na prática científica.

 

Palavras-chave: Big Data, Estatística, causalidade, correlação.

Obs: Apresentação será virtual através do site http://meeting.cs-dc.org/join/sso_e-lab