Frequentemente, pesquisadores irão construir modelos de regressão visando 1. explicar, estimar ou prever a variabilidade de uma variável dependente em função de variáveis independentes, 2. testar e comparar teorias e 3. tentar estabelecer relações de causa e efeito entre variáveis. Basicamente, o entendimento pleno de alguns conceitos de estatística é fundamental para conseguir entender os resultados. Abaixo, listamos a tabela do excelente livro de David C. Howel, “Fundamental Statistics for the Behavioral Sciences“, que usamos como referência em nossas aulas.
Certamente, cada um desses objetivos requer um delineamento de pesquisa diferente, já que a técnica estatística é um meio e não um fim em si própria.
Muitos exemplos em que modelos de regressão são utilizados estão disponíveis literatura. Por exemplo:
- Verificar o quanto a taxa de impostos de um país afeta a arrecadação, já na conhecida Curva de Laffer
- Verificar o quanto a ansiedade influencia a performance, na Curva de Yerkes-Dodson
- Verificar a relação entre filmes violentos e comportamentos agressivos em crianças
- Verificar o quanto a pressão organizacional afeta a saúde mental dos trabalhadores
Porém, em todos estes modelos, podemos nos perguntar quais são as possíveis variáveis de confundimento. Em outras palavras, e já pensando nos procedimentos da estatística, quais são as outras variáveis que influenciam a relação entre a VI e a VD e que podem confundir as conclusões. Por exemplo, talvez a taxa de impostos de um país promova mais sonegação de imposto que, por sua vez, afete a arrecadação. Talvez não sejam todos os níveis de ansiedade que irão impactar na performance ou nem todas as crianças expostas a filmes violentos vão apresentar comportamentos agressivos, mas somente as que não tem suporte familiar. Nesta mesma direção, a pressão organizacional talvez afete somente as pessoas de empresas que não tenham um setor de saúde.
Tornando uma estória bastante longa em curta, a pergunta que devemos fazer – e responder – em todos os modelos de regressão é: Quais são as possíveis variáveis mediadoras e moderadoras da relação entre a VI e a VD ? Conceitualmente, os diagramas abaixo ajudam a entender os conceitos. Tecnicamente, a moderação funciona como uma interação em uma ANOVA e a mediação é equivalente a uma regressão múltipla em que se estima também efeitos indiretos.
Estes modelos são contemplados na obra “Introduction to Mediation, Moderation, and Conditional Process Analysis: A Regression-Based Approach” de Andrew Hayes . Com um texto bastante extenso e rico em detalhes, Hayes discorre por 12 capítulos sobre este tema.
Durante três meses, por uma iniciativa do canal Psicometristas Brasil, outros profissionais e eu discorremos sobre cada capítulo do livro e, agora, convido vocês a contemplar a versão final dos encontros. Estão todos disponíveis no youtube!
Espero que vocês tenham tanto proveito dos vídeos como eu tive do conteúdo!
Um forte abraço,
Luis Anunciação
Psicometria (PUC-Rio)