IBM0288 - 2026.1
Responder perguntas sobre como o mundo funciona usando dados.
Produzir respostas claras, úteis e interpretáveis e precisas.
Ir além de descrições: buscar evidência sistemática.
Um dos principais objetivos da pesquisa econômica é realizar inferências causais, ou seja, fazer inferência de relações de causa e efeito.
Qual é o papel dos modelos nesse processo?
uma visão (por exemplo, Heckman): a causalidade é baseada em teoria, ou seja, a causalidade só existe dentro da estrutura de uma teoria que diz “x causa y”.
uma visão oposta (por exemplo, Holland): a causalidade é baseada em desenho de pesquisa, ou seja, uma afirmação de causalidade exige que seja possível realizar uma manipulação na qual “x causa y”.
“Causal inference is the leveraging of theory and deep knowledge of institutional details to estimate the impact of events and choices on a given outcome of interest.”
Fonte: Cunningham [p. 4.]
“Empirical microeconomics has experienced a credibility revolution, with a consequent increase in policy relevance and scientific impact. Sensitivity analysis played a role in this, but as we see it, the primary engine driving improvement has been a focus on the quality of empirical research designs.”
Fonte: Angrist e Pischke (2009) [p. 3]
Um desenho de pesquisa (causal) é uma descrição estatística e/ou econômica de como um artigo empírico estimará a relação entre duas (ou mais) variáveis que é de natureza causal: como X causa Y?
Como veremos logo mais, obter estimativas de efeitos causais exigem a estimação de um contrafactual não observável: um desenho de pesquisa descreve quais pressupostos são necessários para estimar contrafactuais para um determinado modelo estatístico.
Como discutiremos em aula, esses desenhos de pesquisa podem ser divididos em dois tipos de pressupostos:
baseados em modelos: identificação obtida por pressupostos sobre a modelagem dos resultados potenciais.
baseados em desenho: identificação obtida por pressupostos sobre variável de tratamento.
Identificação é o processo de determinar qual parte da variação dos dados responde à sua pergunta de pesquisa.
Garante que o cálculo realizado isole um único mecanismo teórico de interesse.
Evita interpretações enganosas: separa o que realmente importa do que é apenas ruído.
Qual o papel da identificação no processo científico:
Pergunta de pesquisa leva da teoria à hipótese garantindo que a hipótese testada seja relevante para a teoria.
Identificação leva da hipótese aos dados, garantindo que estamos testando a hipótese correta nos dados e evitando testar, inadvertidamente, outra hipótese.
Alienígenas estimam um modelo mostrando que existe correlação sistemática entre mortes por COVID e ventiladores mecânicos.
Eles concluem que os médicos estão matando os pacientes com os ventiladores. Logo, eles vêm à Terra para libertar os pacientes, piorando a situação.
O erro dos alienígenas foi que eles confundiram correlação com causalidade. Pior que isso: eles não entenderam como o mundo funciona.
Aviso
Nós somos os alienígenas nas nossas pesquisas!
Pergunta causal: “Se o médico colocar o paciente no ventilador mecânico \((D)\), os sintomas do paciente irão melhorar \((Y)\)?”
Correlação: \(\rho_{D,Y} = \frac{\mathrm{Cov}(D, Y)}{\sigma_D \sigma_Y}\)
Erros são extrapolados em modelos preditivos que não se baseiam em abordagens causais.
Toda manhã o galo canta quando o sol nasce
O cantar do galo fez o sol nascer? ou O nascer do sol fez o galo cantar?
E se uma raposa comer o galo?
Otimização e endogeneidade
O que aconteceria se o BACEN conseguisse antecipar e otimizar com 100% de precisão a política monetária?
O caminho não escolhido
Qual o impacto ou efeito causal de um determinado programa sobre uma variável de resultado de interesse?
Necessário observar a mesma unidade de observação (pessoa, firma, etc) em dois estados da natureza: tratado e não tratado.
Porém, só é possível observar um dos estados para cada unidade!
Para cada unidade (indivíduo, firma, país, etc.) \(i\) em uma população, definimos dois resultados potenciais:
\(Y_{i1}\): resultado para a unidade \(i\) se ela recebesse o tratamento
\(Y_{i0}\): resultado para a unidade \(i\) se ela não recebesse o tratamento (controle)
Resultados potenciais são contrafactuais
Para um dado indivíduo, apenas um dos resultados potenciais pode ser observado!
Seja \(D_i\) uma variável binária que indica o status de tratamento da unidade \(i\):
\(D_i = 1\): a unidade \(i\) recebeu o tratamento
\(D_i = 0\): a unidade \(i\) não recebeu o tratamento (controle)
Resultados observado
O resultado observado para a unidade \(i\), denotado por \(Y_i\), depende dos resultados potenciais e do status de tratamento: \(Y_i = D_i Y_{i1} + (1 - D_i) Y_{i0}\)
Observamos \(Y_{i1}\) se \(D_i=1\)
Observamos \(Y_{i0}\) se \(D_i=0\)
O efeito causal do tratamento para a unidade \(i\) é definido como: \(\tau_i = Y_{i1} - Y_{i0}\)
É o efeito que gostaríamos de conhecer para cada unidade
O efeito tratamento individual é não observável
Não é possível observar \(\tau_i\) diretamente, pois apenas um dos resultados potenciais é observado para cada unidade.
Existe uma distribuição dos efeitos de tratamento
Podemos trabalhar com características dessa distribuição, como a média
Interesse em estimar o efeito tratamento médio:\(\text{ATE} = E[Y_1 - Y_0] = E[\tau_i]\)
Representa a diferença esperada nos resultados se toda a população recebesse o tratamento versus se ninguém recebesse
ATT: \(\text{ATT} = E[Y_1 - Y_0 \mid D=1]\)
Efeito médio do tratamento para aqueles que realmente receberam o tratamento
Útil em avaliações de políticas
Mede o efeito sobre os realmente afetados
ATU: \(\text{ATU} = E[Y_1 - Y_0 \mid D=0]\)
Efeito médio do tratamento para aqueles que não receberam o tratamento
Menos intuitivo, mas importante para entender hipóteses de viés de seleção.
Não observamos os resultados contrafactuais, pois para qualquer unidade \(i\), observamos:
Como nunca observamos ambos simultaneamente, não podemos calcular \(\tau_i = Y_{i1} - Y_{i0}\) para nenhuma unidade específica.
Necessidade de hipóteses
Inferir efeitos causais requer hipóteses adicionais (baseadas em modelos ou desenho, ver slide Seção 6)!
SUTVA (Stable Unit Treatment Value Assumption): garante que os resultados potenciais sejam bem definidos
Não Interferência
O tratamento de uma unidade não afeta os resultados potenciais de outra unidade
\(Y_{i1}\) e \(Y_{i0}\) não dependem do tratamento de outras unidades
Não existem spillovers ou efeitos de rede
Consistência do Tratamento
Não há diferentes versões do tratamento
\(D_i=1\) e \(D_i=0\) significam a mesma coisa para todas as unidades tratadas
Suposição crucial para identificação em muitos métodos causais: \[(Y_{i0}, Y_{i1}) \perp D_i \mid X_i\]
Condicionando em \(X_i\), o tratamento é “como se fosse aleatório”
Diferenças médias entre tratados e não tratados dentro de cada estrato de \(X_i\) podem ser atribuídas ao tratamento
Sem essa suposição, a seleção para tratamento depende de fatores que também afetam os resultados
Isso gera viés de seleção!

O uso de celulares e computadores durante as aulas expositivas não é permitido!