IBM0288 - 2026.1
Para cada unidade \(i\) em uma população, definimos dois resultados potenciais:
\(Y_{i1}\): resultado para a unidade \(i\) se ela recebesse o tratamento
\(Y_{i0}\): resultado para a unidade \(i\) se ela não recebesse o tratamento (controle)
Seja \(D_i\) uma variável binária que indica o status de tratamento da unidade \(i\):
\(D_i = 1\): a unidade \(i\) recebeu o tratamento
\(D_i = 0\): a unidade \(i\) não recebeu o tratamento (controle)
Resultados observado
O resultado observado para a unidade \(i\), denotado por \(Y_i\), depende dos resultados potenciais e do status de tratamento: \(Y_i = D_i Y_{i1} + (1 - D_i) Y_{i0}\). Observamos \(Y_{i1}\) se \(D_i=1\) e \(Y_{i0}\) se \(D_i=0\)
O efeito tratamento individual é não observável
Não é possível observar \(\tau_i\) diretamente, pois apenas um dos resultados potenciais é observado para cada unidade.
O efeito tratamento médio é definido como: \[\text{ATE} = E[Y_1 - Y_0] = E[\tau_i]\]
O efetio tratamento médio sobre os tratados é definido como: \[\text{ATT} = E[Y_1 - Y_0 \mid D=1]\]
O efetio tratamento médio sobre os não tratados é definido como: \[\text{ATU} = E[Y_1 - Y_0 \mid D=0]\]
Os EUA gastam muito do PIB em saúde, mas possuem indicadores piores que outros países que possuem um sistema universal.
O Medicare atende idosos e o Medicaid atende alguns grupos de baixa renda, mas a maioria dos trabalhadores permanecem sem seguro por escolha ou falta de oferta a preços acessíveis.
Em 2010, o governo Obama sancionou o Affordable Care Act (ACA) para tentar melhorar a situação.
O ACA exige que americanos comprem plano de saúde sob pena de multa fiscal
Democratas e Republicanos têm visões distintas do ACA desde o início.
🤔 Pergunta Empírica
Qual o impacto de ter plano de saúde sobre as condições de saúde da população?
NHIS: *National Health Interview Survey. Dados de 2009.
Health Index: variável categórica que vai de 1 a 5 codificada pela resposta do entrevistado a pergunta: “Você diria que seu estado geral de saúde é excelente, muito bom, bom, regular ou ruim?”
Dois alunos estrangeiros chegam ao MIT e tem que escolher entre pagar por plano de saúde ou não
Kuzdar (cazaque) vem de um país com sistema universal e receio de ficar muito doente com o frio de MA
Maria (chilena) já está acostumada com o frio e decidi usar o dinheiro do plano de saúde para outras coisas
A tabela abaixo mostra os resultados potenciais de ambos e suas escolhas.
| Kuzdar | Maria | |
|---|---|---|
| Resultado Potencial sem plano: \(Y_{0i}\) | 3 | 5 |
| Resultado Potencial com plano: \(Y_{1i}\) | 4 | 5 |
| Tratamento: \(D_i\) | 1 | 0 |
| Condição de saúde observada | 4 | 5 |
| Efeito tratamento | 1 | 0 |
Comparação entre variáveis de interesse:
\[ \begin{aligned} Y_{K} - Y_{M} &= Y_{1,K} - Y_{0,M} \end{aligned} \]
Mostrando viés de seleção:
\[ \begin{aligned} Y_{K} - Y_{M} &= Y_{1,K} - Y_{0,M} \\ &= \underbrace{Y_{1,K} \color{red}{- Y_{0,K}}}_{\text{=1}} \color{red}{+} \underbrace{\color{red}{Y_{0,K}} - Y_{0,M}}_{\text{=-2}} \end{aligned} \]
\[ \begin{aligned} Y_{K} - Y_{M} &= Y_{1,K} - Y_{0,M} \\ &= \underbrace{Y_{1,K} \color{red}{- Y_{0,K}}}_{\text{efeito tratamento =1}} \color{red}{+} \underbrace{\color{red}{Y_{0,K}} - Y_{0,M}}_{\text{viés de seleção = -2}} \end{aligned} \]
\[ \begin{aligned} Avg_n[Y_{1i} -Y_{0i}] &= \frac{1}{n}\sum_{i=1}^{n}Y_{1i} - \frac{1}{n}\sum_{i=1}^{n}Y_{0i} \\ & =Avg_n[Y_i \mid D_i=1] - Avg_n[Y_i \mid D_i=0] \\ &= Avg_n[Y_{1i} \mid D_i=1] - Avg_n[Y_{0i} \mid D_i=0] \\ & \color{red}{\neq} Avg_n[Y_{1i}-Y_{0i}] = \text{ATE} \end{aligned} \]
\[ \begin{aligned} Y_{1i} & =Y_{0i}+\kappa \\ Y_{1i}-Y_{0i} &= \kappa \end{aligned} \]
\[ \begin{aligned} DSM &= \color{red}{Avg_n[Y_{1i} \mid D_i = 1]} - Avg_n[Y_{0i} \mid D_i = 0] \\ &= \color{red}{Avg_n[Y_{0i} + \kappa \mid D_i = 1]} - Avg_n[Y_{0i} \mid D_i = 0] \\ &= \underbrace{\color{red}{\kappa}}_{\color{blue}{\text{Efeito causal médio}}} \color{red}{+} \underbrace{\color{red}{Avg_n[Y_{0i} \mid D_i = 1]} - Avg_n[Y_{0i} \mid D_i = 0]}_{\color{blue}{\text{Viés de seleção}}} \end{aligned} \]
Diferença Simpes de Médias
Utilizando a diferença simples de médias como estimador do efeito tratamento obtemos como resultado efeito causal médio \(+\) viés de seleção.

Painel B na tabela mostra que os dois grupos são distintos em várias dimensões observáveis:
Pergunta: Se o único problema fosse as variáveis observáveis, como poderíamos obter o efeito causal médio, ou seja, sem o viés de seleção?
Passo a passo:
Obtenha uma amostra aleatória da população de interesse.
Divida a amostra em dois grupos, tratamento e controle, sendo que a seleção dos indivíduos em cada grupo é feita de modo aleatório.
Introduza o tratamento (um programa, política, estratégia, etc) e observe os resultados.
Lei dos Grandes Números
Explique intuitivamente o que se espera dos dois grupos gerados pela atribuição aleatória do tratamento, ou seja, como eles se comparam antes e depois do tratamento?
Experimento Aleatório
Como os grupos de controle e tratamento vêm da mesma população, eles são similares em todas as dimensões observáveis (outras variáveis da amostra) e não observáveis(!), incluindo o valor esperado dos resultados potenciais!
O que acontece no modelo de efeito constante?
\[ \begin{aligned} &= E[Y_{i} \mid D_i = 1] - E[Y_{i} \mid D_i = 0] \\ &= E[Y_{1i} \mid D_i = 1] - E[Y_{0i} \mid D_i = 0] \\ &= E[Y_{0i} + \kappa \mid D_i = 1] - E[Y_{0i} \mid D_i = 0] \\ &= \kappa + \color{red}{\underbrace{E[Y_{0i} \mid D_i = 1] - E[Y_{0i} \mid D_i = 0]}_{=0}} \\ &= \kappa \end{aligned} \]
Como os grupos são comparáveis, qualquer diferença observada nos resultados após o tratamento deve ser atribuída ao tratamento.
Estimador: a diferença na média do resultado entre o grupo de tratamento e o grupo de controle.
Estimador não viesado para ATE.
A diferença observada é estatisticamente significativa ou poderia ser apenas devido ao acaso da amostragem?
Teste t de diferença de médias para duas amostras independentes.
Hipóteses:
\(H_0\): Não há efeito do tratamento; \(ATE = 0\).
\(H_A\): Há um efeito do tratamento; \(ATE \neq 0\).
Interpretação dos coeficientes:
\(\beta_0 = E[Y_i | D_i=0]\): a média do grupo de controle
\(\kappa = ATE\): a diferença na média do resultado entre o grupo de tratamento e o grupo de controle.
Equivalência: estimador via MQO e diferença de médias são iguais
Diferença: MQO permite inclusão de controles
Viés e eficiência
O estimador do ATE em um experimento aleatório é não viesado. A inclusão de covariáveis não é necessária para eliminar o viés de seleção, mas pode reduzir o desvio-padrão e aumentar a eficiência do estimador.
Validade Interna
Uma análise estatística tem validade interna se a inferência estatística sobre efeitos causais são válidas para a população estudada.
Falhas no processo de aleatorização: análise de balanceamento com caractéristicas prévias
Falhas em seguir o protocolo de tratamento: compliance parcial
Possível focar nas pessoas que seguiram protocalo
Estima-se o efeito intent-to-treat: efeito de atribuição aleatória do tratamento e não efeito do tratamento em si.
Atrito: se motivo não é correlacionado com tratamento, não gera viés
Efeitos experimentais: solução pode ser procedimento duplo às cegas
Amostras pequenas: não gera viés, mas imprecisão
Validade Interna
Uma análise estatística tem validade externa se a inferência e as conclusões podem ser generalizadas da população e contextos estudados para outras populações e contextos.
Amostras não representativas: população estudada e população de interesse devem ser suficientemente similares
Intervenção não representativa: um programa de escala pequena e super monitorado pode ser diferente do programa efetivamente implementado
Efeitos de equilíbrio geral: um programa de escala pequena e temporário pode alterar o contexto econômico quando implementado em larga escala e de modo permanente
Contexto: Debate sobre expansão do Medicaid para os não segurados
Intervenção:
2008: Oregon criou uma loteria pública para oferecer chance de inscrição no Medicaid
~75.000 inscritos → ~30.000 vencedores (tratamento) vs. ~45.000 não sorteados (controle)
Critérios de elegibilidade: 19–64 anos, pobres, sem seguro há ≥6 meses, poucos ativos financeiros


Ferraz e Finan: QJE 2008
Tema: Corrupção política e mecanismos de accountability.
Questão central: Quando eleitores têm acesso a informações sobre corrupção, isso afeta suas escolhas eleitorais?
Contexto do Brasil:
Programa federal de auditoria aleatória em municípios (CGU).
Municípios sorteados para auditorias → publicação dos resultados na mídia.
Experimento ideal: auditar municípios, medir corrupção e liberar a informação para um grupo aleatório de eleitores.
Comparação: resultados eleitorais em municípios com informação divulgada vs. sem informação → efeito causal da transparência.
Problema: experimento direto seria antiético e politicamente inviável.
Alternativa dos autores: explorar o sorteio aleatório do programa de auditoria da CGU e o timing das eleições.


Choi, Laibson e Madrian: RFE 2010
Tema: racionalidade de investidores.
Questão central: Por que investidores não escolhem sempre o fundo mais barato?
Contexto: fundos de índice S&P 500 oferecem praticamente o mesmo retorno, mas cobram taxas (fees) diferentes.
Hipótese existente: taxas refletem heterogeneidade em outros serviços oferecidos em conjunto com os fundos.
Estratégia dos autores: conduzir experimentos controlados em um contexto em que esses outros serviços são inexistentes.
Participantes:
Tarefa principal: alocar US$10.000 hipotéticos entre 4 fundos reais do S&P 500.
Incentivos:
Pagamento inicial modesto + pagamento adicional baseado no retorno futuro do portfólio escolhido.
Para staff, horizonte de retorno de 1 mês; para estudantes, 1 ano.
Documentos fornecidos: lâmina dos fundos e “choice sheet” para registrar alocações.
Objetivo: observar se participantes escolhem fundos de menor taxa (fee) quando outras características são idênticas.
Prospectus-only: apenas lâmina + choice sheet.
Fees treatment: lâmina + choice sheet + planilha mostrando fees detalhados e impacto no portfólio.
Returns treatment: lâmina + choice sheet + planilha com retornos passados anualizados.
FAQ treatment (staff only): lâmina + choice sheet + respostas a perguntas básicas sobre fundos e S&P 500.
Objetivo do desenho: testar como informação sobre custos, retornos passados ou conhecimento geral afeta alocação dos participantes.
Controle experimental: todos os grupos tiveram tempo livre para decidir, sem poder consultar outros participantes; mínimos de investimento reais respeitados.


Participantes alocam US$ 10.000 entre quatro fundos S&P 500 e são recompensados pelo retorno subsequente
Os participantes falham em minimizar taxas
Rejeitamos a hipótese de escolha por serviços extras não ligados ao portfólio
Custos de busca por informações importam, mas mesmo eliminados, taxas não são minimizadas
Participantes dão peso elevado a retornos anualizados desde a criação do fundo
Taxas pagas diminuem com conhecimento financeiro
Participantes que escolhem fundos caros percebem que estão cometendo um erro

O uso de celulares e computadores durante as aulas expositivas não é permitido!