# a paper on Interaction effects

Summary of How Much Should We Trust Estimates from Multiplicative Interaction Models? Simple Tools to Improve Empirical Practice

### 1 问题介绍

1. 模型设定错误，假设交叉项的影响是线性的 LIE——实证数据往往并非如此理想
First, these models assume a linear interaction effect that changes at a constant rate with the moderator.
2. 调节变量缺乏共同支持[想不到更贴切的翻译] lack of common support
Second, estimates of the conditional effects of the independent variable can be misleading if there is a lack of common support of the moderator.
##### 错误1 Model misspecification: LIE假设

This linear interaction effect (LIE) assumption states that the
effect of D on Y can only linearly change with X at a constant rate given by . In other words, the LIE assumption implies that the heterogeneity in effects is such that as X increases by one unit, the effect of D on Y changes by and this change in the effect is constant across the whole range of X.

##### 错误2 Insufficient common support in X

common support又是个啥？

Ideally, to compute the marginal effect of D at a given value of the moderator, Xo, there needs to be
(1) a sufficient number of observations whose X values are close to Xo and
(2) variation in the treatment, D, at Xo.
If either of these two conditions fails, the conditional marginal effects estimates are based on extrapolation or interpolation of the functional form to an area where there is no or only sparse data and therefore the effect estimates are fragile and model dependent.

1. 有足够数量的观测值，它们的X值接近于Xo。
也就是说，使用的数据在Xo附近有足够多的观测值。
2. 在X处的处理变量D是有变化的。

Insufficient common support 经常出现于以下情况：

1. D或X的分布是高度有偏的（highly skewed）
2. D或X在二者的共同支持区域内没有变化（does not vary in some regions of the joint support of D and X）

### 2 模型

1. 如果真实模型是非线性的而强行使用和线性模型，那么得到的结果是不一致和有偏的（conditional marginal effects estimates are inconsistent and biased）；
2. 如果不满足共同支持条件，那么结果高度依赖于模型。

### 3 检验诊断

##### Linear Interaction Diagnostic (LID) plots
• 第一步，将原始数据按X进行分组，画出Y-D的散点图。
如果X是类别变量，那么直接分组；如果X是连续变量，那么按照分位数等分成low, midium, high三组（binning approach）。
• 第二步，在散点图上用蓝色线进行线性回归拟合，用红色线进行LOESS拟合。
如果真实模型是线性的，那么两条线非常接近；反之，当真实模型是非线性的，两条线走势有明显差异。这是对错误1的检验。
此外，对比同一条拟合线在不同分组中的走势，还可以对交互项的作用方向做出初步判断。
• 第三步，在散点图上叠加X分布的box plot。散点图本身也提供了X分布的信息。
如果X在数据区间内都有分布而且比较均匀，比如25分位点到75分位点几乎占据整个区域，那么满足共同支持条件；反之，X集中在某个区间，在另外的区域数据很少或没有，则不满足共同支持条件。

(1) linear marginal effect with a dichotomous treatment,
(2) linear marginal effect with a continuous treatment, and
(3) nonlinear marginal effect with adichotomous treatment.

LID plots

### 4 估计量

##### Binning Estimator

1. 如果
（1）线性回归线与L,M,H大致重叠（至少在置信区间内）
（2）L,M,H在整个数据区间内分布比较均匀，不是集中在某个区域
那么请放心使用线性模型。
2. 如果L,M,H错落有致，那么恭喜你喜提非线性模型，请参考作者提供的估计量。
Binning Estimator
##### Kernel Estimator

Binning Estimator是三个点，Kernel Estimator则呈现了数据区间内的完整曲线。

1. 如果Kernel Estimator结果接近一条直线，则满足LIE假设；如果弯曲程度很大，那么LIE假设不满足，线性模型结果不一致。
2. 置信区间越宽的区域，越缺乏共同支持。
Kernel Estimator

### 6 结果

(1) H0：no statistically different treatment effects at typical low and typical high levels of the moderator——t test

whether the binning estimator at the median value in the low tercile of the moderator was statistically different from the effect estimate at the median of the high tercile of the moderator (p < .05, two-tailed)

(2) H0：no severe extrapolation——L-Kurtosis

whether the L-Kurtosis of the moderator exceeds a threshold that indicates severe extrapolation

(3) no nonlinear interaction effects——Wald test
H0：the interaction effect is indeed linear as claimed in the original study
interflex 的结果中，程序报告了Wald检验的p值。拒绝原假设说明存在非线性影响，但接受原假设不一定就满足LIE假设，尤其是在小样本的情况下。

### 结论

1. 画LID图以检查原始数据。X|D和D|X最好都画哦。
2. 参考Binning估计量。
3. 参考Kernel估计量。
4. 谨慎使用线性交互模型。得到Binning或Kernel估计量支持才使用线性模型，并且应当在有充分的共同支持的数据区域计算边际效应。建立线性模型后还要再参考Brambor, Clark and Golder (2006)一文的使用指导。