摘要
开发了一种将社交网络上的因果效应分解为网络中介间接效应和独立于网络的直接效应的方法。通过假设潜在社交群体作为因果中介,构建主成分网络回归模型区分社会效应与非社会效应。模型拟合过程仅需主成分分析和普通最小二乘估计,并证明了回归系数的渐近理论适用性。该方法支持多种回归误差和网络边分布的设定,适用于文本、空间数据、心理测量等多类结构化数据。
方法框架
- 潜在群体中介假设:将复杂网络结构简化为由潜在社交群体介导的因果路径
- 主成分网络回归:
- 第一阶段:对网络结构进行主成分分析提取潜在维度
- 第二阶段:通过最小二乘估计分离网络效应与非网络效应
- 理论保证:证明回归系数在大样本条件下的统计性质,适用于非正态误差和稀疏网络场景
因果推断要点
- 明确反事实假设条件
- 指出现有网络回归方法可能存在的过控制偏差问题
- 通过潜在维度建模避免网络结构的直接参数化
应用扩展
方法具有通用性,可应用于:
- 社交网络影响力分析
- 文本数据主题建模
- 空间区域数据关联研究
- 生物组学数据特征提取