时间序列因果关系检测新方法

方法概述

给定观测时间序列和目标时间序列，如何在不排除隐藏时间序列存在的情况下识别目标的因果关系？这是金融、生物学和供应链管理等多个领域面临的关键问题。

传统方法存在以下局限性：

新方法克服了这些缺点：

统计依赖性（线性情况下的相关性）并不意味因果关系。使用有向无环图（DAG）表示相关变量间的因果关系，其中边具有方向且无循环。

条件独立性测试是核心工具：通过固定第三变量S的值来检查两个变量间的统计依赖性是否消失。在更复杂的图中，S可以是整个变量集合，称为条件集。

当两个变量X和Y因第三变量U而依赖（而非彼此因果关系）时，称为被U混淆。

关键洞察：通过寻找不同的条件独立性模式来区分因果关系和混淆关系。当存在隐藏混淆因子时，条件化处理会迫使原本独立的变量变得依赖。

在时间序列情况下，图结构更加复杂：

方法步骤：

给定图的某些限制（在隐藏混淆的难度下不被视为极端），提出并证明了两个定理用于识别单滞后图中的直接和间接原因。这些定理产生了一个仅需要两次条件独立性测试的算法，具有明确定义的条件集，其规模与候选时间序列数量呈线性关系。

在乳制品价格预测的实际数据测试中：

该方法在真实阳性率（TPR）和真实阴性率（TNR）方面表现出色，误报率接近零。

该方法为存在隐藏时间序列的系统中的因果关系检测提供了实用解决方案，特别适用于部分观测系统的因果特征选择，为金融分析、生物系统研究和供应链管理等领域提供了新的分析工具。