加权图异常检测方法获最具影响力论文奖
某机构学者、卡内基梅隆大学计算机科学系人工智能教授Christos Faloutsos及其合作者荣获2020年太平洋-亚洲知识发现与数据挖掘会议(PAKDD)颁发的"最具影响力论文奖"。PAKDD是全球领先且历史最悠久的数据挖掘与知识发现领域国际会议之一。该奖项旨在表彰十年前在会议上发表并对该领域持续产生重大影响的研究成果。
获奖论文由2020年PAKDD奖项委员会评选产生。委员会通过候选论文筛选、引用分析和同行评审等流程最终确定获奖作品。
2010年,Faloutsos在加入某机构前与卡内基梅隆大学计算机科学系的Leman Akoglu和Mary McGlohon共同发表了题为《OddBall:加权图中异常点检测》的论文。该论文提出了一种新颖的大型加权图异常检测方法。图由不同的实体或节点组成,节点之间的关系表示为边。节点的示例包括网络中的电子邮件服务器、社交网络的用户或政治活动的捐赠者。
该研究聚焦于每个节点周围的邻域(球形区域,故得名"Oddball"),以发现行为偏离常规的节点。论文中描述的技术旨在用于多种应用场景,包括检测电子邮件垃圾邮件发送者、发现政治活动捐款中的异常情况以及识别社交网络中的欺诈或恶意账户。
提出的方法选择一组特征来定义单个节点周围的邻域。为实现这一目标,异常检测算法优先考虑计算速度快的特征,使其特别适用于大规模实际应用。该算法寻找模式,并将显著偏离发现模式的节点识别为异常,然后为每个节点分配"异常值"分数。这种快速的无监督方法无需任何用户定义的常数。
“OddBall的工作可以帮助发现社交网络、电信网络和其他领域的异常行为,“Faloutsos表示。“我们所有的研究都专注于可适用于多种场景的方法,OddBall正是沿着这一方向。第二个指导原则是可扩展性。OddBall和我们所有方法都专门设计用于扩展到大型数据集。”
在职业生涯中,Faloutsos一直在图和流数据挖掘、视频索引与数据挖掘、生物和医学数据库以及数据库性能评估等领域进行研究。他的研究专注于通过开发基于数学的解决方案来解决实际研究问题,从而 bridging 理论与实践之间的差距。
Faloutsos还曾因1999年与两位兄弟合著的论文获得ACM-SIGCOMM(计算机网络研究的旗舰会议)颁发的"时间检验奖”。该论文通过证明网络中节点的度分布遵循幂律而非高斯/泊松分布,挑战了关于互联网结构的普遍假设。这一发现对计算机网络安全、资源供应和协议设计以及社交网络用户行为分析具有多重影响。
Faloutsos于2017年加入某机构。作为该机构消费者部门的学者,他目前专注于欺诈和异常检测,同时还参与知识库、时间序列预测、数据库视图维护和深度学习可解释性等相关项目。
“职业生涯中学到的主要教训之一是真实数据集的价值。是的,它们存在错误——随机或系统性的;它们有缺失值(通常伪装成’-1’或'0’);类别标签偶尔会出错;并且它们还有其他几个教科书很少涉及的问题。然而,它们帮助我们发现我们事先无法想象的模式和规律。”
“学到的第二个教训,“他继续说,“是从研究问题出发寻找解决方案,而不是相反。绝大多数数据挖掘问题似乎都有简单的解决方案(‘进行聚类’或’进行决策树’)。然而,魔鬼在细节中:实际问题经常违反教科书假设(如均匀性假设、高斯性、平稳性等),作为研究人员,我们需要开发超越教科书的新方法来解决现实世界的问题。”