时序数据可视化TiVy算法实现高效模式提取

本文介绍TiVy算法,通过动态时间规整和序列模式挖掘技术,解决多时间序列可视化中的可扩展性问题,实现无重叠的清晰可视化效果,相比传统方法速度提升1000倍,适用于大规模时序数据分析。

TiVy:面向可扩展可视化的时间序列视觉摘要方法

可视化多时间序列时,可扩展性与视觉清晰度之间存在根本性权衡。时间序列捕获了许多大规模现实世界过程的行为,从股市趋势到城市活动。用户通常通过将时间序列可视化为折线图,并置或叠加多个时间序列进行比较,以识别趋势和模式。然而,现有表示方法在可扩展性方面存在困难:当覆盖长时间跨度时,会导致过多小倍数或重叠线条造成的视觉混乱。

提出TiVy新算法,该算法使用序列模式对时间序列进行摘要。该方法基于动态时间规整(DTW)的子序列视觉相似性,将时间序列转换为一组符号序列,然后根据频繁序列模式构建相似子序列的不相交分组。分组结果作为时间序列的视觉摘要,提供更清晰的无重叠叠加和更少的小倍数显示。与常见聚类技术不同,TiVy提取时间对齐的相似子序列(长度可变)。同时提出了一种交互式时间序列可视化方法,能够实时渲染大规模时间序列。

实验评估表明,该算法:(1)在可视化时间序列数据时能够提取清晰准确的模式;(2)与直接DTW聚类相比实现显著加速(1000倍)。通过两个使用场景展示了该方法在探索海量时间序列数据隐藏结构方面的有效性。

本文将被发表于TVCG(IEEE VIS 2025)

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计