事件数据分区对隐私感知流程挖掘的影响
信息系统支持业务流程的执行。这些执行的事件日志通常包含关于客户、患者和员工的敏感信息。相应的隐私挑战可以通过匿名化事件日志来解决,同时仍保留流程挖掘的效用。然而,在效用和隐私之间进行权衡是困难的:事件日志的复杂性越高,匿名化带来的效用损失就越大。
在这项工作中,我们提出了一个结合匿名化和事件数据分区的流程,其中利用事件抽象进行分区。通过利用事件抽象,事件日志可以被分割成多个部分,允许每个子日志分别进行匿名化。该流程在保护隐私的同时减轻了效用损失。
为了验证我们的方法,我们使用三个真实事件日志和两种流程挖掘技术,研究了事件分区对两种匿名化技术的影响。我们的结果表明,事件分区可以为基于直接跟随关系的匿名化技术带来流程挖掘效用的改进。