多视角政治观点文档摘要技术研究

本文介绍了一种针对多视角政治观点文档的自动摘要方法,通过构建新型数据集和评估框架,对11种不同规模的摘要模型和大语言模型进行了自动与人工评估,分析了模型在保持观点忠实度方面的表现与挑战。

多视角政治观点文档摘要技术研究

摘要

全球党派敌对和两极分化现象日益加剧,在总统选举期间这种分化尤为明显。能够生成准确反映不同观点摘要的模型,可以通过向用户展示替代视角来帮助减少这种两极分化。本研究引入了一个新颖的数据集和任务,用于独立总结来自观点性新闻文章段落集合中的每个政治观点。

方法框架

针对该任务,提出了一个评估观点摘要性能不同维度的框架。通过自动和人工评估方式,对11种不同规模和架构的摘要模型及大语言模型进行了基准测试。

实验结果

虽然像GPT-4o这样的最新模型在此任务上表现良好,但研究发现所有模型都难以生成忠实于预期观点的摘要。对摘要的分析重点关注了提取行为如何受到输入文档特征的影响。

技术贡献

本研究提供了:

  • 专门针对多视角政治文档的摘要数据集
  • 多维度评估框架
  • 11种模型的综合性能基准
  • 对模型忠实度问题的深入分析

应用价值

该技术有助于促进跨党派理解,通过自动化摘要生成使读者能够接触和理解不同政治立场的关键观点,从而减轻政治两极分化问题。

本文发表于COLING 2025会议

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计