多视角政治观点文档摘要技术研究
摘要
全球党派敌对和两极分化现象日益加剧,在总统选举期间这种分化尤为明显。能够生成准确反映不同观点摘要的模型,可以通过向用户展示替代视角来帮助减少这种两极分化。本研究引入了一个新颖的数据集和任务,用于独立总结来自观点性新闻文章段落集合中的每个政治观点。
方法框架
针对该任务,提出了一个评估观点摘要性能不同维度的框架。通过自动和人工评估方式,对11种不同规模和架构的摘要模型及大语言模型进行了基准测试。
实验结果
虽然像GPT-4o这样的最新模型在此任务上表现良好,但研究发现所有模型都难以生成忠实于预期观点的摘要。对摘要的分析重点关注了提取行为如何受到输入文档特征的影响。
技术贡献
本研究提供了:
- 专门针对多视角政治文档的摘要数据集
- 多维度评估框架
- 11种模型的综合性能基准
- 对模型忠实度问题的深入分析
应用价值
该技术有助于促进跨党派理解,通过自动化摘要生成使读者能够接触和理解不同政治立场的关键观点,从而减轻政治两极分化问题。
本文发表于COLING 2025会议