Chronos:将语言模型架构适配时间序列预测
通过将时间序列数据标记化并视作语言处理,研究人员成功将大语言模型架构应用于时间序列预测任务。实验表明,该模型的零样本性能达到或超越了专为时间序列预测设计的模型。
高性能"25519"椭圆曲线密码学
椭圆曲线密码学作为一种公钥密码学方法,相比依赖大数分解的方法具有优势。研究人员针对某中心硬件优化了25519椭圆曲线密码学的汇编级实现,并通过自动化推理验证功能正确性。该实现已纳入开源密码库。
大语言模型是否理解世界?
通过序列词语预测训练的语言模型能否真正表征语义?研究表明这些模型不仅能够而且确实实现了语义表征。从多感官领域到书面语言的转换可视为简单投影,类似于三维场景到二维图像的投影。
新工具与数据集助力大语言模型幻觉检测
RefChecker是一种LLM幻觉检测方法,将模型输出分解为<主体、谓词、客体>结构的知识三元组,相比早期使用句子或短语作为声明摘要的方法,能进行更细粒度的事实准确性评估。该工具包含基准数据集,涵盖零上下文、噪声上下文和准确上下文三种设置下的文本生成任务示例。
构建常识知识图谱提升商品推荐
为匹配用户查询与最相关商品,需要常识推理能力。研究人员利用LLM从用户交互数据中提取常识关系,并将其编码为可查询的大型图谱,在商品检索过程中提供支持。
通过试题生成自动评估RAG管道
针对检索增强生成(RAG)模型的幻觉问题,研究人员开发出使用LLM为知识库中每个文档生成多选题测试的方法,根据模型在测试中的表现进行评分。
生成式AI购物助手的技术实现
新型生成式AI购物助手通过亚马逊购物应用回答各类问题,包括产品详情、比较和推荐,帮助用户做出更明智的购物决策。
虚拟全能试穿:任意场景中的产品可视化
与早期虚拟试穿模型不同,“虚拟全能试穿"模型允许用户在任意场景中无缝插入任何产品。用户提供场景图像和产品后,通过绘制掩码指定插入位置,模型以真实的角度、光照和阴影将物品融入场景。关键技术是基于粗略复制粘贴拼贴的次级U-Net编码器生成的"提示信号”。
AI在药房服务中的全流程应用
从将原始处方数据转录为标准格式的LLM,到生成准确价格估计的决策树模型,再到帮助用户应对药房行业复杂性的助手,AI正在改善用户与药房服务的每个交互环节。
自动化推理解决百年数学难题
使用自动化推理工具,研究人员最终解决了存在近百年的"幸福结局问题"中n=6的未解情况。该问题要求确定平面上保证构成不包含其他点的凸多边形所需的最少点数。