使用轻量级形式化方法验证某中心S3中的键值存储节点
“本文报告了应用轻量级形式化方法验证ShardStore正确性的经验,这是为某中心云对象存储服务开发的新键值存储节点实现。‘轻量级形式化方法’指一种实用方法,用于验证由全职工程团队持续进行功能开发的生产存储节点的正确性。不追求完全形式化验证,而是强调自动化、可用性,以及在软件及其规范随时间演变时持续确保正确性的能力。”
电子商务Bandit算法应用图谱
“丰富的Bandit文献不仅提供多样化的算法工具箱,也使实践者难以找到解决当前问题的合适方案。本文通过结构化Bandit图谱帮助实践者导航,找到相关且实用的Bandit算法。”
时间序列潜在共同原因中因果特征选择的必要和充分条件
“研究时间序列中潜在变量的直接和间接原因识别,提供基于约束的因果特征选择方法,证明在某些图约束下既可靠又完整。理论和估计算法仅需对每个观察候选时间序列进行两次条件独立性测试,以确定其是否为观察目标时间序列的原因。”
SiamMOT:连体多目标追踪网络
“专注于改进在线多目标追踪(MOT),引入基于区域的连体多目标追踪网络SiamMOT。包含运动模型估计实例在两帧间的移动以实现检测实例关联。通过隐式和显式运动建模变体探索运动建模对追踪能力的影响。”
监督机器学习在地理位置定位中的应用
“某中心最后一英里配送通过使用过去配送报告的嘈杂GPS位置学习每个地址的准确配送点。提出新颖的信息检索领域’学习排序’适应方法,实现地图层信息融合。离线实验显示误差距离显著减少,在线实验估计年度节省达数百万。”
电子商务搜索中的季节性相关性
“季节性对电子商务搜索相关性至关重要。39%的查询具有高度季节性相关性。提出LogSR和VelSR特征,使用基于自注意力的最先进神经模型捕捉产品季节性。在线A/B测试显示季节性相关性特征处理带来2.20%的购买量提升。”
使用多模态深度学习减少包装浪费
“分享使用深度学习识别最适合大规模运输多样化产品目录中每件物品的最佳包装类型的见解,确保物品完好到达、客户满意并减少包装浪费。结合产品图像等多模态数据和类别不平衡处理技术对提高模型性能至关重要。”
CTR-BERT:十亿参数教师模型的成本效益知识蒸馏
“研究预训练大语言模型(如BERT)在电子商务产品广告点击率(CTR)预测中的应用。提出CTR-BERT,一种新颖的轻量级缓存友好因子分解模型,包含双结构BERT类文本编码器和文本与表格特征后期融合机制。”
概率预测:水平集方法
“提出水平集预测器(LSF),将点估计器转换为概率估计器的简单有效通用方法。通过认识与随机森林(RF)和分位数回归森林(QRF)的联系,在温和假设下证明方法的一致性保证。实证实验显示基于树的点估计器在预测准确性方面与最先进深度学习模型相当。”
情境重述检测减少对话系统摩擦
“为语音助手正确解释用户意图至关重要。提出情境重述检测模型ContReph,从多轮对话中自动识别重述。展示如何利用对话上下文和用户-代理交互信号(包括用户隐式反馈和不同轮次间时间间隔),显著优于成对重述检测模型。”