Stack Exchange知识面向全球开放(现已在Snowflake Marketplace上线)
Snowflake客户现在可以轻松使用全球最受信任的高质量数据来增强其AI应用和智能代理系统,同时确保对贡献内容的社区成员进行规范署名。
随着生成式AI工具在软件行业的普及,我们愈发认识到使用优质数据训练语言模型的重要性。大语言模型(LLMs)提供知识的速度远超人工搜索,但劣质数据无法转化为有效知识——“垃圾进,垃圾出"已成为AI行业的共识。高质量数据使LLMs能够准确高效地运行,而劣质数据则构成风险。
这正是我们创建知识解决方案产品的原因:将LLMs和其他AI工具建立在Stack Overflow及众多Stack Exchange站点提供的高质量、经过验证且可信的答案基础上。我们的方法是确保以符合道德、负责任的方式使用数据,造福社区,同时回馈产生这些宝贵知识的社区。
截至目前,我们已经找到多个志同道合的合作方,社区的工作正在帮助他们的AI产品提高事实准确性。个别合作已经启动了这一进程,但我们希望让每个寻求数据构建AI解决方案的公司都能获得我们的高质量知识库,这与我们社会责任感AI的愿景一致。例如,上个月我们与Moveworks合作,在其市场中推出了Stack Overflow集成功能。
现在我们激动地宣布,Stack Overflow数据已在Snowflake Marketplace上线,并可作为Cortex知识扩展得到支持。Snowflake客户现在可以轻松使用涵盖技术和非技术主题的最受信任、最高质量数据来增强其AI应用和智能代理系统(包括Snowflake Intelligence),同时尊重提供这些内容的社区成员并进行规范署名。
该数据包含约150个Stack Exchange站点和stackoverflow.com的内容,因此如果您希望AI应用掌握从Ubuntu到烹饪等各个领域的知识,我们都能满足需求。数据包括问题、答案、评论、标签和投票:所有由领域专家编写和验证的核心数据,以及提供质量信号的元数据。通过最少的努力,所有这一切都可以在Snowflake高度可扩展的平台上使用自然语言进行查询。
Stack Overflow数据科学与数据平台总监Michael Foree表示:“与Snowflake的合作令我兴奋的是,这将把我们已知的高质量数据交到全球更多专家手中,用于改善他们周围的世界。Snowflake是我个人引入Stack Overflow的平台,他们让人们能够轻松处理数据。通过与Snowflake合作,我们正在将宝贵的数据交到全球专家手中。”
AI生态系统正在快速发展,我们希望确保无论走向何方,我们的数据都能在其中占有一席之地。研究表明,Stack Overflow产生的结构化数据对于准确的生成式AI至关重要。尊重这些数据的来源——我们的社区——是我们使命和未来生存的核心。通过与Snowflake合作,我们确保跨领域的知识宝库能够推动AI生态系统的进步,让我们对AI工具的输出更加高效和自信。
这种合作对我们的社区来说也是一次重大胜利。Stack Overflow已成为各类专家信赖的知识来源。署名要求将认可这些专家的工作,并增强用户对基于此构建的AI应用的信任。我们的首席执行官Prashanth Chandrasekar在HumanX会议上谈到了信任的价值:“当人们冒险使用这些AI工具时,他们希望确保能够依赖它。通过提供链接和引文中的署名,您将这些AI答案建立在真实的基础上。”
生成式AI是长期以来最令人兴奋的技术之一。在我们卓越社区的帮助下,我们可以让它变得更加可靠。