Stack Exchange知识面向所有人开放(现已在Snowflake Marketplace上线)
Snowflake客户现在可以轻松地使用一些最受信任、最高质量的数据来丰富其AI应用和智能代理系统,同时尊重提供这些内容的社区成员,并给予适当的署名。
随着生成式AI工具在软件行业的普及,我们看到了在优质数据上训练语言模型的重要性日益增加。LLMs提供知识的速度比大多数手动搜索更快,但不良数据无法转化为知识——“垃圾进,垃圾出”已成为AI行业的口头禅。高质量数据使LLMs能够准确高效地执行;不良数据则是一种负担。
这就是我们创建知识解决方案产品的原因:将LLMs和其他AI工具建立在Stack Overflow和许多Stack Exchange站点提供的高质量、经过验证且可信的答案之上。我们的方法是确保以道德、负责任的方式使用数据,造福社区,同时将收益再投资于产生这一丰富知识的社区。
到目前为止,我们已经找到了几个与我们愿景一致的合作伙伴,我们社区的工作正在帮助使他们的AI产品在事实上更加准确。个别合作伙伴关系帮助启动了这一过程,但我们希望将我们的高质量知识库交到每一个寻求数据以构建AI解决方案的公司手中,这与我们对社会负责的AI的愿景一致。例如,上个月,我们与Moveworks合作,在他们的市场中创建了一个Stack Overflow集成。
现在我们兴奋地宣布,Stack Overflow数据现已在Snowflake Marketplace上线,并可以作为Cortex知识扩展得到支持。Snowflake客户现在可以轻松地丰富他们的AI应用和智能代理系统,包括Snowflake Intelligence,使用一些最受信任、最高质量的数据,涵盖技术和非技术主题,同时尊重提供这些内容的社区成员,并给予适当的署名。
包括大约150个Stack Exchange站点和stackoverflow.com,因此,如果您希望您的AI应用了解从Ubuntu到烹饪的一切,我们都能满足您的需求。数据包括问题、答案、评论、标签和投票:所有核心数据,由主题专家编写和验证,以及提供质量信号的元数据。只需最少的努力,所有这些都可以在Snowflake高度可扩展的平台上使用自然语言进行查询。
Stack Overflow的数据科学与数据平台总监Michael Foree表示:“与Snowflake的合作让我兴奋的是,这将我们已知的高质量数据交到全球更多专家手中,以使用并改善他们周围的世界。Snowflake是我个人引入Stack Overflow的平台。他们使人们能够轻松地处理数据。通过与Snowflake合作,我们将宝贵的数据交到全球专家手中。”
AI生态系统正在迅速发展,我们希望确保我们的数据在其中占有一席之地,无论它走向何方。研究表明,Stack Overflow产生的结构化数据对于准确的GenAI至关重要。尊重这些数据的来源——我们的社区——是我们使命和未来生存的核心。通过与Snowflake合作,我们确保我们跨领域的知识宝库能够推动AI生态系统的进步,并使我们对AI工具的输出更加高效和自信。
这种合作伙伴关系对我们的社区来说也是一次重大胜利。Stack Overflow已成为一系列专家值得信赖的知识来源。署名要求将认可这些专家的工作,并增加用户对基于此构建的AI应用的信任。我们的CEO Prashanth Chandrasekar在HumanX上谈到了信任的价值:“当人们冒着风险使用这些AI工具时,他们希望确保可以依赖它。通过在链接和引用中提供署名,您将这些AI答案建立在真实的基础上。”
GenAI长期以来一直是最令人兴奋的技术之一。在我们不可思议的社区的帮助下,我们可以使其更加可靠。