<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
  <channel>
    <title>数据集去重 on 办公AI智能小助手</title>
    <link>https://blog.qife122.com/tags/%E6%95%B0%E6%8D%AE%E9%9B%86%E5%8E%BB%E9%87%8D/</link>
    <description>Recent content in 数据集去重 on 办公AI智能小助手</description>
    <generator>Hugo</generator>
    <language>zh-cn</language>
    <copyright>qife</copyright>
    <lastBuildDate>Fri, 19 Sep 2025 18:02:12 +0800</lastBuildDate>
    <atom:link href="https://blog.qife122.com/tags/%E6%95%B0%E6%8D%AE%E9%9B%86%E5%8E%BB%E9%87%8D/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>RETSim：高效鲁棒的文本相似度计算模型</title>
      <link>https://blog.qife122.com/p/retsim%E9%AB%98%E6%95%88%E9%B2%81%E6%A3%92%E7%9A%84%E6%96%87%E6%9C%AC%E7%9B%B8%E4%BC%BC%E5%BA%A6%E8%AE%A1%E7%AE%97%E6%A8%A1%E5%9E%8B/</link>
      <pubDate>Fri, 19 Sep 2025 18:02:12 +0800</pubDate>
      <guid>https://blog.qife122.com/p/retsim%E9%AB%98%E6%95%88%E9%B2%81%E6%A3%92%E7%9A%84%E6%96%87%E6%9C%AC%E7%9B%B8%E4%BC%BC%E5%BA%A6%E8%AE%A1%E7%AE%97%E6%A8%A1%E5%9E%8B/</guid>
      <description>&lt;h1 id=&#34;retsim高效鲁棒的文本相似度计算模型&#34;&gt;RETSim：高效鲁棒的文本相似度计算模型&lt;/h1&gt;&#xA;&lt;p&gt;本论文介绍了RETSim（Resilient and Efficient Text Similarity），这是一种轻量级、多语言的深度学习模型，经过训练能够生成鲁棒的度量嵌入，用于近重复文本检索、聚类和数据集去重任务。我们在本文中展示了如何结合RETSim的检索能力来创建本地LLM RAG系统。&lt;/p&gt;</description>
    </item>
    <item>
      <title>高效鲁棒文本相似度模型RETSim：革新文本检索与去重技术</title>
      <link>https://blog.qife122.com/p/%E9%AB%98%E6%95%88%E9%B2%81%E6%A3%92%E6%96%87%E6%9C%AC%E7%9B%B8%E4%BC%BC%E5%BA%A6%E6%A8%A1%E5%9E%8Bretsim%E9%9D%A9%E6%96%B0%E6%96%87%E6%9C%AC%E6%A3%80%E7%B4%A2%E4%B8%8E%E5%8E%BB%E9%87%8D%E6%8A%80%E6%9C%AF/</link>
      <pubDate>Thu, 11 Sep 2025 10:53:49 +0800</pubDate>
      <guid>https://blog.qife122.com/p/%E9%AB%98%E6%95%88%E9%B2%81%E6%A3%92%E6%96%87%E6%9C%AC%E7%9B%B8%E4%BC%BC%E5%BA%A6%E6%A8%A1%E5%9E%8Bretsim%E9%9D%A9%E6%96%B0%E6%96%87%E6%9C%AC%E6%A3%80%E7%B4%A2%E4%B8%8E%E5%8E%BB%E9%87%8D%E6%8A%80%E6%9C%AF/</guid>
      <description>&lt;h1 id=&#34;retsim-resilient-and-efficient-text-similarity&#34;&gt;RETSim: Resilient and Efficient Text Similarity&lt;/h1&gt;&#xA;&lt;p&gt;本文介绍RETSim（弹性高效文本相似度模型），这是一种轻量级、多语言的深度学习模型，经过训练可生成鲁棒的度量嵌入，用于近重复文本检索、聚类和数据集去重任务。我们在本文中展示了如何结合RETSim的检索能力构建本地LLM RAG系统。&lt;/p&gt;</description>
    </item>
    <item>
      <title>RETSim：高效鲁棒的文本相似度模型，革新文本检索与去重技术</title>
      <link>https://blog.qife122.com/p/retsim%E9%AB%98%E6%95%88%E9%B2%81%E6%A3%92%E7%9A%84%E6%96%87%E6%9C%AC%E7%9B%B8%E4%BC%BC%E5%BA%A6%E6%A8%A1%E5%9E%8B%E9%9D%A9%E6%96%B0%E6%96%87%E6%9C%AC%E6%A3%80%E7%B4%A2%E4%B8%8E%E5%8E%BB%E9%87%8D%E6%8A%80%E6%9C%AF/</link>
      <pubDate>Fri, 05 Sep 2025 11:13:39 +0800</pubDate>
      <guid>https://blog.qife122.com/p/retsim%E9%AB%98%E6%95%88%E9%B2%81%E6%A3%92%E7%9A%84%E6%96%87%E6%9C%AC%E7%9B%B8%E4%BC%BC%E5%BA%A6%E6%A8%A1%E5%9E%8B%E9%9D%A9%E6%96%B0%E6%96%87%E6%9C%AC%E6%A3%80%E7%B4%A2%E4%B8%8E%E5%8E%BB%E9%87%8D%E6%8A%80%E6%9C%AF/</guid>
      <description>&lt;h1 id=&#34;retsim鲁棒且高效的文本相似度模型--国际学习表征会议出版物&#34;&gt;RETSim：鲁棒且高效的文本相似度模型 | 国际学习表征会议出版物&lt;/h1&gt;&#xA;&lt;h2 id=&#34;摘要&#34;&gt;摘要&lt;/h2&gt;&#xA;&lt;p&gt;本文介绍了RETSim（Resilient and Efficient Text Similarity），这是一种轻量级、多语言的深度学习模型，经过训练可为近重复文本检索、聚类和数据集去重任务生成鲁棒的度量嵌入。我们在本文中展示了如何结合RETSim的检索能力来创建本地LLM RAG系统。&lt;/p&gt;</description>
    </item>
  </channel>
</rss>
