<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
  <channel>
    <title>文本标注 on 办公AI智能小助手</title>
    <link>https://blog.qife122.com/tags/%E6%96%87%E6%9C%AC%E6%A0%87%E6%B3%A8/</link>
    <description>Recent content in 文本标注 on 办公AI智能小助手</description>
    <generator>Hugo</generator>
    <language>zh-cn</language>
    <copyright>qife</copyright>
    <lastBuildDate>Sat, 20 Sep 2025 22:29:54 +0800</lastBuildDate>
    <atom:link href="https://blog.qife122.com/tags/%E6%96%87%E6%9C%AC%E6%A0%87%E6%B3%A8/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>突破性文本标注技术Spancat架构解析</title>
      <link>https://blog.qife122.com/p/%E7%AA%81%E7%A0%B4%E6%80%A7%E6%96%87%E6%9C%AC%E6%A0%87%E6%B3%A8%E6%8A%80%E6%9C%AFspancat%E6%9E%B6%E6%9E%84%E8%A7%A3%E6%9E%90/</link>
      <pubDate>Sat, 20 Sep 2025 22:29:54 +0800</pubDate>
      <guid>https://blog.qife122.com/p/%E7%AA%81%E7%A0%B4%E6%80%A7%E6%96%87%E6%9C%AC%E6%A0%87%E6%B3%A8%E6%8A%80%E6%9C%AFspancat%E6%9E%B6%E6%9E%84%E8%A7%A3%E6%9E%90/</guid>
      <description>&lt;h1 id=&#34;spancat文本标注的新方法&#34;&gt;Spancat：文本标注的新方法&lt;/h1&gt;&#xA;&lt;p&gt;SpanCategorizer是spaCy框架中的一个组件，旨在满足NLP社区对多样化标注跨度的结构化标注需求，包括长短语、非命名实体或重叠标注。本文将深入探讨spancat的工作原理并展示其新特性。&lt;/p&gt;</description>
    </item>
    <item>
      <title>高级文本数据标注技术全面指南</title>
      <link>https://blog.qife122.com/p/%E9%AB%98%E7%BA%A7%E6%96%87%E6%9C%AC%E6%95%B0%E6%8D%AE%E6%A0%87%E6%B3%A8%E6%8A%80%E6%9C%AF%E5%85%A8%E9%9D%A2%E6%8C%87%E5%8D%97/</link>
      <pubDate>Fri, 19 Sep 2025 18:21:12 +0800</pubDate>
      <guid>https://blog.qife122.com/p/%E9%AB%98%E7%BA%A7%E6%96%87%E6%9C%AC%E6%95%B0%E6%8D%AE%E6%A0%87%E6%B3%A8%E6%8A%80%E6%9C%AF%E5%85%A8%E9%9D%A2%E6%8C%87%E5%8D%97/</guid>
      <description>&lt;h1 id=&#34;高级文本数据标注技术全面指南&#34;&gt;高级文本数据标注技术：全面指南&lt;/h1&gt;&#xA;&lt;h2 id=&#34;文本数据标注技术&#34;&gt;文本数据标注技术&lt;/h2&gt;&#xA;&lt;p&gt;文本数据标注（又称文本注释）是为原始文本添加有意义标签的过程，使其可用于机器学习和自然语言处理任务。常见的标注类型包括：&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;情感分析（正面、负面或中性）&lt;/li&gt;&#xA;&lt;li&gt;命名实体识别（国家、人物、组织）&lt;/li&gt;&#xA;&lt;li&gt;意图分类（请求、投诉）&lt;/li&gt;&#xA;&lt;li&gt;主题分类（体育、政治、经济）&lt;/li&gt;&#xA;&lt;li&gt;词性标注（动词、名词、形容词）&lt;/li&gt;&#xA;&lt;li&gt;根据需求定制的自定义类别&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;p&gt;大型语言模型（LLMs）作为标注工具可通过少样本学习或检索增强生成显著提升效率。即使是使用某机构的Claude Sonnet 3.5或某中心的GPT4o等先进模型的零样本策略也能大幅优化流程。这些模型采用基于主动学习的RLHF（人类反馈强化学习）进行训练。&lt;/p&gt;</description>
    </item>
  </channel>
</rss>
