<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
  <channel>
    <title>序列化优化 on 办公AI智能小助手</title>
    <link>https://blog.qife122.com/tags/%E5%BA%8F%E5%88%97%E5%8C%96%E4%BC%98%E5%8C%96/</link>
    <description>Recent content in 序列化优化 on 办公AI智能小助手</description>
    <generator>Hugo</generator>
    <language>zh-cn</language>
    <copyright>qife</copyright>
    <lastBuildDate>Sat, 20 Sep 2025 03:12:37 +0800</lastBuildDate>
    <atom:link href="https://blog.qife122.com/tags/%E5%BA%8F%E5%88%97%E5%8C%96%E4%BC%98%E5%8C%96/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>自然语言处理框架升级与优化</title>
      <link>https://blog.qife122.com/p/%E8%87%AA%E7%84%B6%E8%AF%AD%E8%A8%80%E5%A4%84%E7%90%86%E6%A1%86%E6%9E%B6%E5%8D%87%E7%BA%A7%E4%B8%8E%E4%BC%98%E5%8C%96/</link>
      <pubDate>Sat, 20 Sep 2025 03:12:37 +0800</pubDate>
      <guid>https://blog.qife122.com/p/%E8%87%AA%E7%84%B6%E8%AF%AD%E8%A8%80%E5%A4%84%E7%90%86%E6%A1%86%E6%9E%B6%E5%8D%87%E7%BA%A7%E4%B8%8E%E4%BC%98%E5%8C%96/</guid>
      <description>&lt;h3 id=&#34;-新特性与改进&#34;&gt;✨ 新特性与改进&lt;/h3&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;重构并优化transformer序列化架构，更好地支持内联transformer组件和监听器替换&lt;/li&gt;&#xA;&lt;li&gt;在TransformerData.model_output和FullTransformerBatch.model_output中提供ModelOutput格式的transformer模型输出（向后兼容的元组格式仍可通过TransformerData.tensors和FullTransformerBatch.tensors获取）&lt;/li&gt;&#xA;&lt;li&gt;新增对transformer_config设置的支持（如output_attentions），额外输出存储在TransformerData.model_output中&lt;/li&gt;&#xA;&lt;li&gt;新增混合精度训练支持&lt;/li&gt;&#xA;&lt;li&gt;通过优化分词器输出的内存分配提升训练速度&lt;/li&gt;&#xA;&lt;li&gt;扩展支持transformers最高至v4.11.x版本&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;h3 id=&#34;-错误修复&#34;&gt;🔴 错误修复&lt;/h3&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;修复GPT2模型支持问题&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;h3 id=&#34;-向后不兼容变更&#34;&gt;⚠️ 向后不兼容变更&lt;/h3&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;v1.1版本的transformer组件序列化格式已变更，与v1.0.x版本不兼容。使用v1.0.x训练的管道可通过v1.1.x加载，但v1.1.x保存的管道无法通过v1.0.x加载&lt;/li&gt;&#xA;&lt;li&gt;TransformerData.tensors和FullTransformerBatch.tensors现在返回元组而非列表&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;h3 id=&#34;-贡献者&#34;&gt;👥 贡献者&lt;/h3&gt;&#xA;&lt;p&gt;@adrianeboyd, @bryant1410, @danieldk, @honnibal, @ines, @KennethEnevoldsen, @svlandeg&lt;/p&gt;</description>
    </item>
    <item>
      <title>快速分词器对齐优化与序列化改进</title>
      <link>https://blog.qife122.com/p/%E5%BF%AB%E9%80%9F%E5%88%86%E8%AF%8D%E5%99%A8%E5%AF%B9%E9%BD%90%E4%BC%98%E5%8C%96%E4%B8%8E%E5%BA%8F%E5%88%97%E5%8C%96%E6%94%B9%E8%BF%9B/</link>
      <pubDate>Thu, 11 Sep 2025 03:21:45 +0800</pubDate>
      <guid>https://blog.qife122.com/p/%E5%BF%AB%E9%80%9F%E5%88%86%E8%AF%8D%E5%99%A8%E5%AF%B9%E9%BD%90%E4%BC%98%E5%8C%96%E4%B8%8E%E5%BA%8F%E5%88%97%E5%8C%96%E6%94%B9%E8%BF%9B/</guid>
      <description>&lt;h3 id=&#34;主要更新内容&#34;&gt;主要更新内容&lt;/h3&gt;&#xA;&lt;h4 id=&#34;基于分词器偏移映射的对齐优化-338&#34;&gt;基于分词器偏移映射的对齐优化 (#338)&lt;/h4&gt;&#xA;&lt;p&gt;对于快速分词器，现采用分词器提供的偏移映射（offset mapping）替代原spacy-alignments的启发式对齐方法。此项改进解决了以下问题：&lt;/p&gt;</description>
    </item>
  </channel>
</rss>
