<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
  <channel>
    <title>项目反应理论 on 办公AI智能小助手</title>
    <link>https://blog.qife122.com/tags/%E9%A1%B9%E7%9B%AE%E5%8F%8D%E5%BA%94%E7%90%86%E8%AE%BA/</link>
    <description>Recent content in 项目反应理论 on 办公AI智能小助手</description>
    <generator>Hugo</generator>
    <language>zh-cn</language>
    <copyright>qife</copyright>
    <lastBuildDate>Tue, 02 Sep 2025 04:33:42 +0800</lastBuildDate>
    <atom:link href="https://blog.qife122.com/tags/%E9%A1%B9%E7%9B%AE%E5%8F%8D%E5%BA%94%E7%90%86%E8%AE%BA/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>自动化评估RAG管道的考试生成技术</title>
      <link>https://blog.qife122.com/p/%E8%87%AA%E5%8A%A8%E5%8C%96%E8%AF%84%E4%BC%B0rag%E7%AE%A1%E9%81%93%E7%9A%84%E8%80%83%E8%AF%95%E7%94%9F%E6%88%90%E6%8A%80%E6%9C%AF/</link>
      <pubDate>Tue, 02 Sep 2025 04:33:42 +0800</pubDate>
      <guid>https://blog.qife122.com/p/%E8%87%AA%E5%8A%A8%E5%8C%96%E8%AF%84%E4%BC%B0rag%E7%AE%A1%E9%81%93%E7%9A%84%E8%80%83%E8%AF%95%E7%94%9F%E6%88%90%E6%8A%80%E6%9C%AF/</guid>
      <description>&lt;h1 id=&#34;自动化评估rag管道的考试生成技术&#34;&gt;自动化评估RAG管道的考试生成技术&lt;/h1&gt;&#xA;&lt;p&gt;在快速演进的大语言模型（LLM）领域，准确评估检索增强生成（RAG）模型至关重要。本文介绍了一种开创性方法，采用自动化考试生成流程，并通过项目反应理论（IRT）增强，以评估RAG模型在特定任务上的事实准确性。该方法不仅稳健、可解释且成本效益高，还能战略性地识别模型优势并优化考试以提升评估效用。&lt;/p&gt;</description>
    </item>
  </channel>
</rss>
