<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
  <channel>
    <title>考试生成 on 办公AI智能小助手</title>
    <link>https://blog.qife122.com/tags/%E8%80%83%E8%AF%95%E7%94%9F%E6%88%90/</link>
    <description>Recent content in 考试生成 on 办公AI智能小助手</description>
    <generator>Hugo</generator>
    <language>zh-cn</language>
    <copyright>qife</copyright>
    <lastBuildDate>Fri, 03 Oct 2025 00:51:36 +0800</lastBuildDate>
    <atom:link href="https://blog.qife122.com/tags/%E8%80%83%E8%AF%95%E7%94%9F%E6%88%90/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>自动评估RAG管道的考试生成技术</title>
      <link>https://blog.qife122.com/p/%E8%87%AA%E5%8A%A8%E8%AF%84%E4%BC%B0rag%E7%AE%A1%E9%81%93%E7%9A%84%E8%80%83%E8%AF%95%E7%94%9F%E6%88%90%E6%8A%80%E6%9C%AF/</link>
      <pubDate>Fri, 03 Oct 2025 00:51:36 +0800</pubDate>
      <guid>https://blog.qife122.com/p/%E8%87%AA%E5%8A%A8%E8%AF%84%E4%BC%B0rag%E7%AE%A1%E9%81%93%E7%9A%84%E8%80%83%E8%AF%95%E7%94%9F%E6%88%90%E6%8A%80%E6%9C%AF/</guid>
      <description>&lt;p&gt;在快速演进的大语言模型领域，准确评估检索增强生成模型至关重要。本文介绍了一种开创性方法，该方法采用自动化考试生成流程，并辅以项目反应理论，来评估RAG模型在特定任务上的事实准确性。我们的方法不仅稳健、可解释且成本效益高，还能战略性地识别模型优势并优化考试以最大化其评估效用。&lt;/p&gt;</description>
    </item>
  </channel>
</rss>
