<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
  <channel>
    <title>音频转录 on 办公AI智能小助手</title>
    <link>https://blog.qife122.com/tags/%E9%9F%B3%E9%A2%91%E8%BD%AC%E5%BD%95/</link>
    <description>Recent content in 音频转录 on 办公AI智能小助手</description>
    <generator>Hugo</generator>
    <language>zh-cn</language>
    <copyright>qife</copyright>
    <lastBuildDate>Sun, 26 Oct 2025 08:10:44 +0800</lastBuildDate>
    <atom:link href="https://blog.qife122.com/tags/%E9%9F%B3%E9%A2%91%E8%BD%AC%E5%BD%95/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>掌握Gemini API音频转录：从基础实现到实时流处理</title>
      <link>https://blog.qife122.com/p/%E6%8E%8C%E6%8F%A1gemini-api%E9%9F%B3%E9%A2%91%E8%BD%AC%E5%BD%95%E4%BB%8E%E5%9F%BA%E7%A1%80%E5%AE%9E%E7%8E%B0%E5%88%B0%E5%AE%9E%E6%97%B6%E6%B5%81%E5%A4%84%E7%90%86/</link>
      <pubDate>Sun, 26 Oct 2025 08:10:44 +0800</pubDate>
      <guid>https://blog.qife122.com/p/%E6%8E%8C%E6%8F%A1gemini-api%E9%9F%B3%E9%A2%91%E8%BD%AC%E5%BD%95%E4%BB%8E%E5%9F%BA%E7%A1%80%E5%AE%9E%E7%8E%B0%E5%88%B0%E5%AE%9E%E6%97%B6%E6%B5%81%E5%A4%84%E7%90%86/</guid>
      <description>&lt;h1 id=&#34;使用gemini-api掌握音频转录&#34;&gt;使用Gemini API掌握音频转录&lt;/h1&gt;&#xA;&lt;p&gt;Gemini模型是多模态大语言模型，能够处理和生成多种类型的数据，包括文本、代码、图像、音频和视频。Gemini模型提供强大的音频转录功能，使开发人员能够将语音内容转换为文本。这有助于构建转录服务、为视频创建字幕以及开发语音启用的应用程序。如果您希望使用Gemini强大的AI模型将语音转换为文本，本综合指南将展示如何使用不同的Gemini API实现音频转录。我们将从基础实现到高级实时流处理逐步讲解。&lt;/p&gt;</description>
    </item>
    <item>
      <title>利用OpenAI Whisper实现音频转录技术</title>
      <link>https://blog.qife122.com/p/%E5%88%A9%E7%94%A8openai-whisper%E5%AE%9E%E7%8E%B0%E9%9F%B3%E9%A2%91%E8%BD%AC%E5%BD%95%E6%8A%80%E6%9C%AF/</link>
      <pubDate>Fri, 19 Sep 2025 11:47:10 +0800</pubDate>
      <guid>https://blog.qife122.com/p/%E5%88%A9%E7%94%A8openai-whisper%E5%AE%9E%E7%8E%B0%E9%9F%B3%E9%A2%91%E8%BD%AC%E5%BD%95%E6%8A%80%E6%9C%AF/</guid>
      <description>&lt;h1 id=&#34;音频转录与openai-whisper模型集成方案&#34;&gt;音频转录与OpenAI Whisper模型集成方案&lt;/h1&gt;&#xA;&lt;h2 id=&#34;技术概述&#34;&gt;技术概述&lt;/h2&gt;&#xA;&lt;p&gt;本方案通过集成OpenAI Whisper模型实现高质量音频转录功能，需配合ffmpeg工具进行音频预处理。&lt;/p&gt;&#xA;&lt;h2 id=&#34;环境配置&#34;&gt;环境配置&lt;/h2&gt;&#xA;&lt;h3 id=&#34;安装依赖&#34;&gt;安装依赖&lt;/h3&gt;&#xA;&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;&#xA;&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;&#xA;&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1&#xA;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&#xA;&lt;td class=&#34;lntd&#34;&gt;&#xA;&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;pip install &lt;span class=&#34;s2&#34;&gt;&amp;#34;prodigy-whisper @ git+https://github.com/explosion/prodigy-whisper&amp;#34;&lt;/span&gt;&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;&#xA;&lt;/div&gt;&#xA;&lt;/div&gt;&lt;h3 id=&#34;系统要求&#34;&gt;系统要求&lt;/h3&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;必须预先安装ffmpeg音频处理工具&lt;/li&gt;&#xA;&lt;li&gt;支持Python运行环境&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;h2 id=&#34;技术架构&#34;&gt;技术架构&lt;/h2&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;采用Whisper模型进行音频到文本的转换&lt;/li&gt;&#xA;&lt;li&gt;通过GitHub仓库直接获取最新版本代码&lt;/li&gt;&#xA;&lt;li&gt;使用MIT开源协议&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;h2 id=&#34;问题支持&#34;&gt;问题支持&lt;/h2&gt;&#xA;&lt;p&gt;如遇技术问题可通过官方论坛反馈，开发团队将提供技术支持。&lt;/p&gt;</description>
    </item>
  </channel>
</rss>
