<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
  <channel>
    <title>事故分析 on 办公AI智能小助手</title>
    <link>https://blog.qife122.com/tags/%E4%BA%8B%E6%95%85%E5%88%86%E6%9E%90/</link>
    <description>Recent content in 事故分析 on 办公AI智能小助手</description>
    <generator>Hugo</generator>
    <language>zh-cn</language>
    <copyright>qife</copyright>
    <lastBuildDate>Tue, 30 Dec 2025 08:12:49 +0800</lastBuildDate>
    <atom:link href="https://blog.qife122.com/tags/%E4%BA%8B%E6%95%85%E5%88%86%E6%9E%90/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>追寻根本原因是条歧路：与David Blank-Edelman探讨软件架构与可靠性工程</title>
      <link>https://blog.qife122.com/p/%E8%BF%BD%E5%AF%BB%E6%A0%B9%E6%9C%AC%E5%8E%9F%E5%9B%A0%E6%98%AF%E6%9D%A1%E6%AD%A7%E8%B7%AF%E4%B8%8Edavid-blank-edelman%E6%8E%A2%E8%AE%A8%E8%BD%AF%E4%BB%B6%E6%9E%B6%E6%9E%84%E4%B8%8E%E5%8F%AF%E9%9D%A0%E6%80%A7%E5%B7%A5%E7%A8%8B/</link>
      <pubDate>Tue, 30 Dec 2025 08:12:49 +0800</pubDate>
      <guid>https://blog.qife122.com/p/%E8%BF%BD%E5%AF%BB%E6%A0%B9%E6%9C%AC%E5%8E%9F%E5%9B%A0%E6%98%AF%E6%9D%A1%E6%AD%A7%E8%B7%AF%E4%B8%8Edavid-blank-edelman%E6%8E%A2%E8%AE%A8%E8%BD%AF%E4%BB%B6%E6%9E%B6%E6%9E%84%E4%B8%8E%E5%8F%AF%E9%9D%A0%E6%80%A7%E5%B7%A5%E7%A8%8B/</guid>
      <description>&lt;h4 id=&#34;关键要点&#34;&gt;关键要点&lt;/h4&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;可靠性是架构的一种涌现属性，可以包含对客户重要的任何属性，如可用性、延迟、吞吐量、持久性或信息新鲜度。因此，它超越了单个用例。&lt;/li&gt;&#xA;&lt;li&gt;不存在所谓的事故单一根本原因。失败有多种原因，其中一些是社会技术性的。有时为了理解事故，必须了解事故发生前某物是如何工作的。&lt;/li&gt;&#xA;&lt;li&gt;架构师和软件可靠性工程师应建立基于对系统实际工作方式好奇心的协作关系。有关失败的知识应与架构师和设计师共享，这样他们不仅能了解系统在实践中的运行方式，还能利用这些信息在未来设计出更好的系统。&lt;/li&gt;&#xA;&lt;li&gt;事后审查应首先关注“什么”和“如何”，然后再问“为什么”。过早关注“为什么”通常会遗漏重要信息。&lt;/li&gt;&#xA;&lt;li&gt;复杂系统几乎总是处于失败的边缘。&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;h4 id=&#34;文稿&#34;&gt;文稿&lt;/h4&gt;&#xA;&lt;p&gt;&lt;strong&gt;Michael Stiefel&lt;/strong&gt;：欢迎来到架构师播客，在这里我们讨论成为架构师意味着什么，以及架构师实际上如何工作。今天，我们将讨论一些对架构师非常重要但通常没有明确讨论的话题。我们已经在这个播客上多次谈到了可靠性和为失败而设计，但我们还没有讨论过如何让我们的系统设计更加健壮，而不仅仅是在失败后进行修复。&lt;/p&gt;</description>
    </item>
    <item>
      <title>HubSpot 2025年8月7日事故报告：系统配置变更引发的服务中断</title>
      <link>https://blog.qife122.com/p/hubspot-2025%E5%B9%B48%E6%9C%887%E6%97%A5%E4%BA%8B%E6%95%85%E6%8A%A5%E5%91%8A%E7%B3%BB%E7%BB%9F%E9%85%8D%E7%BD%AE%E5%8F%98%E6%9B%B4%E5%BC%95%E5%8F%91%E7%9A%84%E6%9C%8D%E5%8A%A1%E4%B8%AD%E6%96%AD/</link>
      <pubDate>Thu, 20 Nov 2025 03:31:11 +0800</pubDate>
      <guid>https://blog.qife122.com/p/hubspot-2025%E5%B9%B48%E6%9C%887%E6%97%A5%E4%BA%8B%E6%95%85%E6%8A%A5%E5%91%8A%E7%B3%BB%E7%BB%9F%E9%85%8D%E7%BD%AE%E5%8F%98%E6%9B%B4%E5%BC%95%E5%8F%91%E7%9A%84%E6%9C%8D%E5%8A%A1%E4%B8%AD%E6%96%AD/</guid>
      <description>&lt;h1 id=&#34;hubspot-事故报告2025年8月7日&#34;&gt;HubSpot 事故报告：2025年8月7日&lt;/h1&gt;&#xA;&lt;p&gt;2025年8月7日星期四下午1:45至2:05（美国东部时间），HubSpot客户在访问CRM记录时遭遇大面积错误。在影响高峰期约95%的请求失败，导致所有记录页面、对象预览和工作区预览侧边栏显示&amp;quot;All is not lost&amp;quot;错误。&lt;/p&gt;</description>
    </item>
  </channel>
</rss>
