选举2029：不可能异常——已解决

在写完上一篇文章后不久，一位同事联系我说她发现了问题所在——至少在最直接的层面上，即异常本身。排序代码没有问题，只是异常消息太容易被误读。她完全正确，我后悔莫及。

再次看一下异常消息：

1

Incorrect ordering for PredictionSets: mic-01 should occur before focaldata-01

以及创建该异常的代码：

1
2
3
4
5
6
7


string currentText = selector(current);
string nextText = selector(next);
if (StringComparer.Ordinal.Compare(currentText, nextText) >= 0)
{
    throw new InvalidOperationException(
        $"Incorrect ordering for {message}: {currentText} should occur before {nextText}");
}

在我之前的文章中，我声称：

异常消息暗示在异常发生时，currentText的值是"focaldata-01"，而nextText的值是"mic-01"。

不，并不是这样！它暗示的恰恰相反，即currentText的值是"mic-01"，而nextText的值是"focaldata-01"……换句话说，数据确实有问题。

唉。即使我一直想着“当我的代码出问题时，几乎总是我的错”，我仍然没能真正退后一步，仔细检查我的逻辑。

但这很奇怪，对吧？因为之前无效的数据（20:15:57）后来神奇地“变成”了有效（20:26:22），对吧？这是我在上一篇文章中声称的。我应该更仔细地查看日志……一个新的实例在20:22:58启动。那个新实例正确加载了数据，所以重新加载已经有效的数据是没问题的。

到底出了什么问题？

我在实际修复代码之前就开始写这篇文章，但现在我确定问题在于“部分”重载——向数据库添加一个新的预测集，然后从存储系统中重新加载数据，而该存储系统的缓存中已经有现有数据。这应该相对容易测试——

首先，值得修复那个消息。与其谈论“应该出现”什么，不如说实际情况是什么，以及集合中出错的索引：

1
2
3
4
5
6
7
8
9


foreach (var (index, (current, next)) in source.Zip(source.Skip(1)).Index())
{
    string currentText = selector(current);
    string nextText = selector(next);
    if (StringComparer.Ordinal.Compare(currentText, nextText) >= 0)
    {
        throw new InvalidOperationException($"Incorrect ordering: {message}[{index}]={currentText}; {message}[{index + 1}]={nextText}");
    }
}

接下来，在上传新数据时添加另一层检查：除了从干净启动重载两次外，让我们添加一个“之前然后之后”的重载。这方面的代码并不有趣（尽管由于依赖注入的原因很繁琐）。然后只需测试添加一个ID为“aaaa”的“绝对第一个”预测集……

太好了，我重现了问题！

1

Incorrect ordering: PredictionSets[4]=name-length; PredictionSets[5]=aaaa

之后，没过多久（通过更多的日志记录）就找到了问题。一旦找到，修复起来就非常容易。不涉及太多不必要的细节，我在合并新旧映射时破坏了我的内部“哈希到完整数据”的映射。

1
2
3


var predictionSetsByHash = newHashes.Concat(currentHashes)
    .Zip(currentPredictionSets.Concat(newPredictionSets))
    .ToOrdinalDictionary(pair => pair.First, pair => pair.Second);

应该是：

1
2
3


var predictionSetsByHash = newHashes.Concat(currentHashes)
    .Zip(newPredictionSets.Concat(currentPredictionSets))
    .ToOrdinalDictionary(pair => pair.First, pair => pair.Second);

这只有在加载带有新预测集的上下文时才会成为问题，而我们之前已经有一个预测集。

这就是我的选举网站没有很多自动化测试（这些可能必须是集成测试而不是单元测试）的不足之处……尽管公平地说，这是少数几次情况之一。

可能是时候开始写更多的测试了——尤其是在这种情况下，这是一个在凌晨重写的整个上下文存储系统。

结论

所以，学到了一些教训：

是的，当我的代码出问题时，几乎总是我的错。即使我盯着它看，以为我发现了什么真正奇怪的东西。
我应该写更多的测试。
使异常消息尽可能明确是非常重要的。
我应该总是听阿曼达的。

2029选举：解决不可能异常的技术调试与代码修复

本文详细记录了作者在选举预测系统中遇到的排序异常问题，通过分析异常消息误导性、数据重载机制缺陷和映射合并错误，最终修复了代码逻辑并总结了测试与异常处理的重要性。

选举2029：不可能异常——已解决

结论