研究债务
实现大多数课题的研究级理解如同攀登高峰。有志研究者必须努力理解前人的大量工作,学习技术并培养直觉。登顶后,新研究者开始创新工作,将新石块垒至山顶,为后来者稍稍增高这座山峰。
数学是典型例证。几个世纪以来,无数智者攀登数学山脉并在顶峰放置新岩石。随时间推移,基于特别优美结果的不同峰顶逐渐形成。如今数学峰顶如此众多陡峭,无人能全部攀登。即使终身 dedicated 努力,数学家可能仅欣赏部分景观。
人们预期攀登艰难,这反映数学领域的巨大进展与累积努力。攀登被视为智力朝圣,劳动是成人礼。但攀登本可更容易——完全可能修建路径与阶梯(即真正优秀的教程、综述、教科书等)。攀登不值得骄傲,攀登不是进步:攀登是债务之山。
债务形式
程序员谈论技术债务:存在短期快速但长期有问题的软件开发方式。管理者谈论制度债务:机构可能快速发展但不良实践悄然渗入。两者都易积累难消除。
研究同样存在债务,表现为四种形式:
糟糕的阐述:重要思想常缺乏良好解释,理解需艰难挣扎。该问题如此普遍以致被视为理所当然,未意识到改进空间。
未消化的思想:多数思想初始粗糙难懂。通过打磨、发展恰当类比、语言和思维方式,变得极其容易理解。
不良抽象与符号体系:抽象与符号是研究的用户界面,塑造我们思考与交流方式。不幸的是,常被困在最初的形式化表达中,即使它们很糟糕(例如带额外电子的物体带负电,π的符号问题)。
信息噪声:研究者如同站在建筑工地中央。无数论文争夺注意力,缺乏有效过滤或总结机制。因多数工作解释拙劣,理解每项工作需消耗大量能量。许多论文需要一句话概括,但需费力挣扎才能获得。因吸引关注的最简单方式是获取所有人注意力,我们被工作淹没。因激励“多产”,更多工作涌来…我们认为噪声是专家体验研究债务的主要方式。
研究债务的阴险之处在于其常态化。所有人视之为理所当然,未意识到改变可能。例如,研究解释平庸是常态,人们视之为解释质量上限。当真正优秀解释罕见出现时,被视为一次性奇迹而非系统性改进的标志。
解释劳动
解释投入能量与理解所需能量存在权衡。极端情况下,解释者可精心 crafting 优美解释,引导受众无痛理解;另一极端,解释者做最低限度工作弃受众于挣扎中。这种能量称为解释劳动。
多数解释非一对一。人们演讲、写书或在线交流。在这些一对多场景中,每位受众支付理解成本,而解释成本保持不变。更形式化地,若N人试图相互理解,每人需O(1)努力解释自己思想,但需O(N)努力理解其他N-1人思想。总能量成本呈O(a + bN),其中a、b为解释侧与理解侧能量权衡系数。这与《人月神话》思想相似——理解成本在解释劳动权衡中存在乘数效应,有时是巨大乘数(例如某博客平均读者超10万,为每位读者节省1秒即节省人类30小时)。
研究中,常有一群研究者试图相互理解。解释成本随群体增长保持恒定,但理解成本随新成员增加。达到某规模时,理解他人的努力变得过大。作为防御机制,人们专业化,聚焦更窄领域。领域可维持规模受成员沟通与理解能量权衡控制。
研究债务是缺失解释劳动的累积。新思想经历债务阶段极其自然,如工程中的早期原型。问题是我们常止步于此。新思想非终点供我们放入论文后抛弃。当任其停滞时债务堆积,理解与构建彼此工作变得更难,领域碎片化。
清晰思考
需明确研究债务不仅是思想解释不佳,更是思想消化不足——或至少公共版本思想未消化。通常,某些个体拥有比公开分享更发展的思想版本。不分享原因众多(特别是常无法传统发表)。这是思想的公共混乱。
开发良好抽象、符号、可视化等是改进思想用户界面。这有助于首次理解与清晰思考。反之,若无法很好解释思想,常表明我们未尽可能理解它。两者携手并进不足为奇——思考部分是与自我对话。
研究蒸馏
研究蒸馏是研究债务的反面。结合深度科学理解、共情与设计,公正对待研究并揭示美丽洞察,令人极其满足。
蒸馏亦困难。容易认为解释思想仅是抛光层,但良好解释常涉及思想转化。这种思想 refinement 需付出与初始发现同等努力与深度理解。
这使我们无捷径可走。无法靠一人写教科书解决研究债务:其能量过于分散无法从头抛光每个思想。无法将蒸馏外包给技能较低非专家:提炼与解释思想需要创造力与深度理解,与新研究同等。
研究蒸馏不必是你,但必须是我们。
蒸馏者何在?
如同理论家、实验者或研究工程师,研究蒸馏者是健康研究社区不可或缺角色。目前几乎无人担任。
研究者为何不从事蒸馏?一可能是反常激励(如希望工作显得困难)。这些确实存在,但我们认为非主因。存在许多反对良好解释、数据共享等的反常激励。当工作无趣或不可复现欲掩盖时尤甚。或有众多竞争者不欲其赶上。但我们经验是多数优秀研究者似乎不受此类因素驱动。主因是从追求成果转向蒸馏事物不值得能量分流。或许他领域不同或我不够愤世嫉俗。
另一可能是他们不享受研究蒸馏。我们再次认为非实情。许多人想从事研究蒸馏。不幸的是,难以实现,因我们不支持他们。存在对研究蒸馏工作者的奇怪非正式支持。某人个人受益匪浅。但这不可靠且未广而告之,难以建立职业生涯。
有志研究蒸馏者缺乏许多易视为理所当然之物:职业路径、学习场所、范例与榜样。深层问题是其工作未被视作真正研究贡献。我们需要改变。
蒸馏生态系统
若你兴奋于提炼思想、寻求清晰度、构建优美解释,我们让你失望。你有宝贵贡献,我们未以应有方式支持你。
蒸馏生态系统试图更好支持此类工作。目前有三部分:
- 蒸馏期刊:为非传统贡献提供传统验证场所。
- 蒸馏奖:1万美元奖金认可机器学习优秀解释。
- 蒸馏基础设施:制作美丽交互式文章的工具。
这仅是开始:需做更多。此类工作完整生态系统需要其他组件,包括学习这些技能的场所与可靠就业来源。我们乐观随时间推移将实现。
延伸阅读
视觉数学:数位数学家做出显著努力视觉解释某些课题。Needham的《视觉复分析》特别突出,但存在许多通过视觉重构带来新清晰度的可爱范例,以及大量视觉证明。
可探索解释:松散社区探索计算机启用的交互媒介如何以以前不可能的方式交流与思考。这些思想如计算中许多思想始于Douglas Engelbart与Alan Kay的工作。最近,“可探索解释”重新想象此新媒介中文章可能形式。始于Bret Victor的基础文章,并由惊人范例进一步发展。还有探索如何在此新媒介中增强思考能力,使以前难及思想触手可及。再次,Bret Victor与Michael Nielsen有妙想。
研究传播:过去几十年,大力推动研究在线免费获取。包括arXiv.org与PLOS形成,期刊编辑委员会辞职创办开放获取期刊。日益挑战是过滤可访问内容。某人的ArXiv Sanity是此方面可爱工具。在线社区群体策展也有大助。
开放笔记本科学:如某人的Academic Pensieve等开放笔记本科学,及Polymath Project等大规模协作研究项目,将结果共享与正式发表分离。这似乎非常重要。传统上,若未将研究转化为论文,基本如同未做。这强烈激励所有研究装扮重要论文,增加噪声。
债务与蒸馏讨论:许多数学家讨论我们所称的研究蒸馏。某MathOverflow线程收集了精彩评论与参考文献——特别提请注意Thurston在某文第6节中关于意外用研究债务淹没杀死领域的叙述。此空间其他妙想包括“开放阐述问题”思想、某人的数学“海涨”方法,及最近呼吁更重视CS概念进展。
致谢
非常感谢某人在文章插图方面的建议与协助。 本文章受益于多人评论,包括:某人等。
作者贡献
本文章主要由某人撰写,某人插图。