AI革命不会被垄断:开源与协作的未来

本文探讨人工智能领域是否会被垄断,分析机器学习研究、数据价值及开源生态,强调技术发展的多样性与协作性,而非单一赢家通吃的局面。

AI革命不会被垄断

谁将“在AI领域获胜”?目前有几家大型公司急于宣称这一头衔。另一些人则认为中国将接管AI领域,使欧洲和美国远远落后。但除非真正实现人工通用智能(AGI),否则没有理由相信机器学习或数据科学会有单一赢家。相反,AI将遵循与其他软件开发技术相同的轨迹:众多开发者、丰富的生态系统、许多失败的项目和一些闪耀的成功故事。

“AI竞赛”的概念令人困惑

“AI竞赛”的含义包括:

  • 竞赛具有竞争性
  • 竞赛有赢家和输家
  • 竞赛有起点和终点

但当我们谈论AI时,具体指什么?

  • 特定的消费产品?
  • “人工通用智能”?
  • 技术官僚专制?
  • 机器人军队?
  • 机器学习研究?

垄断新产品类别?

许多新产品将使用机器学习,许多将被垄断。但由谁垄断?如果不同公司制造所有这些产品,谁“赢”了AI?

率先开发“人工通用智能”?

从当前技术推断到真正的AGI非常困难。即使有人开发出AGI,谁先开发还重要吗?

  • 如果你认为“AGI是科幻”,那么没有什么可赢的
  • 如果你认为“AGI是生存威胁”,那么没有人会赢
  • 如果你认为“AGI将解决所有问题”,那么每个人都是赢家?

使用新技术压迫人民?

压迫是AI中应该讨论的风险,但绝不是我们想要赢得的竞赛!

赢得实际军备竞赛?

政府研究将跟随而非领先。如果每个人都公开出版,没有人会远远领先。

发表最多的机器学习研究?

开放研究是协作的,而非竞争的。如果研究公开,每个人都是赢家。

为什么像某中心这样的公司不保密研究?

公司出版研究的原因:

  • 吸引人才:如果不让研究人员出版,就无法吸引最优秀的研究者
  • 不可避免性:试图封锁秘密不会成功
  • 杠杆作用:提高“AI水位”对他们的业务有利

根据NIPS接受论文统计(Robbie Allen,Medium),没有一家机构“主导”机器学习研究:

  1. 某中心:60篇(8.8%)
  2. 卡内基梅隆大学:48篇(7.1%)
  3. 麻省理工学院:43篇(6.3%)
  4. 某机构:40篇(5.9%)
  5. 斯坦福大学:39篇(5.7%)

但数据呢?

重用数据就像重用代码。如果它不做你想要的事,它就没有多大用处。个人数据只有在涉及你个人时才重要。通用知识很容易获取,不需要独特的专有数据集。

数据本身不会授予任何人垄断权

数据有递减回报:使数据集增大10倍不会使其好10倍。数据并不那么昂贵!有什么数据集比制造厂更贵?

我们不会都从“AI商店”购买AI

公司正在内部化机器学习,因为:

  • 机器学习是软件开发,需要随项目演进
  • 没有人垄断AI专业知识,人们学习很快
  • 对许多应用来说,拥有和控制数据至关重要

供应商可以提供产品,而非魔法

挑战在于将理论上可能的东西应用于问题。重要的是为更大的应用做出正确的决策。

买家并不老且愚蠢

技术文盲管理的刻板印象已经过时。大多数公司让开发者选择工具。开发者强烈偏好开放技术:更灵活,更好的职业发展。

丰富的开源生态系统

GitHub URL GitHub星标
TensorFlow tensorflow/tensorflow 115k
scikit-learn scikit-learn/scikit-learn 32k
PyTorch pytorch/pytorch 21k
XGBoost dmlc/xgboost 14k
spaCy explosion/spacy 11k
Gensim RaRe-Technologies/gensim 8k
NLTK nltk/nltk 7k

来源:GitHub(2018年11月)

那么,谁将赢得AI?

✊ AI革命不会被垄断:

  • 没有单一的“AI竞赛”——许多人在构建许多东西
  • 没有等待被发现的魔法解决方案
  • 机器学习没有任何方面表明垄断或赢家通吃市场

感谢阅读!

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计