AI革命不会被垄断
谁将“在AI领域获胜”?目前有几家大型公司急于宣称这一头衔。另一些人则认为中国将接管AI领域,使欧洲和美国远远落后。但除非真正实现人工通用智能(AGI),否则没有理由相信机器学习或数据科学会有单一赢家。相反,AI将遵循与其他软件开发技术相同的轨迹:众多开发者、丰富的生态系统、许多失败的项目和一些闪耀的成功故事。
“AI竞赛”的概念令人困惑
“AI竞赛”的含义包括:
- 竞赛具有竞争性
- 竞赛有赢家和输家
- 竞赛有起点和终点
但当我们谈论AI时,具体指什么?
- 特定的消费产品?
- “人工通用智能”?
- 技术官僚专制?
- 机器人军队?
- 机器学习研究?
垄断新产品类别?
许多新产品将使用机器学习,许多将被垄断。但由谁垄断?如果不同公司制造所有这些产品,谁“赢”了AI?
率先开发“人工通用智能”?
从当前技术推断到真正的AGI非常困难。即使有人开发出AGI,谁先开发还重要吗?
- 如果你认为“AGI是科幻”,那么没有什么可赢的
- 如果你认为“AGI是生存威胁”,那么没有人会赢
- 如果你认为“AGI将解决所有问题”,那么每个人都是赢家?
使用新技术压迫人民?
压迫是AI中应该讨论的风险,但绝不是我们想要赢得的竞赛!
赢得实际军备竞赛?
政府研究将跟随而非领先。如果每个人都公开出版,没有人会远远领先。
发表最多的机器学习研究?
开放研究是协作的,而非竞争的。如果研究公开,每个人都是赢家。
为什么像某中心这样的公司不保密研究?
公司出版研究的原因:
- 吸引人才:如果不让研究人员出版,就无法吸引最优秀的研究者
- 不可避免性:试图封锁秘密不会成功
- 杠杆作用:提高“AI水位”对他们的业务有利
根据NIPS接受论文统计(Robbie Allen,Medium),没有一家机构“主导”机器学习研究:
- 某中心:60篇(8.8%)
- 卡内基梅隆大学:48篇(7.1%)
- 麻省理工学院:43篇(6.3%)
- 某机构:40篇(5.9%)
- 斯坦福大学:39篇(5.7%)
但数据呢?
重用数据就像重用代码。如果它不做你想要的事,它就没有多大用处。个人数据只有在涉及你个人时才重要。通用知识很容易获取,不需要独特的专有数据集。
数据本身不会授予任何人垄断权
数据有递减回报:使数据集增大10倍不会使其好10倍。数据并不那么昂贵!有什么数据集比制造厂更贵?
我们不会都从“AI商店”购买AI
公司正在内部化机器学习,因为:
- 机器学习是软件开发,需要随项目演进
- 没有人垄断AI专业知识,人们学习很快
- 对许多应用来说,拥有和控制数据至关重要
供应商可以提供产品,而非魔法
挑战在于将理论上可能的东西应用于问题。重要的是为更大的应用做出正确的决策。
买家并不老且愚蠢
技术文盲管理的刻板印象已经过时。大多数公司让开发者选择工具。开发者强烈偏好开放技术:更灵活,更好的职业发展。
丰富的开源生态系统
库 | GitHub URL | GitHub星标 |
---|---|---|
TensorFlow | tensorflow/tensorflow | 115k |
scikit-learn | scikit-learn/scikit-learn | 32k |
PyTorch | pytorch/pytorch | 21k |
XGBoost | dmlc/xgboost | 14k |
spaCy | explosion/spacy | 11k |
Gensim | RaRe-Technologies/gensim | 8k |
NLTK | nltk/nltk | 7k |
来源:GitHub(2018年11月)
那么,谁将赢得AI?
✊ AI革命不会被垄断:
- 没有单一的“AI竞赛”——许多人在构建许多东西
- 没有等待被发现的魔法解决方案
- 机器学习没有任何方面表明垄断或赢家通吃市场
感谢阅读!