数据科学在机器学习中的可视化教学应用

本文介绍了一位数据科学家如何通过可视化解释器帮助人们理解机器学习基础概念,包括MLU Explain项目的创建过程和动画教学工具的开发,以及数据科学在各个领域的广泛应用前景。

“数据科学可应用于各个领域”

某机构网络服务数据科学家Jared Wilber在机器学习大学团队工作,他帮助创建可视化解释器,帮助他人理解机器学习的基础概念。

2012年,《哈佛商业评论》的一篇文章称数据科学为"21世纪最性感的工作"。虽然这个标题可能看起来夸张,但很容易理解为什么企业高管会对数据科学着迷。

“这很严肃,正在爆炸式增长,这是一件好事。数据科学可应用于各个领域,我认为这种爆炸式增长正是我们想要制作内容来解释这些概念的原因,“某机构网络服务数据科学家Jared Wilber说。

Wilber在公司担任特殊且可能独特的角色。作为他在机器学习大学团队工作的一部分,他帮助创建可视化解释器,帮助他人理解机器学习的基础概念。

他的团队最近推出了MLU Explain,这是一个公共网站,包含视觉文章,融合了有趣的动画,以易于理解的方式解释机器学习概念。

“学习机器学习很难,根据你的背景,存在多个入门障碍。它需要大量数学、统计学、计算机科学等学科的预设先验知识,“他说。“它通常以不吸引人的形式呈现,与机器学习系统互动和建立直觉需要专门的软件配置。这些概念很困难,但交互式文章有助于使学习变得更容易。”

Wilber的教育动画解释器都加入了不少幽默元素。

“使用幽默的目的是让机器学习背后的概念尽可能不令人生畏。因为很多这些概念在你第一次遇到时就像数学墙一样,“他说。

例如,为了解释统计测试的概念,Wilber帮助创建了"置换测试:视觉解释”。

这个假设性例子预示了他后来为MLU Explain创作的风格,引导读者通过测试来看哪种羊驼洗发水会导致更高质量的羊毛,配有粉色和蓝色羊驼的有用动画。

使用这个主题,Wilber引导读者完成随机化、响应值、测试统计、置换、测试统计分布、p值,最后是结果的步骤。

Freakonomics的诱惑

Wilber解释事物的动力恰当地始于图书馆。

他青少年时期在学校图书馆度过额外时间时,首次对统计学和图形学产生了兴趣。

“我妈妈是老师,也是单亲家长,所以基本上我和我的双胞胎兄弟Lucas(某机构的软件工程师)放学后必须在学校图书馆等她,“他解释说。“我读了这本叫《Freakonomics》的书,当时我不知道,但它是关于行为经济学的。我真的很着迷。它基本上是关于意外主题的数据科学案例研究。”

“我还发现了信息图的书,当时真的吸引了我的注意力。有一本书展示了《星球大战》的所有飞船,还有一本国家地理书,有关于自然世界的事实。我认为这些酷炫的解释真的很有趣。”

高中毕业后,Wilber就读于加州大学伯克利分校,在伯克利数据科学研究所工作,获得统计学和计算机科学学位,然后继续在两家初创公司工作。他发现了对开源工作的欣赏。

“在BIDS,有一些非常聪明的人在做真正有影响力的开源项目,比如Project Jupyter,这绝对给我留下了印象。在实习期间,有一位经理鼓励我为我们的工作重叠的任何Python或R库做出贡献。”

但一次意外的休假导致了Jared最喜欢的开源项目roughViz.js——一个数据可视化库,允许用户在浏览器中绘制手绘风格的图表。

“我不想说得太悲惨,但我因为先天问题做了心脏手术。我有两到三个月的恢复期,我想做一些有趣的事情并提高我的技能。”

追求激情

Wilber从小玩滑板,所以他的第一篇互动文章是对几十年来滑板运动中音乐使用变化的统计解释。这篇互动文章引起了The Pudding编辑Matt Daniels的注意。

“Matt看到了我的文章并联系我,问我是否想把它变成一个更大的互动。我很震惊,因为在数据可视化方面,The Pudding是最好的。当然我说是的。他们把我收归麾下,向我展示了他们如何设计和创建互动文章。他们对我非常友好和耐心,我超级感谢那个机会。”

Wilber描述的这个"伪实习"导致了他为该出版物的第一篇文章"The Good, the Rad, and the Gnarly”。

之后,Wilber说他关注大型科技公司的机会——他心中有一个目标。

“我一直想为某机构工作,主要有两个原因:他们在工程和科学方面拥有大量人才,并且在硬件方面拥有无与伦比的资源。”

Jared在网上看到一个有趣的工作后得到了这个机会。

他申请并加入了一个专注于因果推理和机器学习的人力资源研究团队。大约一年后,Wilber通过内部Slack频道听说了有趣的数据可视化设计职位。

“我现在的经理Brent Werness发布了一条消息,说他的机器学习大学团队刚刚开设了一个新职位,使用数据可视化来解释ML概念。我肯定在几分钟内就给他发了信息,因为这个角色结合了我的机器学习背景和我对数据可视化的热情。”

在MLU团队的大约两年里,Wilber担任过多个职位,但他可能对自己最近在MLU-Explain上的工作感到最自豪。

“我希望这些文章能帮助任何背景的人理解或对机器学习产生兴趣。我也认为尝试在教育环境中推动更好的计算界面很重要,这些文章是朝着这个方向迈出的一步。”

Wilber说,他在数据科学中找到创造性出口的能力是他喜欢的事情,但他角色中最充实的部分与公司的"学习和保持好奇"领导原则一致。

“我们的团队帮助某机构软件工程师为他们的任务使用机器学习,这样他们就可以以不同的方式使用AI来满足客户需求,“他说。“但真正激励人心的是,现在我们正在外部化我们的大部分材料,这样想要学习并对机器学习感到好奇的个人可以以希望有趣和引人入胜的方式这样做。”

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计