乔治·卡里皮斯专访:让图数据学习变得简单可扩展
乔治·卡里皮斯是明尼苏达大学双城分校的特聘教授,同时也是某中心的高级首席科学家和学者。在机器学习峰会上,他将就深度图神经网络(GNNs)发表主题演讲。
演讲主题:深度图神经网络的应用
演讲将重点介绍如何利用深度图神经网络开发机器学习模型,以解决基于图结构数据的问题。近年来,随着数据科学家从处理图像等二维信号和视频等三维信号,转向学习图结构中的关联数据,图神经网络的采用呈现爆发式增长。
在某中心,团队一直致力于开发深度图库(DGL)——一个易于使用、高性能且可扩展的Python图深度学习工具包。DGL是一个允许开发者编程图神经网络的框架,它是对现有TensorFlow、PyTorch和MXNet等基于张量的框架的补充。演讲将详细介绍如何使用DGL使图神经网络的开发、训练和使用变得简单且可扩展。
图神经网络在科学社区的重要性
图神经网络目前已在多个领域得到应用。例如,在社交网络中,图神经网络通过展示相关人群之间的联系发挥着日益重要的作用。在医疗领域,图神经网络在为新疾病寻找候选药物方面扮演着越来越重要的角色。在某中心,图神经网络被用于开发推荐系统、构建欺诈和滥用检测机制,以及开发语音助手的对话能力等应用。
通过利用图数据固有的关联特性,我们可以为各种问题开发精确的机器学习解决方案。图神经网络在广泛领域的图学习中正不断提供最先进的结果,即使从学术和工业研究转向实际产品和服务支持,它们仍然是深度学习中最活跃的研究领域之一。
图神经网络发展的突破性进展
在图神经网络算法和基础设施开发方面都取得了令人兴奋的进展,这些进展将有助于扩展图神经网络的训练规模。这对于在图神经网络在实际应用中的部署尤为重要,因为实际应用中的图可能非常庞大——例如,一个社交网络可能包含数百万个节点(或用户)和数十亿个链接。
在处理大规模图数据方面,大规模基准测试的开发使我们能够专注于可行的架构,并验证能够适应更复杂数据集的方法。此外,针对图神经网络工作负载的硬件加速器开发,将极大地帮助我们在解决图结构输入问题时充分利用机器学习的能力。