第1章:查找单词、短语、名称和概念
本章将介绍使用spaCy进行文本处理的基础知识。内容包括数据结构介绍、如何使用训练好的处理管道,以及如何利用它们预测文本中的语言特征。
第2章:使用spaCy进行大规模数据分析
本章将运用新学到的技能从大量文本中提取特定信息。内容包括如何充分利用spaCy的数据结构,以及如何有效结合统计方法和基于规则的方法进行文本分析。
第3章:处理管道
本章将全面介绍spaCy的处理管道。内容包括文本处理时的底层运作原理、如何编写自定义组件并将其添加到管道中,以及如何使用自定义属性为文档、片段和标记添加元数据。
第4章:训练神经网络模型
本章将学习如何更新spaCy的统计模型以适应特定用例,例如预测在线评论中的新实体类型。内容包括从零开始训练自己的模型、理解训练基本原理,以及使自定义NLP项目更成功的技巧。
关于本课程
spaCy是一个用于工业级自然语言处理的现代Python库。本免费互动在线课程将教授如何使用spaCy构建先进的自然语言理解系统,同时采用基于规则和机器学习的方法。
关于作者
Ines是spaCy核心开发者之一,专注于AI、机器学习和NLP领域的现代开发者工具开发,同时也热衷于构建网络应用。