“我从未想象自己能成长和学习这么多”
Donato Crisostomi是罗马大学博士生,最近在卢森堡某机构的TEN Search部门接受了为期六个月的实习。
技术研究领域
在对话式AI团队的实习期间,Crisostomi与研究科学家和开发人员合作,专注于以下技术方向:
跨语言数据集自动化生成
- 构建人工跨语言数据集的自动化流程
- 测试神经网络模型应对复杂多语言现象的能力
代码混合语音识别
- 开发能识别代码混合语句的神经网络模型
- 代码混合指在同一语句中使用多种语言(常见于双语和多语使用者)
- 挑战:使神经网络模型能在同一语句中理解不同语言和方言
模型优化技术
- 通过减少训练期间的重复计算提升多语言处理效率
- 在批次级别消除重复数据,同时保持模型感知的数据分布不变
技术栈与应用
实习项目涉及多个前沿技术领域:
- 机器学习
- 自然语言处理
- 迁移学习
- 排序算法
- 软件开发
信息检索研究
在卢森堡的第二次实习中,Crisostomi加入了一个跨学科信息检索科学团队,专注于:
- 提升客户体验的信息检索技术
- 克服语言歧义的技术挑战
- 提供愉悦的信息检索体验
实习项目价值
该项目属于某机构研究生实习计划,包含:
- 导师指导
- 技术讨论组
- 与高级领导的技术交流
- 各类技术交流活动
通过实际项目参与,实习生能够深入接触最前沿的AI技术,并在真实场景中应用和优化机器学习模型。