2025暑期实习生技术项目亮点:构建Dropbox的AI驱动搜索与基础设施

本文分享了2025年Dropbox暑期实习生项目中的多项核心技术工作,涵盖了AI搜索产品Dash的增强、机器学习平台监控、存储系统性能优化、多语言搜索平台扩展以及大数据管道改进等具体技术成果与实践经验。

今年夏天,新兴人才团队自豪地迎来了43名实习生加入Dropbox,成为我们2025年Camp Dropbox实习计划的一部分。今年的实习生群体来自27所学院和大学——包括加拿大、波兰和爱尔兰的六所国际院校——带来了丰富的多元视角和经验。在这群实习生中,有28人加入了我们的工程团队,在为期12周(5月至9月)的时间里,他们全身心投入到有意义的工作、持续学习和我们的"虚拟优先"文化中。

Dropbox实习计划经过精心设计,旨在促进成长、激发创新并建立持久的联系。实习生们受益于超过6000小时的专门一对一指导,处理了与团队和公司目标相一致的高影响力项目,并探索了人工智能的实际应用。其中许多项目支持了Dropbox Dash的开发,这是我们由人工智能驱动的通用搜索产品。包括"虚拟优先"活动、员工资源小组活动以及现场的新兴人才峰会在内的丰富计划,为建立联系和社区创造了更多机会。到夏天结束时,这些实习生已经在我们整个工程组织中做出了有意义的贡献。

下面,我们的实习生分享了这个夏天的工作,从重大的技术成果到创造力、协作和成长的时刻,这些塑造了他们在Dropbox的时光。

  • “我解决了Dropbox文件历史跟踪系统的问题。作为一名工程实习生,第一次在大型生产数据库中工作,我深刻体会到强测试、可验证代码和周密系统设计的重要性。我真心认同Dropbox’值得信赖’和’保持简洁’的核心价值观在软件层面的体现。这个解决方案简化了我们的元数据基础设施,显著降低了运营成本,并展示了如何通过周到的遗留系统重构,既能带来技术上的优雅,又能产生巨大的商业价值。” — Rhea Rai,文件系统数据团队

  • “在ML平台团队实习期间,我开发了一个监控ML模型部署健康状况的系统。通过与内部推理服务集成,AI Sentinel为机器学习工程师提供了他们此前需要手动收集的实时操作可视性。结果是增强了部署信心并加快了迭代周期,确保了可靠的大规模ML模型部署,从而为Dash的智能功能提供支持。” — Ben Juntilla,ML平台团队

  • “我的工作是降低Magic Pocket中的前端延迟。在计划内磁盘重启期间,过高的PUT延迟可能会延迟Dash连接器等工作流中的更新,导致用户看到过时或缺失的内容。为了解决这个问题,我构建了一个缓存来跟踪存储健康状况,并增加了一个过滤选项来跳过性能降级的存储卷。这种基于健康状况的路由减少了慢速写入,并赋予操作员更大的控制权,确保Dropbox能够提供及时、准确的搜索结果。” — Albert Joon Sung,存储核心团队

  • “我开发了一个基于我们内部迁移平台的AI驱动工具,用于自动化代码迁移。开发人员可以针对特定的迁移类型,在选定文件夹上启动自动迁移任务。成功的运行会自动创建一个拉取请求;否则,你可以在本地运行命令并手动提交更改。该工具可通过CLI或作为自动化工作流的一部分完全自定义。利用它,我完成了两次重大迁移。” — Ahmed Ibrahim,Web开发者体验团队

  • “我构建了一些工具,让机器学习工程师能够访问Dash持久化存储中最新的信息。这样,下游团队可以在更新的数据上训练模型,并从第三方系统拉取额外的元数据字段,而无需等待连接器平台团队重新下载或重新打包任何内容。” — Eddie Ormseth,连接器平台团队

  • “我的工作是将统一搜索平台扩展到支持超过20种语言。USP为Dropbox产品(如Replay)提供搜索支持,而我的项目将语言检测流水线集成到了索引和检索两端。这使得我们能够实现准确、高效的多语言搜索,而无需传统解决方案的开销。通过在今年的Dash发布之前提供原生语言支持,我的工作帮助Dropbox实现全球扩展,改善开发者体验,并为国际客户解锁更丰富的搜索功能,使我们更接近构建一个AI优先、普遍可访问的搜索平台的愿景。” — Rishi Peddakama,检索平台团队

  • “我为我们Vortex2指标系统探索了先进的异常检测技术。传统的静态警报可能会错过数据中突发的、有意义但未超过预设阈值的变化(或者在预期变化时频繁误报)。为了解决这个问题,我开发了能够适应不断变化模式的自适应检测方法。这些改进简化了警报创建并减少了警报疲劳,从而增强了待命体验。通过考虑季节性因素,新的异常检测功能还能实现更快的响应时间,并改善整体开发者体验。” — Yonatan Ginsburg,指标团队

  • “我在Dropbox Dash内部开发了无缝的文档预览体验,使用户能够在不离开搜索上下文的情况下快速查看文件内容。这项增强功能支持Dropbox的使命,即通过减少上下文切换和增加参与度来加速工作流程。我构建了交互式UI组件,集成了PDF查看功能,并实现了链接到AI驱动聊天的动态后续功能。” — Francesca Venditti,查找与发现团队

  • “今年夏天,在分析平台团队,我致力于优化大规模Databricks查询和ETL管道,以降低计算成本和延迟。我开发了一个优化推荐系统,用于标记高成本的查询模式、昂贵的表列过滤器以及分配不足的计算资源,并附带了可操作的溯源信息。我还原型设计并记录了一个Airflow管道,用于将500 TB的移动事件日志迁移到液体聚类,为更广泛地采用现代数据布局技术铺平了道路。” — Sanjith Udupa,分析平台团队

  • “我为Dropbox构建了一个可扩展的AI网页自动化代理。我还通过searchFile和uploadFile操作连接了Dropbox后端API来获取和上传文件,利用了开源基础。通过保持工具集的小型化和模块化,开发者可以快速组合出可靠的、针对特定任务的自动化流程,例如表单填写或校对。随着对自动化重复性网页任务需求的持续增长,将自动化工具集成到Dash中将显著改善用户体验。” — Alan Zhu,对话式人工智能团队

回答已经过轻微编辑,以控制长度和提升清晰度。 ~ ~ ~ 如果构建创新产品、体验和基础设施让你感到兴奋,欢迎加入我们,共同构建未来!请访问 jobs.dropbox.com 查看我们的空缺职位。

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计