【寄稿】株式会社GEOTRA未来人流模拟的实践
作者: Kanta Matsumoto
发布日期: 2025年9月26日
分类: Amazon RDS, AWS Step Functions, 客户解决方案, RDS for PostgreSQL, 无服务器
未来人流模拟服务的实践
序章
我们是解决方案架构师斋藤和松本。株式会社GEOTRA以"用数据力量推动社会前进"为使命,运用机器学习技术,基于各类数据提供未来人流模拟服务。人流模拟服务从模型需求定义→数据筛选→数据清洗→模型构建→模型精度验证均实现自主开发。本博客由GEOTRA执行董事CTO产品开发部长森山拓洋先生撰稿,介绍GEOTRA如何开发人流模拟服务。
人流模拟服务概述
AWS: 请说明人流模拟服务适用于哪些使用场景?
GEOTRA森山: 可应对广泛的人流模拟需求。举例来说,能够对桥梁/道路新建或车道管制等封路情况下的交通流变化进行人流模拟。这将提升土木工程规划精度,实现更精细的规划方案。
AWS: 请介绍人流模拟服务的开发情况。
GEOTRA森山: 开发人流模拟服务需要从GPS位置信息创建可识别个体移动的"非集计出行数据"。我们使用自主研发的算法生成此类数据。虽然处理数人信息不成问题,但政令指定城市需要生成超过100万人的数据,此时计算量巨大且耗时较长。核心挑战在于位置信息属于个人信息,可能涉及个体识别。为避免这种情况,通过运用合成数据生成技术,可同时实现隐私保护与个体数据创建。
AWS: 哪些客户在使用人流模拟服务?
GEOTRA森山: 涵盖大型开发商、总包商、建设公司等各行各业的客户。
架构说明
AWS: 请介绍人流模拟服务的架构设计。
GEOTRA森山: 架构如下所示:
GEOTRA森山:人流模拟服务采用以AWS全托管服务为核心的架构。我们将用C++和Python开发的专有算法容器镜像存储在Amazon ECR中,并基于此生成"非集计出行数据"。此过程需要ETL处理,早期我们在EC2上自主实现工作流,现已迁移至AWS Step Functions。生成的"非集计出行数据"写入Amazon RDS,客户可通过React构建的应用程序查看人流数据。
选择AWS的原因
AWS: 请说明选择AWS开发人流模拟服务的理由。
GEOTRA森山: 主要有三个原因:第一是CPU架构选择。系统开发时只有AWS同时提供X86和ARM架构。在反复试验开发专有算法的过程中,CPU架构的选择至关重要。第二是市场工程师数量与信息量。AWS社区活跃,拥有丰富的技术博客等实践知识资源。第三是无服务器服务。基于高敏感度的GPS位置信息生成"非集计出行数据",安全性是最高优先级。通过采用AWS全托管服务,可将OS和中间件的运维工作交由AWS负责,专注开发。此外,多数全托管服务采用按使用量计费(而非按时计费),更适合初创企业小规模起步。
面临的挑战与解决方案
我们使用C++和Python开发的专有算法生成"非集计出行数据"。最初在EC2上自主实现数据生成和工作流,但因作业依赖关系复杂导致维护困难。为此引入AWS Batch和AWS Step Functions,通过Step Functions检测批处理完成状态。借助GUI确认作业依赖关系,以及从中间作业重启等功能,实现了效率提升。
未来展望
AWS: 请谈谈未来发展规划。
GEOTRA森山: 我们将充分利用AWS无服务器服务种类丰富、扩展性灵活的特性,持续优化人流模拟服务。对具有商业价值的功能进行打磨,开发符合客户需求的产品。最终目标是成为位置信息×AI领域的领导者!
作者简介
毕业于九州大学研究生院理学府化学专业,主修量子化学。因对连接人与人的IT技术产生兴趣,于2014年作为应届生加入KDDI。入职后任职于企业事业本部,作为DX前端系统工程师,从事基于IoT的企业解决方案、5G网络与4K影像识别系统的设计与构建。现任技术负责人,主导GEOTRA产品开发,同时亲身参与实现工作,并作为数据科学家推进基于GEOTRA活动数据的数据分析,持续探索客户新洞察。
标签: Amazon RDS, AWS Step Functions, 案例研究, 客户解决方案