Komprise通过非structured数据摄取引擎提升AI准确性与安全性
Komprise作为分析驱动型非结构化数据管理领域的领导者,宣布其Komprise Intelligent AI Ingest全面上市。这款新型智能数据工作流摄取引擎能够加速跨分散存储孤岛的非结构化数据筛选,为AI应用提供精准数据支持。该方案通过消除RAG和LLM管道中非结构化数据的噪声、数据风险和高成本,显著提升AI投资回报率。
根据Komprise最新的AI数据与企业风险调查,IT领导者指出将合适的非structured数据输入AI系统以及AI数据治理是当前面临的两大挑战。随着AI热潮转向企业IT领域的谨慎部署,CIO们正寻求以安全、经济高效且结果准确的方式部署AI技术。
非结构化数据摄取至AI的主要问题
- AI/RAG/LLM效果不佳:非结构化数据缺乏组织性,包含大量无关、过时和重复文件,导致AI管道精度下降、上下文窗口混乱及延迟增加。研究表明,在典型RAG中每增加1万份非structured文档会导致效率下降10%。
- 推理成本高昂:无关数据会浪费昂贵的AI处理资源,推升成本并降低准确性,最终侵蚀AI投资回报。
- 敏感数据泄露风险:批量摄取数据可能导致敏感信息意外暴露于AI工具中,违反隐私、安全和合规政策。
Komprise Intelligent AI Ingest核心特性
- 元数据丰富的全局文件索引:自动构建元数据并提供企业内所有文件数据的统一视图,支持通过简单查询精准定位AI用例所需数据。
- 精准筛选提升RAG效率:与传统ETL和数据摄取方法不同,采用具备丰富过滤器的精细化方案,在摄取过程中消除低质量和敏感数据。
- 2倍摄取性能提升:通过专为AI优化的传输引擎和并行架构,相比主流云提供商数据迁移工具性能提升一倍。
- 高性能并行架构:弹性网格架构在多个网络接口、共享引擎和线程池间实现分层并行化,支持快速索引数十亿文件元数据。
- 内置PII与敏感数据处理:提供标准和自定义敏感数据分类功能,降低数据泄露和合规风险。
- 自动化数据治理审计:自动维护摄取工作流的审计跟踪,记录数据血缘关系以满足合规报告需求。
Komprise CEO Kumar K. Goswami表示:“我们的使命是帮助企业梳理非结构化数据的混乱局面,通过AI获得最大竞争优势。Intelligent AI Ingest是智能数据工作流的最新进展,旨在解决客户在向AI高效迁移数据时的核心痛点。”
高德纳报告指出:“随着组织加速向数据驱动转型,数据存储管理服务(DSMS)正演变为可管理存储的智能平台。现代DSMS解决方案是业务分析和生成式AI计划的基础,通过提高数据的可发现性、情境化和可操作性来释放数据价值。”
Komprise AI合作伙伴生态
Komprise与领先存储和云平台厂商合作,支持将数据自由迁移至合适环境。近期新增的AI生态合作伙伴包括:
- NVIDIA:客户可将非结构化数据精准摄取至GPU直连存储和NeMo DataStores,并利用Komprise自动管理AI数据生命周期。
- SUSE Linux:帮助SUSE Rancher客户编目非结构化数据,并将合规数据导入Rancher平台支持AI用例。