一家为农业设备提供售后保证的全球农业设备制造商寻求使其数据生态系统现代化,以实现数据分析和货币化。
Infosys与该公司及其遍布美国的经销商网络合作,为高级分析收集数据。
主要挑战
准备好体验吗?
专家说业务用户访问相关数据,以客观评估风险,生成全面的保证政策
Infosys扩展了数据来源,以了解设备的生命周期。现有系统仅在保修期内跟踪数据。Infosys从保修期间的设备数据中提取了7500多万条记录,并扩大了覆盖范围,以及经销商的维护/服务记录。
我们的团队利用Spring XD和Python进行数据传输和导出数据的批处理。我们使用Informatica ETL产品和IBM Netezza数据仓库设备来优化数据系统。
Hadoop HDFS、Apache Crunch、Hadoop MapReduce、Apache Hive、Sqoop、Oozie workflow scheduler系统等软件框架对海量数据进行消化和处理。使用Java DOM解析器、XSLT和XSD来管理和存储文档。
该技术堆栈创建了一个可扩展的大数据系统,用于实时数据捕获、摄取和分析。它集成了产品、保修、车载信息、客户和经销商数据。来自生态系统的实时数据流入存储历史记录的Hadoop数据湖和数据集市环境。
印孚瑟斯的系统平均每天处理40多万条记录,包括质保后维修/维护订单和备件的柜台销售。
我们的大数据解决方案提供跨库存的实时可见性,并支持并行分析过程。