行业动态

大数据:全新机遇还是一纸空谈?

2014-12-04

解决方案使用不同类型的组件。企业数据面临的挑战是它广泛分布在各种不同的技术和数据平台上。例如,数字化零售、电信业及社交媒体使用结构化数据,其表现形式相似;而企业数据则分布在主机、ETL(提取、转换和加载)工具、虚拟层、关系数据库、商业智能(BI)数据库、交易数据库以及数百种其它组件中,这些技术在过去30年中已不断发展。更糟糕的是,每种应用程序使用不同的数据模型,导致数据与其相关技术平台整合越来越复杂,因此,利用当前大数据工具访问企业数据,难以创造直接的价值。




  这就是企业大部分业务问题与大数据无关的原因。这些业务问题实际上是分布式数据问题:在这种模型下,信息、数据、价值和分析广泛分布在不同的位置、技术平台和数据源内。但我们仍继续使用与以往相同的集中式模型来解决这一日趋严重的分布式问题。当用户能够通过常见的界面外观稳定地访问数据时,这些集中式模型能够发挥很大的作用,这在社交媒体、数字化零售等行业新的成功案例中屡见不鲜。但集中式模型却无法解决银行、保险、医疗行业及其它广泛的业务问题。






  Standish梅隆资产管理公司近期更新大型数据项目成功案例调研报告。更新内容显示,2003至2012十年间人工成本至少达到1,000万美元的3,555个大型数据项目中,只有6.4%的项目顺利完成。这正是企业未能高效管理分布式数据源及其相关技术所造成的后果。我们仍需运用大数据技术才能克服这些困难。




  目前,企业实现大数据价值需对多种不同数据及功能体系进行数据整合及标准化规划。如不改变现有数据管理机制,那么企业解决方案采用越多的分布式组件,项目回报率越低。




  大数据技术促进深度分析及分析性能取得技术突破,其价值毋庸置疑。但这种价值却被数据提取和/或整合成本破坏,导致价值/炒作的底线被轻易冲破。目前,市场在数据价值上多少存在一些分歧,其中一部分行业尚处于初创时期,可保持技术一致性,因此,这些行业可以暂时解决分布式数据的问题。




  由于技术孤岛仍将持续存在,且数据仍保存在不同的位置,Gartner公司分析师Doug Laney预计到2017年,90%的大数据项目仍无法发挥它们的作用。Doug最近总结到,虽然数据复杂性、企业内外部数据的分布和离散度不断提升,但也不会因为大数据技术作出的各种承诺而承认系统及数据大规模整合项目的合理性,它们只是大数据价值的体现。




  我们只有意识到大数据技术虽已占有一席之地,但仍受到分布式数据源的直接影响,才能尽早通过真正具有成本效益的途径,根据数据复杂度和分布情况,充分利用数据价值。




  大多数企业可灵活使用双重数据策略:运用大数据技术对大量同类数据进行深入分析及机会辨别;或运用分布式数据应对运营、风险、管理等复杂但已为人所了解的挑战。人们将能够接受这种双重数据管理策略,充分发现、挖掘并管理大数据技术的价值,并在行业内实现不断灵活创新。