李孟
摘 要:数据管理是利用计算机技术对数据进行有效的采集、存储、处理和应用的过程,目的在于充分有效发挥数据的价值。随着大数据时代的到来,越来越多企业意识到数据将会给企业带来的巨大经济价值,马云在致阿里巴巴股东公开信中就说过:“我们集团本质上是一家扩大数据价值的公司”。维克托·迈尔·舍恩伯格在《大数据时代》一书中通过上百个通俗易懂的案例生动阐述了大数据所引发的变革以及全新的商业模式与投资机会。然而,在这股“大数据浪潮”之下也需要我们冷静下来思考一下,我们企业现阶段的信息需求是什么,我们企业的数据管理处于什么层次。
关键词:数据分析;数据挖掘;BI
中图分类号:F279.23 文献标志码:A 文章编号:2095-2945(2017)23-0149-02
1 企业进行数据管理的必要性
企业中各类业务系统稳定运行,为何还要搭建企业的数据管理平台?大部分企事业单位已经建立了比较完善的CRM、PM、OA、ERP等信息化系統,这些系统运行一段时间以后会在数据库中产生大量分散、独立的历史数据。这种数据架构存在以下问题:
(1)从业务的视角来看
业务系统过多,彼此的数据没有互通,大量的数据只是一些看不懂的数字,并不能获得其背后所隐藏的有价值的信息。这种情况下,涉及到数据分析就麻烦了,可能需要分析人员从多个系统中提取数据,再进行数据整合,之后才能分析。而人为整合出错率高,数据分析也存在不及时、效率低的问题。
(2)从系统的视角来看
随着公司数据越来越大,各业务系统运行效率已经十分低下,而数据分析又是一项比较费资源的任务,对服务器造成更大的负担,影响用户体验。因此自然会想到通过重新构建一个诸如数据仓库之类的大数据处理平台,将数据抽取出来,应用独立服务器来处理数据查询、分析任务,来释放业务系统的压力。
结合上面的问题来看,如何将数据转化为信息,让业务人员及管理者能掌握与利用这些信息来辅助决策,才是企业数据管理的重要意义所在。在大数据背景之下,必须要考虑到数据之间的关联性,独立分散的数据是没有意义的,需要把数据放在一个完整的数据场景中才能看出存在的问题。
2 企业数据管理阶段
2.1 养数据阶段
在最初的养数据阶段,企业内只有少量基础数据,如零售企业只有进销存的相关数据,而没有消费者的行为数据,无法绘制出一个基本的消费者画像,更谈不上数据驱动业务了。
养数据应该包含以下三个方面:
(1)完善数据结构
要扩展数据的采集渠道以及覆盖范围,将企业数据库中有的字段必须全部收集起来,尽可能地不要留白。暂时用不到的数据,本着先收集再应用的原则,把数据先养大。
(2)提高数据质量,将数据做精
现阶段企业获取数据如此容易,数据的增长速度如此之快,对于企业来说,控制数据源的质量和内容、保证数据完整性与规范性非常关键。开发数据分析应用的时候,数据就等于原材料;当原材料质量不过关的情况下,做出来的产品就很容易出问题。
(3)养成数据入库的习惯
数据入库就是尽可能的让数据在数据库中,别让一些基础数据躺在excel中。这样做一是更安全,二是更利于数据的场景化,要把数据放在一个“数据框架”(场景)中,考虑数据之间的关联性,才能看出存在的问题,否则就只是一些干巴巴的数字。
养数据是一种数据战略,是基于对业务深入理解的高层次商业决策,养数据越早积累的就越多,一旦养成,会产生巨大的商业价值。一个企业在养数据的层面上谋划越深越前瞻性,才可能在数据驱动营运,驱动决策的路上越走越顺。
2.2 基于报表系统的数据分析阶段
现在的企业或多或少都在做数据分析,最常见的就是报表系统。只是有的用Excel表格,有的用专业的数据分析软件。在这个阶段的主要特点是基于历史数据做分析,在这种情况下一般传统的分析方法和工具就够了,因为我们主要工作是在“发现事实”而不是挖掘关联。通过对数据的分析,企业会发现自身在数据应用方面的短板,会去重新布局企业的数据需求,继续第一阶段的养数据,所以第一、二两个阶段一般是相互交错的。
随着数据的增多与需求的提高,传统的报表系统也面临如下的诸多困境:
(1)数据多,信息少
各类表格填满了大量的数据,却没办法让业务人员看清楚这些数据到底代表了什么信息、有什么发展趋势,相互之间又有什么联系?
(2)难以多维度交互分析与查询
定制的报表过于固定,往往只能反映出某一个维度的信息。比如,我们能在一张表中查出不同区域下不同产品的销量,在另一张表中查出不同区域、不同年龄段的顾客销量。但这两张表确无法回答“华中地区青年顾客购买手机类产品的情况”等相关问题。诸如此类的业务相关问题需要从多个角度进行交互分析。
(3)难以挖掘潜在的规律
报表系统展示的只是表面上的信息,但在海量数据中隐藏有哪些规律呢?哪类客户的价值最大,产品间的关联度如何?越深层的规律对于决策支持的价值就越大,但同时也越难被挖掘出来。
(4)难以追溯历史,易形成数据孤岛
由于业务系统的数据相对分散,而多年前的历史数据大多被系统备份出去了,从而导致对长期的历史追溯与宏观分析的难度大大增加。
2.3 基于数据挖掘的商业智能(BI)阶段
商业智能带来的更多是决策支持价值。基于数据挖掘的BI系统诞生目的并非取代传统的数据报表,相反报表系统将会长期与数据分析与挖掘系统并存。针对特定的数据与问题,选择不同的挖掘算法找到数据下隐藏的规律,从而用来预测和支持决策,最后以合适的知识模式用于进一步分析决策工作。endprint
与数据分析对比一下总结起来两者的区别就是:数据分析是利用大量的历史数据样本来总结已发生的情况并预测整个事件未来的总体走向和相关概率;数据挖掘则能够透过事件的表象来发现隐藏在其背后的蛛丝马迹,从而找到暗藏的事件规律以及表面看似无关的事物之间背后的联系,比如客户的偏好、客户流失倾向预测、收入预测等,为企业提供经验性总结和预见性的业务支撑。
对于企业开展数据化管理工作也要遵循上述三个阶段,循序渐进,真正将数据管理工作落到实处。
3 企业数据管理需要注意的问题
3.1 理解数据分析与管理的意义
对企业来说并不是购买一套数据分析或商业智能工具,有一个运行数据分析的平台就迈入了数据分析时代。在这之前首先需要弄清楚的问题是究竟分析什么,分析的结果如何应用。要以目标为导向,而不是以工具为导向。
数据化管理应该是一种管理方法,而不仅仅只是一个分析的动作,它的目的是为了将数据转化成知识,提升营运水平,重点在于应用。数据分析再好、BI工具再好,如果不能帮助管理也没有意义。
所以,好的BI产品应该是技术和业务的完美结合,想让你的数据分析结果有价值必须有产品经理这种思维,也就是提高数据的业务化程度,将分析结果运用到生产、销售等各个环节中去。
3.2 数据应用因小而美
在传统企业中普遍存在组织机构大、经营范围广、管理层级多、业务逻辑复杂等情况,而对于集团化的企业更存在复杂的控股关系等问题。在传统企业全方位开展数据分析工作非常困难,需要根据某一阶段所面临的经营管理问题有效识别出核心的数据分析需求,而没有重点的数据分析既不现实也没有效果。
“小”不是指數据量,而是指应用的目标很具体。打个比方来说,对于一个数据应用来说,如果目的是判断两种决策谁更有效以及两者差异在哪里,这就是一个很具体的问题;但如果目标是如何让公司更多赢利,这就是一个空泛的目标。按照小角度切入的想法设计数据应用,就可以做得具体而快速,而且可以避免因源数据的变化而导致数据缺失的问题。
3.3 注重企业数据管理体系的建设
企业的数据管理体系建设是一项系统工程,不可一蹴而就,建设过程中也需遵循如下相关原则:
数据管理是一项长期的工作,应该立足长远做整体规划,结合实际情况分布实施。
在数据管理各阶段的管控目标应该结合本阶段的实际需要,合理安排资源,体现其实用价值,避免盲目地求大求全。
数据管理平台建设完成并不代表整个体系就建好了,还需成立相应的组织机构,围绕管控目标来制定相关流程、规范、制度,将管控工作落到实处并通过平台运转起来。
管控体系是不断演变优化的,在各种制度流程形成后应该有个适应期,在执行过程中逐渐积累经验、总结教训,再反馈调整。
总之,如何在企业的管理和分析决策中充分发挥数据分析与管理的价值是一门管理和商业艺术,需要被企业的管理层和业务单位重视起来。
参考文献:
[1]桑文锋.数据驱动设计:数据处理流程、分析方法和实战案例[Z].
[2]车品觉.用数据,更要养数据[Z].大数据文摘.endprint