1、大数据读后心得体会 首先,本书大体上都是在讲美国政府在各社会团体不断争取权利、三权分立制度的制衡下,一步步将信息公然的历程。和数据对美国政治所产生的影响,美国政府如何保护公民隐私等等。实在真正触及到企业如何变得更加智能,惟有第四章讲得非常具体。先来看一下完全的商务智能流程: 1、通过各种来源的关系型数据库,使用elt(提取、转换、加载)工具,对来自不同系统的数据以同一格式进行清洗、转换、集成进进到数据仓库。 2、锁定目标数据落后行联机分析。通过不同的分析角度进行*分析,这样用户可以随时创建自己需要的报表,开发职员只要在后台为用户创建构建*的数据立方体模型,用户就能够直接在前真个各个维度之间进行
2、切换,从不同的维度对数据进行分析。从而取得更加全面的、动态的的分析结果。 3、进行数据发掘。就是从海量数据中,发掘出具有价值的数据。通过对数据的发掘其 一、可以发现数据的历史规律,对过往进行总结。其 二、可以根据数据对未来进行猜测。企业可以根据猜测对未来行情趋势做出预判,并作出相干决策。 4、数据可视化,我想任何人看到一推数据,就会感到很头疼。固然也很不直观,到底企业的各项指标相比往年是好是坏往做对照也会很麻烦。使用各种图表、三维地图、动态摹拟和相干的动画技术是本来枯燥乏味的数据,变得生动起来。数据可视化把数据以更加直观的形态展现出来,令人们对相干数据做到一目了然。 5、通过上面几步我们就把本
3、来毫无价值的数据,变成了信息,最后演化为知识。其次,我们北京大学青鸟公司应当斟酌的: 1、是不是有必要建立数据仓库。固然我这个题目我也在线上向ibm数据仓库的职员询问过。要斟酌的有两个因素:其 一、数据量的级别,其 二、对数据发掘的程度。 一、数据量。收集器实时都对新闻、论坛、博客、微博在进行收集,固然假如说一年的数据量不算大的话,亦或宁波本地的数据量也没那末大的话。公司假定几年后、几十年后业务量增大了,做到了XX省乃至全国的时候。那个时候的数据量我想应当是非常的庞大了。 二、对数据发掘的程度,固然有关公司触及的更多。不过有时候那些公司做得仅仅是从收集的数据那里通过筛选,将相干信息发送给相干的
4、客户。个人觉得这个价值应当被放大,通过对相干数据的发掘对过往的规律进行总结,对未来的趋势做出猜测。如固特异轮胎,根据往年的数据总结出某款轮胎某地和在哪一个时间段销量最大,然后第二年可以根据这个数据,制造商可以提早对该型号轮胎进行大量备货以备不时之需。通过发掘在特定的时间段,哪几种商品*销售会得到更好的销量等等。固然数据仓库是面向主题的数据集合,用于支持管理中的决策制定。个人觉得对公司领导层做出正确决策有很大的指导作用。 2、公司应当加大数据发掘能力。公司在招聘往里面招聘的所谓数据分析师,只不过是用来数据监测的。真正意义上面的数据分析师很是匮乏。现在客户大多希看的是能够给本企业决策有指导性意义的
5、报告、或建议。这就需要我们通过数据发掘猜测出未来趋势,即猜测性分析。这样不管在产品推广,和在本品牌虔诚度上都会有一定的保障。 3、是不是能通过联机分析处理将数据从各个角度、不同纬度展现出来。例如对销售数据的分析,时间周期是一个维度,产品种别、分销渠道、地理散布、客户群类也分别是一个维度。一旦*数据模型建立完成,用户可以快速地从各个分析角度获得数据,也能动态的在各个角度之间切换或进行多角度综合分析。 4、数据可视化设计上需要强化。相干系统是直接给客户进行操纵使用的,但我们所生成报告里面的统计图、走势图还不能很直观的展现给客户。这个对客户体验来讲是非常致命的,由于一旦不能直观的体现数据所显现出来的状态,客户就不能对其决策做出正确的判定。进一步致使客户对我们虔诚度的下降。第3页 共3页