1、读书报告大数据时代观后感大数据时代,一个被嚼烂的词汇,不知从何时起,兴起了数据科学的狂潮,本书核心论点,第一,要全体不要抽样,第二,要相关不要因果,第三,要效率不要精确。弊端:产业生态环境,数据安全隐私,信息公正公开。本书实例众多,理论残缺,可以说是举了一系列的例子要论证观点的,我们知道这种论证方式逻辑上存在谬误。故而,本书可以说是一本数据科学的正面的背景教学,供谈资。数据科学基础:云计算,人工智能和机器学习,大规模处理结构数据算法,日渐增长的计算速度和数据规模的指数增加。从硅谷到北京,大数据话题正在被传播。随着智能手机以及“可佩带”计算设备的出现,我们的行为,位置甚至身体生理数据等每一点变化
2、都成了可以被记录和分析的数据。以此为基础,反馈经济等新经济,新商业模式也正在开始形成。大数据时代,我们可以有更全面的数据来研究,如楼上所说,甚至可以认为是样本=总体,那么,就不用再做一些统计上随机采样的工作了,基于大数据的研究可以关注到统计研究上难以关注到的一些小的、个别的情况,这些情况往往会呈现出更大的价值。在数据量很小的时候,研究往往会对精确度做很严格的要求,而大数据时代会把这些条件放的更加宽松,不然大数据很难应用于研究,这种情况下,尽管数据的准确度降低了,但大量的数据会给我们带来额外的收益 基于前两个转变,我们不再寻找因果关系,而是去关注关联关系,即倾向关注“是什么”,而不是“为什么”(
3、翻译此书的周涛不太认同这个观点,他认为是现在一些基于机器学习的算法得出的结果驱使我们去仅仅关注关联关系,因为我们现在很难把这些复杂算法转换成因果关系了)现在谈论大数据的人真的很多,但是能全面的讲述大数据的人我个人的感觉是不多的。作者从非技术这个角度,从思维、价值、隐私、管理这些角度来细致的讲述大数据,这点我觉得是值得我们学习的,而且书中例子的结合,也很能看出作者的功力。结合产品来谈数据的话,我个人觉得产品的设计是可以融入数据元素的,从数据废气到数据的可扩展性,到挖掘数据的价值完善自身的产品,这些都是可以思考的点。很自然的冒出来的一个想法,在我们的产品设计里面,可以突出用户留言之类的功能,通过这
4、些功能的设计,收集对产品存在的问题、改进建议等等,或者说,这些功能以前也是有的,但是真正利用这些数据完善产品的思维却是丢失的。大数据的意义,也就是从这些已存在的数据中发觉价值,利用这些数据完善自身产品、业务是数据的基本功能,对数据的二次利用,也是我们可以考虑的。 结合大数据时代这本书,我觉的书中提到的数据创新的思路是我们很值得学习的。跟个人比较紧密相关的,我比较感兴趣大数据时代的角色定位,既有个人的定位、也有公司的定位,这个或许也是需要我再好好领悟的点吧。至于大数据时代中提及的风险和掌控,这两张特别是掌控,我想是大多数谈论大数据人都很少去思考的,人人都想从大数据中分杯羹,但是大数据发展到一定阶
5、段,这些问题都会是比较突出的问题。大数据时代的知识能轻松获得,也并不意味着就能真正掌握知识。大数据时代的知识仅仅是一种资源,好比家中存放成百上千的书籍,如果不去研读,知识和人依然无关。不管处于怎样的一种时代,知识需要人们花苦功夫钻研,否则再多的知识也无意义。另外,现在不少人,凡是有不懂的问题,习惯性地上网搜索,不做任何甄别地将网上的知识和答案奉为宝典。长此以往,久而久之会使大脑变得懒惰,思维变得迟钝。大数据时代的知识,究竟是令人变得聪明还是愚笨?大数据时代作者认为:“由大数据带来对人的重新认识,不是在阿波罗神庙,而是在小世界网络中,认识你自己。”我们从昨天的数据作用中认识自然、认识宇宙到今天通
6、过大数据更多地认识网络和社会,我们的认识更加全面、更加深刻、也更加广泛。但是成就大数据的是无数努力造就小数据的人,他们探索大数据技术,认知大数据文化,并怀揣着对数据的敬畏和对规律的尊重。我们本学期正在学习概率论与数理统计这门课,有人总是把大数据和统计学摆在两个对立面,认为有了大数据之后统计学就会逐渐消亡,而我并不这么认为。 首先,数据量的增加,有助于减小数据的误差,如抽样误差等,能够极大地提高各类分析的精准度,这是大数据对于统计学的直接影响之一。 尽管当今的”大数据“潮流使得我们获得了海量的数据,但掌握这些海量的数据本身并无意义。真正的意义体现在对于含有信息的数据进行专业化的处理。要对大数据进
7、行处理,即在样本几乎等于总体的情况下,以目前的分析方法以及分析设备成本较高,耗时较长。 相比之下,统计学的抽样方法似乎显得更加”经济实惠“。在实际的运用中,统计学能够以较低的成本,较少的数据,对数据进行精确度相对较高的的分析,这是大数据分析所无法替代的。 甚至有学者指出,很多情况下,只要有一定的数据,无关数据数量,分析结果不会有太大差别,因此大数据也就显得不重要了。不敢说这话完全正确,但很大程度上说明了统计学对于数据分析处理的意义。通过一定的数据即可满足人们对于数据处理的需要,统计学极大地提高了人们对于数据处理的效率。 大数据的来临会推动统计学的发展,衍生出更多的发展方向,但绝不会替代统计学,也不会减弱统计学的效果与意义。