收藏 分销(赏)

《大数据时代》读后感心得2000字以上.doc

上传人:二*** 文档编号:4512202 上传时间:2024-09-26 格式:DOC 页数:5 大小:14.54KB
下载 相关 举报
《大数据时代》读后感心得2000字以上.doc_第1页
第1页 / 共5页
亲,该文档总共5页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、大数据时代读后感心得2000字以上 但凡过去,皆为序曲是大数据业者最喜欢引用的语句, 维基百科对大数据的解释:Big data,或称巨量数据、海量数据、大资料,指的是所涉及的数据量规模宏大到无法通过人工,在合理时间内到达截取、处理、并成为人类所能解读的信息。 有人说现在是读图时代,除去小说、心灵鸡汤以外,现在的畅销书根本都有图片,这本书是一个特例(书里唯一的图是出品方湛庐文化做的) 首先尝试解析一下作者的三大观点,这三大观点是大数据业者很喜欢引用的三句话: 我想所有人都能意识到对全体数据的分析优于对随机样本的分析,但在现实中我们经常拿不到全体数据:一是对象的特性:比方炸弹的威力,你不可能把所有

2、炸弹都炸掉来得到全体数据;二是数据的收集方法,每一种方法都有适用的范围,不太可能包罗万象;三是数据分析的角度,战斗机只能统计到飞回来的飞机上的弹孔,而坠毁的那么无法统计,沃德通过分析飞回来的战斗机得出来最易导致坠毁的薄弱点;四是处理能力跟不上,就像以前的天气预报太离谱是因为来不及算那些数据。“采样分析是信息缺乏时代和信息流通受限制的模拟数据时代的产物”,作者显然只关注了一部分原因。 从语言的理解上看,什么是全体数据,终究是“我们需要的所有数据”,还是“我们能收集到的所有数据”,书中的很多商业案例中,处理的只是“我们能收集到的所有数据”,或者说是“我们认为的全体数据”。人对自然的认识总是有限的,

3、存在主义认为世界没有终极的目标。书中举例“Farecast使用了每一条航线整整一年的价格数据来进展预测”,而“整整一年”就是一个采样,或者是“我们需要的所有数据”。 从历史的角度看,国外的托勒密建亚历山大图书馆唯一的目的是“收集全世界的书”,实现“世界知识总汇”的梦想,国内的乾隆汇编四库全书,每个收集的过程都有主观因素在里面,而他们当时都认为可以收集全部的书籍,到最后,我们也没有得到那个梦中的全体。 既然我们过去总是在抽样,那本身就是在一个置信水平下,有明确的容错度或者是偏差值。人类永远知道我们是在准确性受限的条件下工作。同时,作者本身也成认 “错误并不是大数据固有的特性,而是一个亟需我们去处

4、理的现实问题,并且有可能长期存在”。那大数据的特征终究是准确性还是混杂性? 由此衍生出一个问题,大数据的品质如何控制:一、本身就不要求准确,但是不准确到何种程度是需要定义的,否那么就乱套了,换个角度,如果定义了容错度,那符合条件的都是准确的(或者说我这句话还是停留在小数据时代?这里的逻辑我没有理顺)。就像品质管理大师克劳斯比提出过零缺陷理论,我一直觉得是一个伪命题,缺陷是一定存在的,就看如何界定了;二、大量非构造化数据的处理,譬如说对的量化、情感的分析,目前对非SQL的应用还有宏大的进步空间, “一个东西要出故障,不会是瞬间的,而是慢慢地出问题的”。“通过找出一个关联物并监控它,我们就能预测未

5、来”。这句话当然是很认同,但不意味着我们可以放弃准确性,只是说我们需要重新定义准确度。之于工程管理行业,如果一个工程出了严重的问题,我们相信,肯定是很多因素和过程环节中出了问题,我们也失去了很屡次挽救的时机。而我们一味的容忍混杂性的话,结果显然是不能承受的。 这是本书对大数据理论的最大的奉献,也是最受争议的地方。连译者都有点看不下去了。 相关关系我实在是太熟了,打小就学的算命就是典型的“不是因果关系,而是相关关系”。算命其实是对趋向性的,在给定条件下,告诉你需要远离什么,接近什么,但不会告诉你为什么那样做。 我们很多时候都在说科学,然而,什么是科学,没有人能讲清楚。我对科学的认识是:一、有一个

6、明确的范围;二、在这个范围内树立一个强制正确的公理;三、有明确的推演过程;四 可以复制。科学的霸道表达在把一切不符合这四个条件的事物都斥为伪科学、封建迷信,而把自己的错误都用不符合前两条来否决。从这个定义来看,大数据不符合科学。 混沌学理论中的蝴蝶效应主要关注相关关系。它是指对初始条件敏感性的一种依赖现象,输入端微小的差异会迅速放大到输出端,但能输出什么,谁也不知道。 人类一旦放弃了对因果关系的追求,也就放弃了自身最的品质:意志力。很多人不愿意相信算命是担忧一旦知道了命运,就无法再去奋斗。即使我相信算命,也在探求相关关系中的因果要素。我放弃第一份工作的原因之一是厌倦了如此确定的明天:一个任务发

7、出去,大概能预测到哪些环节会出问题,只要不去 follow,这些环节十有八九会出问题。 解析完这三大观点,下面是我对大数据理论的一些疑惑。大数据是目前风行的反响中的重要一环,在金融、互联网行业的应用最为广泛,而这些行业都是大家所认为的高薪领域。很多时候我就在想,所谓无形的手所产生的趋势终究是不是无形的。比方几家公司强推一个概念,说这是趋势,不久就真的变成趋势了。我们身边活生生的例子就是天猫的双十一和京东的618,一个巨头开路,无数人跟风,自然就生造出购物节,至于合理不合理,追究的意义也不大,因为很多事情是没有可比性的。这和没有强制控制中心的蜂群思维又不一样。 1 数据专制。个人意志将受制于集体意志,个人的自由在哪里?用大数据预测来惩罚人的行为又确定的违反了无罪推定的原理。 2 所有数据都过去,大数据分析出来确实定性结果是否意味着我们在重复过去?拉普拉斯的决定论已经被认为是错误的,爱因斯坦也说过“上帝不会跟宇宙玩骰子”,但霍金不同意这句话。

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 应用文书 > 心得体会

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服