1、数据之巅读后感 (一) 关注文化的力量 郭朝晖 最近读了涂子沛先生的数据之巅感慨良多,颇有不吐不快的感觉。涂先生作为将大数据概念引入中国的学者,其认识的深刻程度自然非同一般。而种深刻表现在对历史大背景的理解上。我特别感兴趣的,是大数据时代到来之前的故事。 如果按照我倡导的原则去做,你们就能生产出高质量的产品。五年以内,日本产品将占领整个国际市场。60多年前,质量管理之父戴明给日本企业家这样的承诺。那时的日本产品,还是以劣质而闻名。所有人都将信将疑。但事实却是:仅仅用了四年,日本的优质产品开始占领世界。 戴明为什么有这么大的信心呢。当时的日本刚刚战败,多数人吃不饱肚子。戴明见到的却是整洁的街道、
2、守纪律的国民。戴明教给日本人的招数,是用数据统计的办法管理质量;这种方法与日本民族做事认真、遵守纪律、一丝不苟的民族文化是吻合的。此后的20多年,日本制造一路走高,靠质量实现了逆袭、超越了美国。 这段时间,美国制造业又在做什么呢。二战以后,各国百废待兴,美国本土没有经历战争的破坏。在很长的时间里,美国产品供不应求,成为世界各国的抢手货:生意好做了,对质量的重视程度也就不够了,从而为日本的赶超提供了机会。直到日本人打到家门口,美国人才如梦方醒。美国人惊奇地发现:这位墙内开花墙外香、对日本制造有巨大贡献的戴明,居然居住在距离白宫不到六英里的地方。 戴明和他的方法来自于美国。美国为什么会产生这种方法
3、呢。恐怕这也与其文化有关:美国是个讲究民主和法治的国家,凡事要争论、要讲道理。争论要有是非曲直、最终要用数据说话.但是,人们也意识到:数据不仅会说话,也会说大话、说谎话.所以,用数据说话,必须讲究科学。这样看来,戴明来自美国也就不足为怪了。 其实,戴明的质量管理方法早已传到了中国。 但是,几十年过去了,我们仍然难以摆脱低质、山寨的帽子、甚至有愈演愈烈的可能。由此可见:我们缺少的不是方法,而是深层次的原因。 改革开放以后,我们有接近40年高速发展的历史。在这段时期,中国依靠廉价的劳动力,生产出物美价廉的产品。但所谓物美价廉,往往是更重视成本。在保gdp、保就业的背景下,假冒伪劣产品受到了纵容,以
4、至于市场出现了逆向淘汰。于是,原本信奉质量第一的企业被迫做出改变、搞质量的人被边缘化了、企业质量意识就这样淡薄了。 轻视质量还有很多间接的危害。例如,提高质量往往是创新最重要的直接目标之一。离开质量谈创新,就失去了落地的基础。中国科技界的很多问题与此有关:高校的技术创新往往脱离实际、产学研往往难以结合。可以说,离开高质量的追求,中国制造就缺少了脊梁骨。 我们在追求先进理念的时候,一般不会落后。我们常常听到用数据说话的提法。但遗憾的是:现实中,却常常变味,令人啼笑皆非。 究其原因,人们常常不重视数据的本身质量和分析方法的质量。数据之巅曾提到:美国人多次为了数据吵得不可开交,从而推动了相关的立法、
5、提高了数据分析的合理性。事实上,只有可靠的数据加上可靠的分析方法,数据才能说出有用的实话。 然而,我们见到的许多数据却是骗人的。例如。据说,获得省部级科技进步奖的潜规则是七亿元的效益。如果数据都是准确的,单纯获奖项目获得的效益,就超过了很多地区的gdp增量。然而,尽管浮夸的数据如此明显,却长期得不到纠正。这使得科技界浮夸的歪风越来越盛,牛皮越来越大而实效却越来越少。再如,评奖、评职称都用专利、论文的数量衡量其实,即便在重视数字的美国,也不主张这种做法。这种做法往往会让科技工作者急功近利,而不愿意去从事真正有价值的创新。不恰当的数字化将很多激励变成了负激励。 还有很多地方,数字化的规则制定得明显
6、不合理。例如,某企业计算某产品的效益时,要把生产设备的折旧算摊上去这样的规定看似有道理,却导致了昂贵设备白白的闲置,从而造成了更大的浪费:没有人愿意用这台设备生产产品、宁可让它闲置不用。所以,劣质的数字、劣质的数字化方法,不但不能促进企业的进步和质量的提高,反而有可能起到相反的作用。 我们再看看更深层的原因。人们明明知道这些不合理的现象存在,为什么却能长期持续存在。道理很简单:在这些地方,用数据说话变成了一种形式,一种便于交差、便于表功、体现水平的形式。他们并不关心用数据说话的目的和最终结果。从本质上说,这种做法不是重视数据,只是用数据做掩饰;不是喜欢真龙,而是叶公好龙. 中国制造业要振兴,必
7、须从提升质量开始;关注质量,必须从关注数据和分析方法本身的质量开始。所有这一切,都需要有个踏实做事、实事求是的文化氛围。橘生淮南则为橘,生于淮北则为枳.好的方法必须与文化相匹配。离开良好的文化土壤,再好的办法也无法发挥实效、也会变味。中国制造业的振兴,根子上还是要关注文化。 数据之巅读后感 (二) 数据之巅凌乱的读后感 第一次读大数据专题的书,谈起读后感肯定是班门弄斧了,就只是简单的说一说我的一些看法。 涂子沛的这部数据之巅,全书共八章,我原以为所谓数据之巅应当是展望未来的大数据时代,没想到全书竟是立足于过去,从历史切入。前面六章的内容,以美国自独立以来的发展历程为主线,从数据应用的角度,讲述
8、美国政治制度,经济建设以及军事管理,每一章的结尾又分析中国的现状,相应对比美国。一个国家的发展历程,从不同角度切入,就会有不同的着重点:军事家可能会串起每一次战争,分析军事战略;经济学家可能会梳理整个宏观经济环境的发展方向;政治学家可能会强调立宪立法各种政治制度的重要性。而作者从数据的角度切入,可以说是别开生面,让我们看到那些耳熟能详的故事背后数据所起到的作用。以南北战争为例,可能你知道林肯的民心所向,知道奴隶制度顺应潮流的消亡,但你未必知道谢尔顿将军以数据分析为基础进行的向大海进军的行动。类似的例子有很多,我觉得作者虽然以一个国家的发展历程为主线,但仍然写得有些凌乱,好像想到哪个与数据有关的
9、故事就写哪个似的。美国立法治国过程中政治制度上的博弈、人口普查与统计学、参众议院的席位设置,到数据在医学上的应用、在农业上的应用、霍乱井、预算、诉讼实证、农业应用、商业市场调查与项目决策、戴明的质量控制等,然后又穿插讲一些数据处理的技巧:数据可视化、样本与总体、问卷设计等,接着又跳回内开放:数据与知情权、用数据制衡;直到七八章才涉及一些现代化的数据应用。 可以说,我读这本书最大的感受,其实是震撼于数据的应用之广泛之深刻,因为前面六章内容几乎就是在跟你讲数据在美国、中国、日本等的历史上曾经起到这样这样的作用,在美国关于数据的挖掘和处理办法是怎样一步步完善。我觉得,这六章内容,跟书名数据之巅有些偏
10、颇,主题该是数据,前面一两章讲讲数据在美国中国历史上的作用,让读者感受一下数据的魅力,奠定一下基调就够了,结果直到五六章还是停留在这个层面,读来就有些腻了。如果书名改成类似数据与历史之类的,反而更好,这些历史已然是过去,数据之巅应该在未来。但我不得不承认,我确实为这些历史所震撼,也真的感觉到数据的重要性,未来如果能够做好数据的挖掘、处理、利用,应该是潜力无限的。 直至七八章,作者开始谈及大数据时代,大数据计算涉及其在社会领域以及物理环境领域两个方面的应用。社会领域则是我们比较熟悉的,例如从消费记录了解消费心理、捆绑销售啤酒与尿布、阿里巴巴凭交易记录迅速放贷等等的应用,这些可能也是提及大数据时代
11、大众的第一反应吧。物理环境领域的应用主要就是可穿戴设备、传感器等等这一类了。从亚马逊的预判发货、谷歌无人驾驶、3d打印机、智能学习平台等等这些新兴事物,我们都可以看到数据在未来的一个发展前景。作者以石油时代类比人类即将迎来的数据时代,其实非常直观易懂。 第八章作者提出智慧城市的概念,讲述了seeclick、佛山我的声音、旧金山311应用程序、社交媒体nextdoor等众包、众智、众创平台,讲真啊,我不知道这些跟数据有个啥关系但是作者提出的未来这种让大众解决大众的问题的模式我倒很是赞同。这之中跟数据有关的可能是涉及数据的隐私问题吧。大数据时代是不可避免的发展趋势,但隐私权确实是这个发展潮流中很重
12、大、也必须解决的一个问题。 作者点明,所谓数据之巅就是通过用数据训练机器,让机器获得智能,为人类提供自动化的服务.要有数据更要有计算,强大的识别算法才能实现数据挖掘,这是现有的阶段,而未来应该向机器学习发展,亦即编写会自动调节的算法. 这本书,还行。没有大开脑洞的设想未来,从历史出发,让人感受到数据的魅力,在对比中,也让人看到中国在数据方面与美国的差距,最后的展望,也是立足于现在。所以给人感觉比较踏实,对数据应用的理解更通透,而数据之巅在哪里,我觉得是每个读者在这个基础上延伸出去的头脑风暴。 真的是很凌乱的读后感,我觉得被作者看到要吐血的吧对大数据什么的真的没有比较深的了解,但是读完这部数据之巅,以后会继续关注、了解相关的内容。第7页 共7页