资源描述
《大数据》题目
一、 单项选择题
1) 大数据的4V特点:Volume、Velocity、Variety、Veracity,其中他们的含义分别是( 1DBCA )、( 2 )、( 3 )、( 4 )。
A.价值密度低 B.处理速度快 C.数据类型繁多 D.数据体量巨大
2) 大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含故意义的数据进行( 5 B )。
A. 数据信息 B. 专业化处理 C.速度处理 D. 内容处理
3) 伴随谷歌( 6 )和( 7 )的公布,大数据不再仅用来描述大量的数据,还涵盖了处理数据的 ( 8 )。DCB
6: A.Map B.Docs C. YouTube D. MapReduce
7: A. 谷歌 Mobile B. i谷歌 C. 谷歌File System D. 谷歌 Docs
8: A.质量 B. 速度 C.精度 D. 进度
4) 斯隆数字巡天是使用位于新墨西哥州阿帕奇山顶天文台的2.5米口径望远镜进行的红移巡天项目,4月公布的有关Quasar spectra的数据为( 9 )。B
A.932,891,133 B. 228,468 C. 1,457,002 D. 668,054
5) 下列哪一项不属于大数据的治理:( 10 )C
A. 安全问题 B. 成本问题 C. 针对大用户 D. 信息生命周期管理
6) IBM的大数据战略以其在5月公布智慧分析洞察“3A5步”动态路线图作为基础,指的是在( 11 )的基础上( 12 )、,进而( 13 ),优化决议筹划能够救业务绩效。CBA
A. 采取行动(Act) B. 获取洞察(Anticipate)
C. 掌握信息(Align) D. 应用管理(management)
7) 在云生态环境中,用户需求相称于( 14 ),云数据中心相称于( 15 ),云服务相称于( 16 )。DCB
A. 降水 B. 水滴 C. 水库 D. 阳光
8) 尿布啤酒是大数据分析的( 17 )C
A. A/B测试 B. 分类 C. 关联规则挖掘 D. 数据聚类
9) 在GAPMINDER的Wealth & Health of Nations 中,中国在什么区域( 18 )B
A.黄色 B.红色 C.绿色 D. 蓝色
10) 舆情研判,信息科学侧重( 19 ),社会和管理科学侧重突发群体事件管理中的群体心理行为及( 20 ),新闻传输学侧重对( 21 )。 CBA
A. 舆论的本体进行规律性的探索和研究 B.舆论控制研究 C. 互联网文本挖掘和分析技术
11) 物联网是在计算机的( 22 )基础上,利用( 23 )、( 24 )等技术,结构一个覆盖世界上万事万物的“Internet of Things”。在这个网络中,物品(商品)能够彼此进行“交流”,而无需人的干预。 DCB
A. 有线数据通信 B. 无线数据通信 C. RFID D. 互联网
12) 数据挖掘工作的四个阶段,数据挖掘占总时间的百分比%( 25 ),对于成功重要性的百分比%( 26 )CB
A. 50 B. 20 C.80 D. 60
13) MapReduce的Map函数产生诸多的( 27 )C
A. key B. value C. <key,value> D. Hash
14) PageRank是一个函数,它对Web中的每个网页赋予一个实数值。它的意图在于网页的PageRank越高,那么它就( 28 )。 D
A. 有关性越高 B.越不重要 C.有关性越低 D. 越重要
15) 购物篮模型(market-basket model):用于描述两类对象之间的一个常见形式的( 29 )关系。C
A.一对一 B.一对多 C. 多对多 D. 多对一
16) AdWords 是一个迅速简单的购置广告服务的方式,这种广告服务的针对性强,无论您的预算是多少,它都按( 30 )。B
A.每个广告计费 B. 每次点击计费
C.每显示一次计费 D. 每浏览一次计费
17) 协同过滤分析用户兴趣,在用户群中找到指定用户的( 31 )用户,综合这些用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度( 32 ),并将这些用户喜欢的项推荐给有相同兴趣的用户。AD
A. 相同 B.相同 C.推荐 D. 预测
18) 12月28日,全国人大三次会议通过的( 33 )C
A. 《互联网行业的自律条约》 B. 《治安管理处罚条例》
C. 《有关加强网络信息保护的决定》 D. 《信息安全保护条例》
19) 谷歌 搜集的信息不包括 ( 34 )C
A. 日志信息 B. 位置信息 C.你的家庭组员 D. Cookie 和匿名标识符
20) 大数据的取舍与( 35 )不有关。B
A. 易于提取 B.家庭信息 C. 数字化 D. 便宜的存储器
21) IBM智慧地球中Smart Work指( 36 ) B
A. 新锐洞察 B. 智慧运作 C. 动态架构 D. 绿色将来
22) 依照IDC(国际数据企业)的监测统计,全球数据总量已经达成1.8ZB,而这个数值还在以每两年翻一番的速度增加,预计到全球将总共拥有的数据量( 37 ),增加近( 38 )倍。CB
A. 10 B. 20 C. 35ZB D. 20ZB
23) 3月29日奥巴马政府公布了( 39 )。该计划的目标是改进既有人们从海量和复杂的数据中获取知识的能力,从而加速美国在科学与工程领域创造的步伐,增强国家安全,转变既有的教学和学习方式。 首批共有6个联邦部门宣布投资( 40 )美元,共同提升搜集、储存、保存、管理、分析和共享海量数据所需核心技术的先进性,并形成合力;扩大大数据技术开发和应用所需人才的供应。CD
A.全民健康计划 B. 5亿 C. 大数据研发计划 D. 2亿
24) 大数据,或称巨量资料,指的是所包括的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达成撷取、管理、处理、并( 41 )成为协助企业经营决议更积极目标的信息。B
A.搜集 B. 整顿 C.规划 D.聚集
25) 大数据工程指大数据的( 42 )的系统工程。B
A. 大数据网络发展和运行过程 B. 规划建设运行管理
C. 规律和验证 D. 发觉和验证
26) 大数据科学关注大数据网络发展和运行过程中( 43 )大数据的规律及其与自然和社会活动之间的关系。D
A. 大数据网络发展和运行过程 B. 规划建设运行管理
C. 规律和验证 D. 发觉和验证
27) 大数据的价值是通过数据共享、( 44 )后获取最大的数据价值D
A.算法共享 B.共享应用 C. 数据互换 D. 交叉复用
28) 社交网络产生了海量用户以及实时和完整的数据,同时社交网络也统计了用户群体的( 45 ),通过深入挖掘这些数据来了解用户,然后将这些分析后的数据信息推给需要的品牌商家或是微博营销企业。C
A.地址 B.行为 C.情绪 D.起源
29) IBM的“3A5步”除Align、Anticipate、Act外,还需要不停地( 46 )从每一次业务成果中取得反馈,改进基于信息的决议流程,从而实现( 47 )。CB
A. Create B. Transform C. Learn D. Modify
30) IBM大数据平台和应用程序框架,( 48 )以经济高效的方式分析PB级的结构化和非结构化信息B
A. 流计算 B. Hadoop C.数据仓库 D.语境搜索
31) 临床决议支持系统通过电子病历、医学指引的比较等提升手术质量,减少错误治疗和( 49 )。C
A.医疗事故 B.病患投诉 C. 民事诉讼 D. 手术费用
32) 《数据新闻学手册》的作者们以为,通过数据的使用,记者工作的重点从“第一个报道者”转化成为对特定事件的影响的( 50 )。D
A.拍摄者 B.知情者 C.统计者 D. 阐释者
33) 通过( 51 )和展示数据背后的( 52 ),利用丰富的、具备互动性的可视化伎俩,数据新闻学成为新闻学作为一门新的分支进入主流媒体,即用数据报道新闻。BD
A.数据搜集 B. 数据挖掘 C.真相 D. 关联与模式
34) CRISP-DM 模型中Evaluation表示对建立的模型进行评定,重点详细考虑得出的成果是否符合( 53 )的商业目标。C
A. 第二步 B. 第三步 C. 第一步 D. 最后一步
35) 发觉关联规则的算法一般要通过如下三个步骤:连接数据,作数据准备;给定( 54 )和( 55 ),利用数据挖掘工具提供的算法发觉关联规则;可视化显示、了解、评定关联规则CD
54:A. 最大兴趣度 B. 最小置信度 C. 最小支持度 D. 最大可信度
55:A. 最小兴趣度 B. 最小置信度 C. 最大支持度 D. 最小可信度
36) 规则I->j,“有也许”,等于所有包括I的购物篮中同时包括J的购物篮的百分比,为( 56 )。B
A. 置信度 B.可信度 C. 兴趣度 D. 支持度
37) 假如一个匹配中,任何一个节点都不一样时是两条或多条边的端点,也称作( 57 )C
A. 极大匹配 B.二分匹配 C完美匹配 D.极小匹配
38) 国防部高级研究计划局(DARPA)的网络内部威胁(CINDER)计划,意在开发新的措施来检测军事计算机网络与( 58 )。作为一个揭露隐藏操作的伎俩,CINDER将适合用于将对不一样类型对手的活动统一成“规范”的内部网络活动,并意在提升对网络威胁检测的准确性、和速度。B
A. 内部网络活动 B. 网络间谍活动 C. 网络威胁检测 D. 网络漏洞检测
39) 只要具备适当的政策推进,大数据的使用将成为将来提升竞争力、生产力、创新能力以及( 59 )的核心要素。D
40) A.提升消费 B.提升GDP C.提升生活水平 D. 创造消费者盈余
41) 个性化推荐系统是建立在海量数据挖掘基础上的一个高级商务智能平台,以协助( 60 )为其用户购物提供完全个性化的决议支持和信息服务。 D
A.企业 B.各单位 C.跨国企业 D. 电子商务网站
二、多项选择题
42) 大数据的治理包括( 1 ABCD )
A. 容量问题 B. 延迟问题 C. 安全问题 D. 成本问题
43) Hadoop项目包括( 2 ABD )
A. Hadoop Distributed File System(HDFS) B. HadoopMapReduce编程模型
C. HadoopStreaming D. Hadoop Common
44) 基于“3A5步”动态路线图,IBM提出了“大数据平台”架构。该平台的核心能力包括( 3 ABCD )
A. Hadoop系统 B. 流计算(StreamComputing)
C.数据仓库(Data Warehouse) D. 信息整合与治理(Information Integration and Governance)
45) 大数据在医疗与健康的临床应用包括( 4 ABC )
A. 疗效比较研究方案CER B. 临床决议支持系统
C. 远程患者监测系统 D. 患者家庭情况分析
46) 《数据新闻学手册》为我们提供了某些简单的搜索提议。目前的网络技术允许我们进行精准搜索,例如( 5 ABCD )
A. 电子数据表 B. 地理数据 C. 数据库抽取 D. PDF文献
47) 物联网, 中国政府工作报告把物联网定义为通过信息传感设备,按照约定的协议,把任何物品与互联网连接起来,进行通信和信息互换,以实现智能化( 6 ABCD )
A. 识别 B. 定位 C. 跟踪 D. 监控和管理的一个网络
48) 数据挖掘的挖掘措施包括:( 7 ABCD )
A. 聚类分析 B. 回归分析 C. 神经网络 D. 决议树算法
49) Web内容挖掘实现技术( 8 ABCD )。
A. 文本总结 B. 文本分类 C. 文本聚类 D. 关联规则
50) 基于内容的推荐生成推荐的过程重要依托( 9 ACD )
A. 内容分析器 B. 推荐系统 C. 文献学习器 D. 过滤部件
51) 如下哪些管理要求对信息安全及个人隐私进行了保护( 10ABC )
A. 《互联网行业的自律条约》 B. 《治安管理处罚条例》
C. 《有关加强网络信息保护的决定》 D. 《信息安全保护条例》
52) 大数据可提成( 11 ABD )、大数据应用等领域。目前人们谈论最多的是大数据技术和大数据应用。
A. 大数据技术 B.大数据工程 C. 大数据搜集 D. 大数据科学
53) 云计算的服务方式有( 12 ACD )
A.IaaS B.Raas C.PaaS D. SaaS
54) 大数据在社会管理能实现( 13 ABCD )
A. 提升社会管理的效能 B. 减少行政开支
C. 创造新的价值 D. 实现信息透明
55) 产品设计的研究和开发包括( 14 BCD )
A. 虚拟数字工厂 B. 产品生命周期管理 C. 评定设计 D. 开放创新
56) CRISP-DM 模型为一个KDD工程提供了一个完整的过程描述.该模型将一个KDD工程分为几个不一样的、但次序并非完全不变的阶段,包括business understanding、data understanding、data preperation、( 15ACD )
A. deployment B.design C. modeling D. evaluation
57) 文本挖掘的工具备( 16 BCD )
A.SPP Text Mining B. IBM DB2 intelligent Miner
C. SAS text miner D. SPSS Text Mining
58) 数据和软件保护的开放科学(DASPOS)第一次尝试建立一个来自大型强子对接机和费米试验室的( 17ABCD )教授之间的正式合作。
A. 理学家 B. 数字保管 C. 异构存储系统 D. 大规模计算机系统方面
59) 长尾效应,新竞争力从人们需求的角度来看,大多数的需求会集中在头部,而这部分我们能够称之为流行,而分布在尾部的需求是个性化的,零散的小量的需求。而这部分差异化的,少许的需求会在需求曲线上面形成一条长长的“尾巴”,而所谓长尾效应就在于它的( 18 D )上,将所有非流行的市场累加起来就会形成一个比流行市场还大的市场。
A.质量 B.长度 C.长期 D. 数量
60) 为充足获取大数据潜力必须处理的重要问题是数据政策、技术和技能以及( 19 ABC )
A. 组织变革和人才 B. 数据访问权 C. 行业结构 D. 政府职能
61) 推荐系统为客户推荐商品,自动完成个性化选择商品的过程,满足客户的个性化需求,推荐基于网站最热卖商品、客户所处城市、( 20D ),推测客户将来也许的购置行为。
A.客户的朋友 B.客户的个人信息
C.客户的兴趣兴趣 D. 客户过去的购置行为和购置统计
一、单项选择题答案:
1-5
DBCAB
6-10
DCBBC
11-15
CBADC
16-20
BCBCB
21-25
ADCBC
26-30
BCDCB
31-35
ADCCB
36-40
BCBCD
41-45
BBDDC
46-50
CBBCD
51-55
BDCCD
56-60
BCBDD
二、 多项选择题答案:
1
ABCD
2
ABD
3
ABCD
4
ABC
5
ABCD
6
ABCD
7
ABCD
8
ABCD
9
ACD
10
ABC
11
ABD
12
ACD
13
ABCD
14
BCD
15
ACD
16
BCD
17
ABCD
18
D
19
ABC
20
D
选择题
1. 下列哪一项不是大数据提供的用户交互方式:(C)
A. 统计分析和数据挖掘
B. 任意查询和分析
C. 图形化展示
D. 企业报表
2.与大数据亲密有关的技术是(B)
A蓝牙 B, 云计算 C,博弈论 D,wifi
3.大数据应用需依托的新技术有( D)
A.大规模存储与计算
B.数据分析处理
C.智能化
D.三个选项都是
4. 与大数据亲密有关的技术是(B)
A蓝牙 B 云计算 C 博弈论 D wifi
填空题
1. 大数据最具潜能的三大应用领域分别为 商业智能,公共服务和市场营销.
2. 1pb=(1024)tb=(2e20)gb=(2e30)mb=(2e40)kb
3. 大数据的特性是___、___、___、___。
答案:大量化 、多样化、迅速化、价值密度低。
4. 大数据的4v特性分别是大量化 多样化 迅速化 价值密度低
判断题
1. 大数据的存储方案一般对一份数据在不一样节点上存储三份副本,以提升系统容错性。 (√)
2. 大数据思维,是指一个意识,以为公开的数据一旦处理得当就能为千百万人急需处理的问题提供答案。(√)
3. 数据可视化能够便于人们对数据的了解(√)
4. 大数据技术和云计算技术是两门完全不有关的技术(X)
简答题
1. 请简述大数据的成果展现方式。
答:
1) 报表形式
基于数据挖掘得出的数据报表,包括数据表格、矩阵、图形和自定义格式的报表等,使用以便、设计灵活。
2.图形化展现
提供曲线、饼图、堆积图、仪表盘、鱼骨分析图等图形形式宏观展现模型数据的分布情况,从而便于进行决议。
2) KPI展现
提供表格式绩效一览表并可自定义绩效查看方式,如数据表格或走势图,企业管理者可依照可度量的目标迅速评定进度。
4.查询展现
按数据查询条件和查询内容,以数据表格来汇总查询成果,提供明细查询功效,并可在查询的数据表格基础上进行上钻、下钻、旋转等操作。
2. 例举身边的大数据。
答:
i. QQ,微博等社交软件产生的数据
ii. 天猫,京东等电子商务产生的数据
iii. 互联网上的各种数据
3. 简述大数据的数据管理方式。
答:对于图像、视频 、URL、地理位置等类型多样的数据,难以用老式的结构化方式描述,因此需要使用由多维表组成的面对列存储的数据管理系统来组织和管理数据。也就是说,将数据按行排序,按列存储,将相同字段的数据作为一个列族来聚合存储。不一样的列族对应数据的不一样属性,这些属性能够依照需求动态增加,通过这么的分布式实时列式数据库对数据统一进行结构化存储和管理,防止了老式数据存储方式下的关联查询。
4. 什么是大数据?
答:大数据是指无法在允许的时间内用常规软件工具对其内容进行抓取、管理和处理的数据。
《大数据时代》试题
单项选择题
1、大数据的核心就是(B)【P26】
A、通知与许可
B、预测
C、匿名化
D、规模化
2、大数据不是要教机器像人同样思考。相反,它是(A)【P26】
A、把数学算法利用到海量的数据上来预测事情发生的也许性。
B、被视为人工智能的一部分。
C、被视为一个机器学习。
D、预测与处罚。
3、采样分析的精准性伴随采样随机性的增加而(C),但与样本数量的增加关系不大。【P32】
A、减少
B、不变
C、提升
D、无关
4、大数据是指不用随机分析法这么的捷径,而采取(A)的措施【P35】
A、所有数据
B、绝大部分数据
C、适量数据
D、少许数据
5、大数据的简单算法与小数据的复杂算法相比(A)【P40】
A、更有效
B、相称
C、不具备可比性
D、无效
6、相比依赖于小数据和精准性的时代,大数据因为更强调数据的(D),协助我们深入接近事实的真相。【P46】
A、安全性
B、完整性
C、混杂性
D、完整性和混杂性
7、大数据的发展,使信息技术变革的重点从关注技术转向关注(A)【P61】
A、信息
B、数字
C、文字
D、方位
8、大数据时代,我们是要让数据自己“发声”,没必要懂得为何,只需要懂得(B)【P48】
A、原因
B、是什么
C、关联物
D、预测的核心
9、建立在有关关系分析法基础上的预测是大数据的(C)【P51】
A、基础
B、前提
C、核心
D、条件
10、(C)下列说法正确的是【P75-77】
A、有价值的数据是从属于企业经营核心业务的一部分数据;
B、数据挖掘它的重要价值后就没有必要再进行分析了;
C、所有数据都是有价值的;
D、在大数据时代,搜集、存储和分析数据非常简单;
11、有关数据创新,下列说法正确的是(D)【P78-85】
A、多个数据集的总和价值等于单个数据集价值相加;
B、因为数据的再利用,数据应当永久保存下去;
C、相同数据数次用于相同或类似用途,其有效性会减少;
D、数据只有开放价值才能得到真正释放。
12、有关数据估值,下列说法错误的是(B)【P113】
A、伴随数据价值被重视,企业所持有和使用的数据也徐徐纳入了无形资产的范围;
B、无论是向公众开放还是将其锁在企业的保险库中,数据都是有价值的;
C、数据的价值能够通过授权的第三方使用来实现
D、目前能够通过数据估值模型来准确的评定数据的价值评定
13、在大数据时代,下列说法正确的是(B)。【P116】
A、搜集数据很简单
B、数据是最核心的部分
C、对数据的分析技术和技能是最重要的
D、数据非常重要,一定要很好的保护起来,预防泄露
14、伴随数据科学家的崛起,(C)的地位将发生动摇。【P99】
A、国家领导人
B、大型企业
C、行业教授和技术教授
D、职业经理人
15、大数据企业的多样性表白了(B)【P97】
A、数据作用的体现
B、数据价值的转移
C、数据技术的发展
D、数据思维的创新
16、如下哪种说法是错误的(B)【P104-107】
A、将罪犯的定罪权放在数据手中,借以体现对数据和分析成果的崇尚,这实际上是一个滥用。
B、伴随数据量和种类的增多,大数据促进了数据内容的交叉检查,匿名化的数据不会威胁到任何人的隐私。
C、采集个人数据的工具就隐藏在我们日常生活所必备的工具当中,例如网页和智能手机应用程序。
D、预测与处罚,不是因为所做,而是因为将做。
17、只要得到了合理的利用,而不单纯只是为了“数据”而“数据”,大数据就会变成(B)【P113】
A、强大的威胁
B、强大的武器
C、预测工具
D、分析工具
18、在大数据时代,我们需要设置一个不一样样的隐私保护模式,这个模式应当更着重于(A)为其行为负担责任。【P116】
A、数据使用者
B、数据提供者
C、个人许可
D、数据分析者
19、对大数据使用进行正规评测及正确引导,能够为数据使用者带来什么切实的好处(A)【P116】
A、他们无须再取得个人的明确同意,就能够对个人数据进行二次利用。
B、数据使用者不需要为敷衍了事的评测和不达标准的保护措施负担法律责任。
C、数据使用者的责任不需要强制力规范就能确保履行到位。
D、所有项目,管理者必须设置规章,要求数据使用者应怎样评定风险、怎样躲避或减轻潜在伤害。
20、促进隐私保护的一个创新途径是(D):故意将数据含糊处理,促使对大数据库的查询不能显示精准的成果。【P117】
A、匿名化
B、信息含糊化
C、个人隐私保护
D、差异隐私
多项选择题
1、大数据与三个重大的思维转变有关,这三个转变是什么?(ACD)。【P30】
A、要分析与某事物有关的所有数据,而不是依托分析少许的数据样本。
B、我们乐于接收数据的纷繁复杂,而不再追求精准性。
C、在数字化时代,数据处理变得愈加轻易、愈加迅速,人们能够在瞬间处理成千上万的数据。
D、我们的思想发生了转变,不再探求难以捉摸的因果关系,转而关注事物的有关关系。
2、下面有关大数据的讲解正确的是(ABC)。【P20】
A、大数据是人们在大规模数据的基础上能够做到的事情,而这些事情在小规模数据的基础上是无法完成的。
B、大数据是人们取得新的认知、创造新的价值的源泉。
C、大数据还是变化市场、组织机构,以及政府与公民关系的措施。
D、无效的数据越来越多。
3、大数据的科学价值和社会价值正是体目前(AB)【P24】
A、首先,对大数据的掌握程度能够转化为经济价值的起源。
B、另首先,大数据已经撼动了世界的方方面面,从商业科技到医疗、政府、教育、经济、人文以及社会的其他各个领域。
C、大数据的价值不再单纯起源于它的基本用途,而更多源于它的二次利用。
D、大数据时代,诸多数据在搜集的时候并无意用作其他用途,而最后却产生了诸多创新性的用途。
4、有关大数据的说话正确的有(ABC)【P42】
A、大数据时代要求我们重新审阅精准性的优劣。
B、大数据不但让我们不再期待精准性,也让我们无法实现精准性。
C、错误并不是大数据固有的特性,而是一个亟需我们去处理的现实问题,并且有也许长期存在。
D、错误性是大数据自身固有的。
5、社会将两个折中的想法不知不觉地渗透了我们的处事措施中,我们甚至不再把这当成一个折中,而是把它当成了事物的自然状态。这两个折中的措施是什么?(AB)【P46】
A、第一个折中是我们默认自己不能使用更多的数据,因此我们就不会去使用更多的数据。
B、第二个折中出目前数据的质量上。
C、第一个折中是我们能够容忍含糊和不确定出目前某些过去依赖于清楚和精准的领域。
D、第二个折中是能够得到一个事物更完整的概念,我们就能
接收含糊和不确定的存在。
6、数据化最早的根基是什么(AC)【P64】
A、计量 B、数字化
C、统计 D、阿拉伯数字
7、有关数据创新包括(ABCDEF)【P79】
A、数据的再利用
B、重组数据
C、可扩展数据
D、数据的折旧值
E、数据废气
F、开放数据
8、有关数据的潜在价值,说法正确的是(ABCD)。【P79】
A、数据的真实价值就像漂浮在海洋中的冰山,第一眼只能看到冰山一角,而绝大部分则隐藏在表面之下。
B、判断数据的价值需要考虑到将来它也许被使用的各种方式,而非仅仅考虑其目前的用途。
C、在基本用途完成后,数据的价值仍然存在,只是处在休眠状态
D、数据的价值是其所有也许用途的总和
9、下列哪些属于数据废气(ABC)【P84】
A、搜索核心词时,人们的错误拼写;
B、人们浏览网页时停留的时间;
C、人们阅读电子书章节的时间长短;
D、商品每个月被购置的数量。
10、下面例子属于大数据技术企业的是(ABCD)【P92-94】
A、四大机票预订系统之一的ITA Software
B、与各行各业的企业合作应用高级无线感应技术来搜集数据,然后对这些数据进行分析的埃森哲咨询企业。
C、微软研究中心与华盛顿中心医院合作分析了数年来的匿名医疗统计
D、在对冲基金工作的金融工程师杰夫•贝索斯创建了网上书店亚马逊。
11、下列属于数据中间商的是(BCD)【P96】
A、中国最大的银行中国银行,拥有大量客户的数据。
B、西雅图的交通数据处理企业Inrix,聚集了来自美洲和欧洲近1亿辆汽车的实时交通数据。
C、中国最大的汽车网站,汽车之家,各家汽车的数据和大量用户。
D、Quantcast通过协助网站统计用户的网页浏览历史来测评用户的年龄、收入、喜好等个人信息,然后向用户发送有针对性的定向广告。
12、进行大数据分析的人能够轻松地看到大数据的价值潜力,这极大地刺激着他们深入(ABD)我们个人数据的野心。【P104】
A、采集
B、存储
C、分析
D、循环利用
13、有关大数据和互联网,如下哪些说法是正确的(ABD)【P104-105】
A、互联网的出现使得监视变得更轻易、成本更低廉也更有用处。
B、大数据无论怎样利用都是我们合理决议过程中的有力武器。
C、大数据的价值不再单纯起源于它的基本用途,而更多源于它的二次利用。
D、大数据时代,诸多数据在搜集的时候并无意用作其他用途,而最后却产生了诸多创新性的用途。
14、单纯依据大数据预测作出决议需遵照哪些标准(ABCD)【P117-118】
A、公开标准
B、公正标准
C、可辩驳标准
D、确保个人动因能防范数据独裁的危害
15、大数据时代对信息进行有效、公正管理的三项方略是什么(ABC)【P121】
A、在使用预测分析时考虑个人动因
B、隐私保护从个人许可到数据使用者负担责任的转变
C、催生大数据审计员
D、将反垄断法付诸行动
判断题
1、采样分析的精准性伴随采样随机性的增加而大幅提升,但与样本数量的增加关系不大。(√) 【P32】
2、内大数据是指不用随机分析法这么的捷径,而采取所有数据的措施。(√)【P35】
3、要想取得大规模数据带来的好处,混乱应当是一个标准途径,而不应当是极力防止的。(√) 【P44】
4、数据化就是数字化,是相互等同的关系。(×) 【P64】
5、虽然数据用于基本用途的价值会减少,但潜在价值却仍然强大。(√) 【P82】
6、大数据思维,是指一个意识,以为公开的数据一旦处理得当就能为千百万人急需处理的问题提供答案。(√)【P93】
7、对于大型、中等、小型规模的企业而言,大数据对中等规模的企业协助最大。(X) 【P130】
8、大数据的核心思想就是用规模剧增来变化现实状况。(√) 【P104】
9、内部算法师将扮演公正的审计员的角色,在客户或政府所要求的任何时候,依照法律指令或规章对大数据的准确程度或者有效性进行判定。(×)【P120】
展开阅读全文