收藏 分销(赏)

人工智能及其应用作业1.docx

上传人:二*** 文档编号:4750008 上传时间:2024-10-11 格式:DOCX 页数:11 大小:21.84KB
下载 相关 举报
人工智能及其应用作业1.docx_第1页
第1页 / 共11页
亲,该文档总共11页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、人工智能及其应用作业1您的姓名:I填空题1*某成衣厂过去一年共生产了 10万件大衣,分为A/B/C三款。质检部门采用抽样 调查的方法,从中随机抽取出1000件进行检验,其中A款700件中5件不合格,B款150件中2件不合格,C款150件中3件不合格。根据数理统计中的概念,下 列选项中哪个是正确的? I单项选择题A款可以被称为总体单位B款的150件成衣是抽样总体C款的150件成衣是10万件成衣的观测值过去一年生产的io万件产品是这次调查的统计总体:正确答案)答案解析:暂无1. 数据仓库一般都是存在层次架构的,比方可以分为ODS、DW、DM层,不同粒 度的表,不同作用的表,一般会分布在不同的层级中

2、,如下相关信息表存放在 ODS层的有?单项选择题从源系统同步至数仓的粒度相同的一张登录日志表正礁答空)日期为天粒度的登录统计表从人的角度统计的登录情况表日期为月粒度的登录统计表答案解析:暂无2. 在数据仓库系统中,元数据是描述数据仓库内数据的结构和建立方法的数据,如 下关于元数据说法错误的选项是?单项选择题答案解析:暂无27. 数据仓库一般都是存在层次架构的,比方可以分为ODS、DW、DM层,不同 粒度的表,不同作用的表,一般会分布在不同的层级中,如下相关信息表存放在 DW层的有?(正确答案个数:3个)用户主题的宽表(正确答案)商品主题的宽表(正确答案)日期为天粒度的用户登录行为表正礁答奚)从

3、源系统同步至数仓的粒度相同的一张登录日志表一张针对某个客户的某个需求的一张汇总表答案解析:暂无在数据库中,可以使用insert into与insert overwrite的命令将数据插入到目标表 中,关于insert into与insert overwrite的说法正确的选项是?(正确答案个数:2个) insert into是直接往表中追加数据,屡次插入会产生多份数据正称答案)insert into语句往某个分区表的某个分区插入数据前,必须保证库表有对应的分 区,可手动先创立分区insert overwrite是往表中覆盖写,屡次插入只会保存一份数据正确答案)在对某些指定列做插入的时候,只能是

4、insert overwrite,不能用insert into操作 在对某些指定列做插入的时候,可以用insert overwrite,也可以用insert into操作 答案解析:暂无数据仓库性能的优化主要是针对表和数据分布的优化,利用阿里云大数据计算 服务MaxCompute构建企业数仓时,可以利用以下哪些技巧完成表的优化?(正确 答案个数:4个)针对数据量非常大,下游任务很多的表,可以合理利用中间表;(正确答案)针对业务重复的表,可以进行任务和数据的合并;(正矿答系)针对个别字段产出极慢的情况,可以将字段拆分为单独的表;(正确4合理利用拉链表能减少存储消耗;(D礁答奚)针对缓慢变化维,可

5、以通过每天一份全量快照的方式处理,不仅存储占用低,而且 数据使用方便;Tunnel数据采集过程和Reduce计算过程中产生的小文件,系统垃圾回收机制会自 动回收;答案解析:暂无个公司,通过手机扫描二维码的方式,做了一个全市的问卷调查,现需要将 调查结果上传到阿里云上,使用阿里云强大的机器学习能力,对数据进行分析,并 进行用户分群建模,如果考虑到本钱限制,最少可开通哪几个阿里云产品来完成此 项工作?(正确答案个数:2个)大数据计算服务MaxCompute(IE%答案)机器学习PAL E确答突)对象存储OSSBI报表平台Quick BI云数据库RDS答案解析:暂无28. 在数据仓库里,在数据治理范

6、围中,有生命周期管理一说,如下说法中属于生 命周期管理的是?(正确答案个数:2个)要求库表只保存近1年的数据,1年前的数据拷贝至磁带存储正确答案)所有近三个月未访问的库表,直接删除:正破答卖)所有的日调度任务必须凌晨6点前完成仓库表必须按照ODS、DW、DM的层级进行对应开发数据接口必须满足数据质量监控规那么,否那么不允许入库答案解析:暂无机器学习的工作方式包含哪些?(正确答案个数:5个)选择数据|正确答案)模型构建I正确答案)模型验证|正确答案)模型测试确答案)模型调优(正确答案)模型退化答案解析:暂无当我们在分析一份数据的时候,如果发现这份数据的特征变量很多,成千上 万,如果直接基于所有的

7、特征变量进行分析,会浪费过多的时间本钱及计算资源, 为了应对这种情况,我们可以采用降维的方式对数据进行预处理,如下技术中,哪 些属于降维技术?(正确答案个数:3个)主成分分析确答案)因子分析:正确答案)独立主成分分析3确答案)SVM随机森林答案解析:暂无29. 计划使用阿里云搭建一套数据平台,需要包含业务数据库、数据仓库、数据集 成、调度监控、报表展示等相关的功能,需要使用如下哪些产品?(正确答案个 数:4个)对象存储OSS大数据计算服务MaxCompute舟礁答案)一站式大数据开发平台DataWorks.正确答案)云数据库RDSBI报表平台QuickBI :确答奚)答案解析:暂无假设样本空间

8、S中,随机事件A与B互斥,P(A)0, P(B)0,那么o (正确答案个数:2个)P(A)= 1-P (B)P(AB) = P(A) * P(B)P(AUB)= P(A) + P(B)(正确答案)P(AAB)= 0(正确答案)答案解析:暂无30. 以下分布中,属于离散概率分布的是?(正确答案个数:4个)伯努利分布(确签案)幕律分布几何分布;王确答案)正态分布二项分布(正确答案)泊松分布(正确答案)答案解析:暂无元数据按其用途分为技术元数据和业务元数据技术元数据是存储关于数据仓库系统技术细节的数据,是用于开发和管理数据仓库 使用的数据业务元数据主要包括业务术语、信息分类、指标定义和业务规那么等信

9、息元数据也可以是业务数据,是业务行为的一种表达:正确答案)答案解析:暂无某公司要对其生产的蓝牙耳机进行测试。该产品的正品率为09次品率为0.1o 次仅测一个耳机,完毕后再测试下一个。在第三次测试时才检测到次品的 概率为。单项选择题3x(0.9)A2x0.13x(0.1)A2x0.9(0.9)人2x0.1(正确答案)(0.1)A2x0.9答案解析:暂无3. 数据分析报告的结构包括标题页、目录、前言、正文、结论与建议和附录几个部 分,一般情况下,分析背景,分析目的,分析思路的说明描述是在哪一个局部里面 表达?【单项选择题I前言(IF.确答案)正文结论与建议附录答案解析:暂无4. 数据仓库(Data

10、 Warehouse)是一个面向主题的、集成的、相对稳定的、反映历 史变化的数据集合,用于支撑管理决策,”反映历史变化指的是?单项选择题数据仓库中包含有大量的统计数据数据仓库的数据源来自各个业务系统数据仓库的数据一般情况下不做修改数据仓库随时间变化不断增加新的数据内容正礁答突)答案解析:暂无5. 在数据仓库里,建表的方式有好多种,可以直接使用as或者like的方式建表,如下建表语句,描述错误的选项是? create table tmp_a as select * from tmp_b;单项选择题tmp_b为分区表的话,那么tmp_a也为分区表 9答案)tmp_b为分区表的话,那么tmp_a不为

11、分区表tmp_b中所有的字段会在tmp_a中表达tmp_b中所有的数据会插入到tmp_a中答案解析:暂无数据仓库中有如下一张分区表,关于此表,如下描述错误的选项是? create table tmp_a(id int,name string)partitioned by (mon string,area string)row format delimited fields terminated bystored as textfile;单项选择题此分区表目前有月份、地域两级分区,可以直接再增加一个产品类型的第三级分区(正确答案)月份分区中,目前有201901、201902、201903三个分区

12、,可以在此表上直接增加 201904、201905等相关的月份分区月份分区中,目前有201901、201902、201903三个分区,可以直接将201902、201903的分区进行删除操作对于已经存在的分区(mon),分区名称可以被修改为mon_date答案解析:暂无9.在SQL解析中,以下哪些操作先于SELECT操作? |单项选择题GROUP BY( IEORDER BYSORT BYDISTRIBUTE BY 答案解析:暂无10. SQL语法中,常用到分组和排序,以下SQL执行报错的是?单项选择题select region,suni(pricc) as total_pricc from s

13、alc_dctail group by 1 ;select region,sum(price) as total_price from sale_detail group by region ;select region, select region, total_price ; 答案解析:暂无price from sale_detail group by region ; (i:确答宾)sum(price) as total_price from salc_dctail group by region order byH.阿里云大数据计算服务MaxCompute是阿里自主研发的产品,广泛适用

14、于商业 智能、数据分析、数据挖掘等领域,如下关于阿里云大数据计算服务MaxCompute 的描述中,错误的选项是?单项选择题阿里云大数据计算服务MaxCompute采用分布式跨级群技术搭建,可灵活扩展。阿里云大数据计算服务MaxCompute提供针对TB/PB级别的数据处理能力。阿里云大数据计算服务MaxCompute提供多层沙箱防护、细粒度权限管理及监控。 阿里云大数据计算服务MaxCompute提供实时要求极高的分布式处理能力。i王讪 答案)答案解析:暂无12. 在多维分析的商业智能解决方案中,根据事实表和维度表的关系,又可将常见 的模型分为星型模型和雪花型模型,如下描述中,不属于星星模型

15、的特点的是? 单项选择题join复杂度低查询逻辑简单可读性高数据冗余度小(,确签案)答案解析:暂无13. 数据仓库某个库表中的一个cust_id字段说明是一个客户,但发现这个表里存在 多个一样的custjd值,这种情况违反了哪种数据质量管理要求?单项选择题致性关联性完整性唯一性(正确答案)答案解析:暂无14. 在数据分析建模的过程中,Kimball模式建模一般遵循四步骤流程,分别是选取 要建模的业务处理过程,确定业务处理的粒度,选定最终事实表的维度,确定最终 事实表的事实四个步骤。如果一位同事咨询你想了解某个表中每一行的内容代表了 什么具体的含义,其实是想咨询你这个表的数据建模里的哪一个步骤信

16、息?【单项选择 题选取要建模的业务处理过程确定业务处理的粒度(正祈答案)选定最终事实表的维度确定最终事实表的事实答案解析:暂无15. 在整个数据仓库搭建的过程中,数据质量管理尤为重要,数据质量管理工作, 贯穿着整个数据加工过程,为什么说数据质量重要,如下内容描述错误的选项是?单 选题只有持续的数据质量改进才能推动数据治理体系的完善高质量的数据对管理决策,业务支撑都有极其重要的作用企业的数据质量与企业业务绩效之间不存在着直接的联系,企业看重业绩,并不看重数据质量|正确答案)没有良好的数据质量,数据会对决策产生误导,甚至产生不可估量的结果答案解析:暂无某数据仓库,从各个业务系统采集数据,因业务系统

17、不同,所以保存数据的样 式也不同,比方性别字段,有的业务系统保存的是:男、女,有的业务系统保存但 是:man、female,有的业务系统保存的是:1、0,现需要将性别字段信息统一调 整为:1、。的格式,这种情况主要是在处理哪种数据质量问题?单项选择题一致性(正确答案)及时性准确性唯一性答案解析:暂无阿里云机器学习PAI是一套基于阿里云大数据计算服务MaxCompute的数据挖 掘、建模、预测的工具,它不具备以下哪些特性?单项选择题支持大规模的数据采集与计算正确答奚)包含丰富的机器学习算法平台化管理支持离线调度和模型在线部署答案解析:暂无机器学习常见的特征处理方法不含?单项选择题数据预处理特征选

18、择降维特征监控(正确答案)答案解析:暂无阿里云BI报表平台Quick BI是专为云上用户量身打造的新一代智能B1服务平 台,如下关于相关BI报表平台Quick BI描述,不正确的选项是?单项选择题 可以通过拖拽式操作的方式完成一些报表的开发提供多种图形组件,可创立丰富的可视化图表提供TB/PB级别的数据批处理及调度配置操作 确符案)支持多种数据源:RDS、ADS、MaxComputc ; ECS 自建 Mysql、SqlScrvcr ;本地 文件等答案解析:暂无16. 阿里云BI报表平台Quick BI的总体特性很多,包括托拉拽操作,支持多种图 形组件,另外还有强大的平安管控能力,如下关于Qu

19、ick BI平安管控数据权限方 面,描述错误的选项是?单项选择题权限管理包括数据对象管理和行级权限管理同一个数据集中,如果进行行级控制,需对所有的字段均进行行级控制(正确答案)个人空间下的数据对象只有作者本人才有权限操作目前仅在Quick BI高级版和专业版的群空间中可以对数据集设置行级权限答案解析:暂无17. 应公司战略开展需要,领导决定搭建企业销售实时监控大屏,小王经过调研, 最终选择阿里云的DataV产品,以下不属于DataV开发步骤的是?单项选择题 创立可视化应用,选择企业实时销售数据模板配置可视化组件,调整组件的属性、样式等配置数据源,修改大屏中所有组件的数据预览并发布大屏对用户进行

20、分组赋权访问大屏 礁答奚)答案解析:暂无18. 大数据分析思维中,有一种思维是比照思维,有横向比照,也有纵向比照,如 下相关场景描述中,哪种不属于比照思维的场景?单项选择题今年三月的销售额比去年三月的销售额增加了 20%本月的销售额比上月的销售额降低了 10%个用户之前一段时间在app上访问游戏相关链接,app目前对此用户进行游戏相关信息推送(正确答案)某营业部整体考核成绩,第一季度为85分,第二季度比第一季度降低了 3分答案解析:暂无数据库中存在一张表tmp_a,关于如下语句,描述正确的选项是? select * from tmp_a where name not like 中国 单项选择题

21、查询表tmp_a中,字段name里含有”中国的所有记录查询表tmp_a中,字段name里以”中国”开头的所有记录查询表tmp_a中,字段name里以”中国结束的所有记录查询表tmp项中,字段name里不以”中国”开头的所有记录正确答案)答案解析:暂无机器学习指机器通过统计学算法,对大量的历史数据进行学习从而生成经验模 型,利用经验模型指导业务。以下关于机器学习的说法错误的选项是?单项选择题 机器学习的数据量要大,并且防止过多的噪音数据;机器学习生成的结果是模型,是通过历史经验总结出的一套解决方案;机器学习广泛应用于营销、预测、关系挖掘、文本分析、智能设备等方面; 机器学习的核心是算法,算法越复

22、杂,机器学习准确率就越高;(正确答案) 机器学习是反复训练的过程,通过学习对样本的特征进行统计和归纳;答案解析:暂无某宠物罐头工厂要对一批小鱼干零食(单位为g)进行质检,其样本数据为:12.5, 15.8, 14.5, 13.4, 16.3。根据上述数据,下面对样本均值和样本方差的计算中哪 些是正确的?(正确答案个数:2个)样本均值为15.0样本方差为1.42样本方差为2.03(正确答案)样本均值为14.5(上确答案)答案解析:暂无19. OLAP操作可以看做是基于数据仓库的数据处理,支持复杂的分析操作,侧重 决策支持,并且提供直观易懂的查询结果,如下相关操作属于OLAP操作的是?(正确答案个数:4个)下钻(确答案)切片(正确答案)旋转(正确答案)聚合 上钻(i

展开阅读全文
部分上传会员的收益排行 01、路***(¥15400+),02、曲****(¥15300+),
03、wei****016(¥13200+),04、大***流(¥12600+),
05、Fis****915(¥4200+),06、h****i(¥4100+),
07、Q**(¥3400+),08、自******点(¥2400+),
09、h*****x(¥1400+),10、c****e(¥1100+),
11、be*****ha(¥800+),12、13********8(¥800+)。
相似文档                                   自信AI助手自信AI助手
搜索标签

当前位置:首页 > 教育专区 > 初中其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服