收藏 分销(赏)

《金融数据分析(技能基础)》期末考核试卷及答案.docx

上传人:二*** 文档编号:4515523 上传时间:2024-09-26 格式:DOCX 页数:30 大小:244.32KB
下载 相关 举报
《金融数据分析(技能基础)》期末考核试卷及答案.docx_第1页
第1页 / 共30页
亲,该文档总共30页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、*学院课程考核试卷(20182019学年度第一学期)金融数据分析(技能基础)课程(A臼/B 口卷)作答说明:.将程序拷贝到对应题目下面,并将运行结果(局部)截图放在程序后面。课程代码考核形式机试考试班级考核日期2。_年_月一日考核时长一分钟命题教师签名教研室主任签名主管学院领导签名题号二三四五六总分分值20301416201 0 0实得分统分人核分人.另建一个文件夹,命名:答题程序,存放每题程序及数据文件、最后压缩。2 .将I和2的文件压缩,命名:学号(完整)+姓名,并提交。得分 评卷人一、程序计算综合应用题(本大题共1小题,每题20分,共20分)“拍照赚钱”是移动互联网卜的一种自助式服务模式

2、。用户下载APP,注册成为 APP的会员,然后从APP上领取需要拍照的任务(比方卜.超市去检查某种商品的上架情 况),赚取APP对任务所标定的酬金。这种基于移动互联网的自助式劳务众包平台,为 企业提供各种商业检查和信息,相比传统的市场调查方式可以大大节省调查本钱, 而且有效地保证了调查数据真实性,缩短了调查的周期。因此APP成为该平台运行的 核心,而APP中的任务定价又是其核心要素。如果定价不合理,有的任务就会无人问 津,而导致商品检查的失败。附件一是一个已结束工程的任务数据,包含了每个任务的位置、定价和完成情况 (“1”表示完成,“0”表示未完成);附件二是会员信息数据,包含了会员的位置、信

3、 誉值、参考其信誉给出的任务开始预订时间和预订限额,原那么上会员信誉越高,越优先 开始挑选任务,其配额也就越大(任务分配时实际上是根据预订限额所占比例进行配 发)。附件一和附件二的表结构如表1和表2所示。表1附件一:已结束工程任务数据注:案例内容及数据来源于2017年全国大学生数学建模竞赛B题任务号码任务gps纬度任务gps经度任务标价任务执行情况A000122.56614225113.9808368660A000222.68620526113.940525265.50A000322.57651183113. 95719865.51A000122. 56481081114.2445711750

4、A000522.55888775113.950722765.50A000622.55899906114.2413174750A000722.54900371113.972259765.51A000822.56277351113. 956573565.50表2附件二:会员信息数据会员编号会员位置(GPS)预订任务 限额预订任务开 始时间信誉值B000122. 947097 113. 6799831146:30:0067997. 3868B000222. 577792 113. 9665241636:30:0037926. 5416B000323. 192458 113. 3472721396:3

5、0:0027953. 0363B000423. 255965 113.31875986:30:0025085. 6986建一个Python脚本文件,命名为testl.py,完成以下任务:I)计算A0001、A0002任务位置到所有会员位置的距离,结果采用两个序列来保存, 分别记为S_A0001、S_A0002,其中index为会员编号,值为其对应的距离。(10分) 院校的在校生数:x9为国家财政预算内普通高教经费占国内生产总值比重;xlO为生均 教育经物)。建一个Python脚本文件,命名为test3.py,完成以下任务:3)对以上指标数据做主成分分析,并提取其主成分,要求累计贡献率到达90%

6、以上。(7分)4)基于提取的主成分,对以上30个地区做K-均值聚类分析(K=4),并将地区名称和 所属的类别在命令窗口中输出聚类结果。(7分)代码为:import pandas as pddata=pd.rcad_cxccl(高教数据.xlsx)X=data.iloc:.l:from skleam.preprocessing import StandardScaler#规范化处理scaler = StandardScaler()scaler.fit(X)X=scaler.transfonn( X)from skleam.decomposition import PCA#主成分分析模块pca=P

7、CA(n_componcnls=0.90) #累计贡献率达至U 90%以上pca.fit(X)Y=pca-gnsfbrni(X)# 主成分from skleani.cluster import KMeans #K-均值聚类模块model = KMeans(n_clusters = 4. random_state=0. max_iter = 500)model.fit(Y)c=modeLlabels_#K-均值聚类结果Fs=pd.Series(c,index=datar 地区)Fs=Fs. sort_val ues( ascend i ng=Tr ue )#K-均值聚类整理后结果print。第

8、0 类为:list(FsFs=O.index)printed I 类为:,list(FsFs=lindex)prinlC第 2 类为:,Jist(FsFs=2.index)print(笫 3 类为:,list(Fs(Fs=3.index)结果为:(1) 标准化数据结果提取其主成分卿 X - NuWy array!801234$6789*014.441192.e2i43.972522.7)284.10792.426194.299942.466M4.17442.192M4.5W1.X8482.45)21.844115,“21“4.22779.89t7372.44V Ji.esiw21.03*611

9、.4767Si.S3e541.38e67戈591.65441.42642e.7BM8e.711133s39.99679.2S7M8.1927M.21t74S .X8MM.X793.MM731.71217 .MSM314 -2U219.35125238S469明”】319-7 .72W747X212“”7”0Q35X185-98,31*286.2X770.23WS6.152105.1854M.5874180.28868.531362.66755436.0S6S483.M5282.054”用.87t571e. 2524610.37747.MM997S-.22474.7aeeee.274445 U,

10、京粽 八宁州,上西 7贵IZT:1 )1,、/ W 一浙高,天青北 g 西鼎 山, 匕* 不, ,豕 妇江得分评卷人四、关联规那么算法基础应用题(本大题共1小题,每题16分,共16分)假设行以下数据集,每行代表一个顾客在超市的购买记录:II:西红柿、排骨、鸡蛋、毛巾、水果刀12:13:西红柿、茄子、水果刀、香蕉鸡蛋、袜子、毛巾、肥皂、水果刀14:西红柿、排骨、茄子、毛巾、水果刀15:16:西红柿、排骨、酸奶鸡蛋、茄子、酸奶、肥皂、香蕉17:18:排骨、鸡蛋、茄子、水果刀土豆、鸡蛋、袜子、香蕉、水果刀19:西红柿、排骨、鞋子、土豆、香蕉建一个Pylhon脚本,命名为心l4.py,完成以卜任务:3

11、)将以上购买记录转换为布尔类型数据,其数据结构为DataFrame (10分)4)利用Apriori关联规那么挖掘算法函数进行关联规那么挖掘,最小支持度和最小置信度 分别为0.2和0.4,并将挖掘结果导出到Excel表格中(6分)代码为:tiem=r西红柿排骨鸡蛋毛巾,水果刀茄子香蕉袜子肥皂酸奶土豆鞋子import pandas as pdimport numpy as npdata = pdread_table(第四题.txt,sep=、,heade尸None)D=dict() ibr l in range(len(tiem):z=np.zeros(len(data)li=list()for

12、 k in range(len(data.iloc0,:):s=data.iloc|:.k=tiemt|li.cxtend(lisl(s(s.valucs=True.index) apriori.find_rule(Data, support, confidence, ms).(o_exccl(outputfilc)zli=lD.setdcfault(tieint,z)Data=pd .DataFrame(D) import apriorioutputfilc = apriori_rules.xls suppori = 0.2confidence = 0.4ms =-zli=lD.setdcf

13、ault(tieint,z)Data=pd .DataFrame(D) import apriorioutputfilc = apriori_rules.xls suppori = 0.2confidence = 0.4ms =-zli=lD.setdcfault(tieint,z)Data=pd .DataFrame(D) import apriorioutputfilc = apriori_rules.xls suppori = 0.2confidence = 0.4ms =-#导入自行编写的apriori函数#结果文件#最小支持度#最小置信度#连接符,默认结果为: 把顾客在超市的购买记录

14、复制到文本文件中,用“、”分隔提取数据,无表头回 data - DataFrameIndex012340西红柿拌皆鸡蛋毛巾水果刀1西红柿茄子水果刀香蕉Hone2鸡蛋秣子毛巾肥皂水果刀3西红柿持骨超毛巾水果刀4西红柿持告硼NoneNone5鸡参茄子硼肥皂香蕉6排骨鸡蛋茄子水果刀None7s鸡蛋袜子香建水果刀8西红柿排骨建子s香蕉(I)将以上购买记录转换为布尔类型数据圈 Dau - DuFrame(2)利用Apriori关联规那么挖掘算法函数进行关联规那么挖掘挖掘结果导出到Excel表格中的结果:结果为:毛巾-水果刀support confidence0.3333331.000000土豆一香蕉0.

15、2222221.000000袜子-水果刀0.2222221.000000肥皂-鸡蛋0.2222221.000000袜子.鸡蛋0.2222221.000000排骨-毛巾-水果刀0.2222221.000000毛巾-西红柿一 一排骨0.2222221.000000排骨-毛巾一西红柿0.2222221.000000排骨-茄子-水果刀0.2222221.000000排旨-鸡蛋-水果刀0.2222221.000000毛巾一 一西红柿一一水果刀0.2222221.000000毛巾.鸡蛋.水果刀0.2222221.000000茄子-西红柿-水果刀0.2222221.000000袜子-鸡蛋-水果刀0.2222

16、221.000000水果刀-袜子-一鸡蛋0.2222221.000000毛巾-水果刀-西红柿-排骨 0.2222221.000000排备-水果刀-西红柿-一毛巾 0.2222221.000000排智-毛巾-西纤柿水果 71 0.2222221.000000A1八ABCD1! support:onfidence2毛巾一水果刀0.33333313土豆香蕉0 22222214袜子一水果刀0 22222215肥皂一鸡蛋0.22222216袜子一鸡蛋0 22222217排骨毛巾水果刀0 22222218毛巾一西红柿排骨0.22222219捧音一毛巾一西红柿0.222222110持台茄子水果刀0 2222

17、22111排骨鸡蛋水果刀0.222222112毛巾西红柿一水果刀0.222222113毛巾一鸡蛋水果刀0 222222114茄子西红柿水果刀0 222222115袜子一鸡蛋水果刀0.222222116水果刀-袜子鸡蛋0.222222117毛巾一水果刀西红柿排骨0 222222118播骨一水果刀一西红柿毛巾0.222222119排骨一毛巾一西红柿一水果刀0.222222120排骨一毛巾水果刀一西红柿0 222222121西红柿排骨0 4444440 822排管一西红柿0.4444440.823玛蛋一水果刀0.4444440.824茄子一水果刀0.3333330.7525水果刀鸡蛋0.444444

18、0 66666726毛巾一排管0.2222220.66666727毛巾一西红柿0 2222220 66666728毛巾一鸡蛋0 2222220 66666729毛巾一水果刀一排骨0.2222220.66666730排骨水果刀毛巾0.2222220 66666731水果刀茄子播音0 2222220 66666732排骨水果刀茄子0.2222220 66666733水果刀一西红柿一排骨0.2222220.66666734排骨水果刀西红柿0 2222220 66666735排骨水果刀鸡蛋0 2222220 66666736水果刀一西红柿一毛巾0.2222220.66666737毛巾水果刀.西红柿0.

19、2222220.666667得分 评卷人 五、综合应用案例分析题(本大题共1小题,每题20分,今有沪深300指数2014年的交易数据,其数据结构表3所示。共20分)表3沪深300指数2014年交易数据字段依次表示指数代码、交易日期、开盘价、最高价、最低价、收盘价、成交量。IndexedIdxtrdOlIdxtrd02Idxtrd03Idxtrd04Idxtrd05Idxtrd060003002014-01-022323. 432325. 992310. 652321.98451942.90003002014-01-032311.972314.842280. 892290. 78597826.

20、50003002014-01-062286.372286. 372229. 332238. 6466300-i0003002014-01-072222. 312246. 792218. 6522384375310003002014-01-082240. 642262. 582228. 422241.91513488.50003002014-01-092236.972258. 892220. 82222. 22559870. 40003002014-01-102216.522224. 492200. 222204. 85541692.90003002014-01-1322072222. 0721

21、83.62193. 68501227.70003002014-01-142192. 842214.122179.912212. 85540499. 50003002014-01-152210. 022215.92193.82208. 94489624建一个Python脚本,命名test4.py,完成以下任务:1)请计算如下指标:A1 (收盘价/均价):即收盘价/过去10个交易日的移动平均收盘价A2 (现量/均量):即成交量/过去10个交易日的移动平均成交量A3 (收益率):(当日收盘价-前日收盘价)/前日收盘价A4 (最高价/均价):最高价/过去10个交易日的移动均平均收盘价A5 (最低价/均

22、价):最低价/过去10个交易日的移动平均收盘价A6 (极差):最高价-最低价(衡量波动性)A7 (瞬时收益):收盘价开盘价丫(决策变量):后交易口收盘价-当前交易口收盘价,如果大于0,记为1;如果小 于等于0,记为-K同时对指标A1A7作标准化处理:(当前值-均值)/标准差,最终得到以下标准的数 据结构形式:ID Al A2 A3 A4 A5 A6 A7 Y1 (10 分)2)取后30条记录作为测试样本,剩下的数据记录为训练样本,利用支持向量机模型 进行训练及测试,获得模型的准确率和预测准确率,分别记为score和Rv,并在命令窗 口中输出score和Rv“(10分)代码为:import pa

23、ndas as pdimport niinipy as npld=pd.read_excel(沪深 300 指数 2014 年交易数据.xlsx)#1、获取指标AI=tdIdxtrd05.values/pd.roHing_mean(tdTdxlrd05.values,l0)A2=ldIdxtrd06l.values/pd.rolling_mcan(tdIdxtrd06.values, 10)A4=tdIdxtrd03,lAalues/pd.rolling_niean(tdridxlrd05.values. 10)A5=tdldxtrd04l.values/pd.rolling_mean(kUl

24、dxtrd05J. values, 10)A6=tdIdxtrdO3.values-td|IdxtrdO4|. valuesA7=td,IdxtrdO5.values-td,IdxtrdO2,.valuesY=tdIdxtrdO5.values 1 :-td(IdxtrdO5.values(:-1 A3=np.zeros(len(td)for i in rangc(lcn(td):ifi0:A3liJ=(td.loci,Idxtrd05,-td.loci-l,Idxtrd05,)/td.loci-l,Idxtrd05JX=AI:A 1 ;A2:A2,A3:A3:A4,:A4,A5,:A5,A6

25、,:A6;A7,:A7)X=pd.DataFrame(X)X=X.iloc(9:,#对指标AlA7作标准化处理from sklcarn.preprocessing import StandardScalcrscaler = StandardScalcr()scaler. fit(X)X=scaler.transtbrm(X)X=pd.DataFrame(X)Y=Y|8:1YYO=1YY=O=-1Y=Y.reshape(len( Y), 1)Y=pd.DataFrame( Y)x = X.iloc:len(X)-30,:.as_matrix()y = Y.iloc:len(Y)-30,:.as_

26、matrix()x I = X.iloclen(X)-30:,:.as_matrix()y 1 = Y.iloclcn(Y)-30:.as_matrix()#2、支持向量机from skleam import svmelf = svm.SVC(kerneI=rbf)clf.fit(x. y)score=clf.score(x. y); #模型准确率(针对训练数据)R2=clf.predict(x 1)Z=R2-ylZ=Z:,0Rv=len(ZZ=0)/len(Z) #预测准确率print(膜型准确率为:.score)print(预测准确率为:;Rv)结果为:(1) 计算的指标(2)获得模型的准

27、确率和预测准确率模型准确率为:0.961165048544预那么准确率为:0.82)计算A0001任务在5公里范围内的会员个数,记为A0001_Bnum0 (5分)3)计算A0002任务在5公里范围内所有会员信誉值总和,记为A0002_Bavg。(5分) 附注:设定A点(纬度经度不)和B点(纬度。2,经度乙),那么两点之间的距 离可以用以下公式进行计算:其中距离的单位为:公里。得分 评卷人二、分类模型基础应用题(本大题共1小题,每题30分,共30分).今有某银行的贷款审批数据,采集的特征一共有15个,依次为xlxl5,决策变 量为y,取值为1(同意贷款)和0 (不同意贷款),数据共690条记录

28、,具体见文件 银行贷款审批数据.xlsx。建一个Python脚本文件,命名为test2.py,完成以下任务:I)特征数据xlxl5存在缺失数据,其中xlx6为数值变量,x7X15为名义变量。 请对xlx6中存在的缺失值用均值策略填充,x7X15用中位数策略填充。(10分) 2)对xlx6变量数据作均值-方差标准化处理,需要注意的是x7xl5名义变量不需 要作标准化处理。(5分)3)将经过前面两步处理后的数据集,取前600条记录作为训练数据,后90条记录 作为测试数据,利用支持向量机、逻辑回归、神经网络三种不同的模型依次做出预 测,并计算其预测精度。(15分)4)将预测精度通过柱状图表示出来,其

29、中横轴为模型名称(支持向量机、逻辑回归、 神经网络),纵轴为其对应的预测精度。(5分)得分 评卷人 三、主成分、聚类模型基础应用题(本大题共1小题,每题14分,共14分)今有我国各地区普通高等教育开展状况数据,具体见高教数据.xlsx,其中xl为每百 万人口高等院校数:x2为每十万人口高等院校毕业生数;x3为每十万人口高等院校招 生数;x4为每十万人口高等院校在校生数:x5为每十万人口高等院校教职工数:x6为 每十万人口高等院校专职教师数;x7为高级职称占专职教师比例:x8为平均每所高等 院校的在校生数;X9为国家财政预算内普通高教经费占国内生产总值比重;X10为生均 教育经费)。建一个Pyt

30、hon脚本文件,命名为test3.py,完成以下任务:1)对以上指标数据做主成分分析,并提取其主成分,要求累计贡献率到达90%以上。 (7分)2)基于提取的主成分,对以上30个地区做K-均值聚类分析(K=4),并将地区名称和 所属的类别在命令窗口中输出聚类结果。(7分)得分 评卷人 四、关联规那么算法基础应用题(本大题共1小题,每题16分,共16分)假设有以下数据集,每行代表一个顾客在超市的购买记录:H:西红柿、排骨、鸡蛋、毛巾、水果刀12:西红柿、茄子、水果刀、香蕉13:鸡蛋、袜子、毛巾、肥皂、水果刀14:西红柿、排骨、茄子、毛巾、水果刀15:西红柿、排骨、酸奶16:鸡蛋、茄子、酸奶、肥皂、

31、香蕉17:排骨、鸡蛋、茄子、水果刀18: 土豆、鸡蛋、袜子、香蕉、水果刀19:西红柿、排骨、鞋子、土豆、香蕉建一个Pylhon脚本,命名为tcst4.py,完成以卜.任务:I)将以上购买记录转换为布尔类型数据,其数据结构为DataFrame (10分)2)利用Apriori关联规那么挖掘算法函数进行关联规那么挖掘,最小支持度和最小置信度 分别为0.2和0.4,并将挖掘结果导出到Excel表格中(6分)字段依次表示指数代码、交易日期、开盘价、最高价、最低价、收盘价、成交量。得分评卷入五、综合应用案例分析题(本大题共1小题,每题20分,共20分)今有沪深300指数2014年的交易数据,其数据结构表

32、3所示。表3沪深300指数2014年交易数据IndexedIdxtrdOlIdxtrd02Idxtrd03IdxtrdOlIdxtrd05Idxtrd060003002014-01-022323. 432325. 992310. 652321.98451942.90003002014-01-032311.972314. 842280. 892290. 78597826. 50003002014-01-062286. 372286. 372229. 332238.616630010003002014-01-072222. 312246. 792218. 652238437531000300201

33、4-01-082240. 642262. 582228. 422241.91513488.50003002014-01-092236. 972258. 892220. 82222. 22559870. 40003002014-01-102216. 522224.492200. 222204. 85541692.90003002014-01-1322072222. 072183.62193. 68501227.7000300014-01-142192. 842214.122179.912212. 85540499. 5000300 2014-01-152210. 022215.92193.822

34、08. 91489624建一个Python脚本,命名test4.py,完成以下任务:1)请计算如下指标:A1 (收盘价/均价):即收盘价/过去10个交易日的移动平均收盘价A2 (现量/均量):即成交量/过去10个交易H的移动平均成交量A3 (收益率):(当日收盘价-前日收盘价)/前日收盘价A4 (最高价/均价):最高价/过去10个交易日的移动均平均收盘价A5 (最低价/均价):最低价/过去10个交易日的移动平均收盘价A6 (极差):最高价最低价(衡量波动性)A7 (瞬时收益):收盘价-开盘价Y (决策变量):后交易R收盘价-当前交易日收盘价,如果大于0,记为1;如果小 于等于0,记为-lo同时

35、对指标A1A7作标准化处理:(当前值-均值)/标准差,最终得到以下标准的数 据结构形式:ID Al A2 A3 A4 A5 A6 A7 Y123456(10 分)2)取后30条记录作为测试样本,剩下的数据记录为训练样本,利用支持向量机模型 进行训练及测试,获得模型的准确率和预测准确率,分别记为score和Rv,并在命令窗 口中输出score和Rv。(10分)评分标准与参考答案(20182019学年度第一学期)金融数据分析(技能基础)课程(A回/B 口卷)作答说明:1.将程序拷贝到对应题目下面,并将运行结果(局部)截图放在程序后面。课程代码考核形式机试考试班级信本161班考核H期20 19 年

36、1 月 11 H考核时长180分钟命题教师签名教研室主任签名主管学院领导签名题号一二三四五六总分分值20301416201 0 0炳分统人核分人.另建一个文件夹,命名:答题程序,存放每题程序及数据文件,最后压缩。得分评卷人2 .将I和2的文件压缩,命名:学号(完整)+姓名,并提交。一、程序计算综合应用题(本大题共1小题,每题20分,共20分)“拍照赚钱”是移动互联网下的一种自助式服务模式。用户下载APP,注册成为 APP的会员,然后从APP上领取需要拍照的任务(比方上超市去检杳某种商品的上架情 况),赚取APP对任务所标定的酬金。这种基于移动互联网的Fl助式劳务众包平台,为 企业提供各种商业检

37、查和信息,相比传统的市场调查方式可以大大节省调查本钱, 而且有效地保证了调查数据真实性,缩短了调查的周期。因此APP成为该平台运行的 核心,而APP中的任务定价又是其核心要素。如果定价不合理,有的任务就会无人问 津,而导致商品检存的失败。附件一是一个已结束工程的任务数据,包含了每个任务的位置、定价和完成情况 (“1”表示完成,“0”表示未完成):附件二是会员信息数据,包含了会员的位置、信 誉值、参考其信誉给出的任务开始预订时间和预订限额,原那么上会员信誉越高,越优先 开始挑选任务,其配额也就越大(任务分配时实际上是根据预订限额所占比例进行配 发)。附件一和附件二的表结构如表1和表2所示。表1附

38、件一:已结束工程任务数据表2附件二:会员信息数据任务号码任务gps纬度任务gps经度任务标价任务执行情况A000122.56614225113.9808368660A000222.68620526113.940525265. 50A000322.57651183113. 95719865.51A000122.56484081114.2445711750A000522.55888775113.950722765.50A000622. 55899906114.2413174750A000722.54900371113.972259765.51A000822.56277351113.956573565.50会员编号会员位置(GPS)预订任务 限额预订任务开始时间信誉值B000122. 947097 113. 6799831146:30:0067997. 3868B000222. 577792 113. 9665241636:30:0037926. 5416B000323. 192458 113. 3472721396:30:0027953. 0363

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 教育专区 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服