收藏 分销(赏)

基于因子分析的NBA球队实力研究_李越.pdf

上传人:自信****多点 文档编号:328849 上传时间:2023-08-16 格式:PDF 页数:6 大小:2.13MB
下载 相关 举报
基于因子分析的NBA球队实力研究_李越.pdf_第1页
第1页 / 共6页
基于因子分析的NBA球队实力研究_李越.pdf_第2页
第2页 / 共6页
基于因子分析的NBA球队实力研究_李越.pdf_第3页
第3页 / 共6页
亲,该文档总共6页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、2023.7电脑编程技巧与维护1概述对NBA球队进行实力研究既可以为分析比赛提供科学依据,也可以为提高国内篮球联赛水平提供参考。如今,NBA给出了许多细粒度的评价指标1。随着统计数据的精进,对球队实力的评价也更加全面。李林杰和张学东2应用logistic模型分析影响比赛胜负的因素;刘狄3运用因子分析和聚类分析得出得分、篮板、抢断能力因子是决定球队成绩的主要因素的结论;牛兆捷4通过贝叶斯算法分析了得分状态与进攻之间的关系;徐雪娇等5基于层次分析法进行球队实力研究。2理论方法2.1因子分析模型因子分析是多元统计分析中的一种降维方法,研究原始变量相关阵或协方差阵的内部依赖关系,它将多个变量综合为少数

2、因子,再现原始变量与因子之间的关系。目前因子分析在心理学、社会学、经济学等学科的应用都取得成功。假设可观测随机向量x=(x1,x2,xp),不失一般性;E(x)=0,COV(x)=;不可观测随机向量f=(f1,f2,fm),E(f)=0,COV(f)=Im,且mp。=(1,2,p),与f互不相关,E()=0,COV()=diag(12,p2),正交因子模型如公式(1)所示:(1)其中,f为公共因子;为特殊因子或误差;aij为第i个随机变量在第j个公共因子上的载荷。需要注意:一个统计量即因子载荷矩阵A的各列元素的平方和为该公共因子对原始变量的方差贡献,用于衡量该公共因子的重要性。对于载荷矩阵和剩

3、余方差矩阵的参数估计方法有主成分法、主因子解法、极大似然法3种,其中主成分法应用较广泛,即采用主成分法进行参数估计。2.2因子旋转理论因子分析的目的不仅是求出公共因子,还是知道每个公共因子的实际意义。由以上参数估计方法所求出的公因子解,其初始因子载荷矩阵并不满足“简单结构准则”,即各公共因子的典型代表变量不很突出,因而容易使公共因子的实际意义含糊不清,不利于对因子进行解释。为此必须对因子载荷矩阵实行旋转变换,使各因子载荷矩阵的每列元素的平方按列向0或1两极转化,达到其结构简化的目的。已经提出的因子旋转方法很多,在此采用实践中最常用的方差大的正交旋转,其思想是使载荷矩阵的每列元素的平方方差达到最

4、大并作为载荷矩阵结构简化的准则。2.3因子得分有时要求把公共因子表示为变量的线性组合,或反过来对每个样品计算公共因子的估计值,即所谓的因子得分。因子得分可用于模型的诊断,也可作为进一步分析的原始数据。但因子得分的计算并不是通常意义上的参数估计,而是对不可观测的随机向量的估计。因子得分的估计方法主要有加权最小二乘法和Thompson回归法两种。从统计上讲,两种因子得分估计方法各有优劣,没有哪种估计方法一直优于另一种方法。加权最小二 乘 法 是 无 偏 的,Thompson回 归 法 是 有 偏 的,但Thompson回归法有较小的均方误差,在此采用Thomp-son回归法。3实证分析3.1数据准

5、备在对明星球员能力进行衡量时,选取各球队得分最作者简介:李越(1998),男,硕士,研究方向为机器学习的应用。基于因子分析的 NBA 球队实力研究李越(东北大学理学院,沈阳110819)摘要:NBA 各球队之间的实力关系是篮球爱好者谈论较多的话题,人们判断球队强弱主要基于主观判断,缺乏科学依据。因此有必要对 NBA 球队进行实力分析和研究。在比较以往研究所选指标和统计方法的优劣后,提出了基于因子分析,构建成对比较矩阵,以球队基础能力、明星球员能力、主教练执教能力为主要影响因素的模型,对 20222023 赛季西部联盟的 NBA 球队进行了实力分析。关键词:NBA 球队实力;因子分析;成对比较矩

6、阵;2022-2023 赛季21DOI:10.16184/prg.2023.07.0322023.7电脑编程技巧与维护成分总计初始特征值方差百分比(%)累积(%)总计提取载荷平方和方差百分比累积(%)总计旋转载荷平方和方差百分比(%)累积(%)15.70347.52347.523 5.70347.52347.523 3.73431.11531.11521.51912.66160.184 1.51912.66160.184 2.44120.34351.45731.37911.49471.678 1.37911.49471.678 2.10217.52068.97741.26910.57782.2

7、55 1.26910.57782.255 1.59313.27882.25550.6455.37887.63260.5344.44892.08070.5174.31296.39280.2131.77398.16590.1130.93899.102100.0630.52499.627110.0300.24999.876120.0150.124100.000提取方法:主成分分析法表1KMO和巴特利特检验多的球员的相应指标(得分、篮板、助攻、抢断等基础数据与真实命中率、进攻效率、防守效率、效率值、胜利贡献值5个高阶指标);在对球队基础能力进行衡量时,选取各球队的投篮命中率、投篮命中数、投篮出手数等指

8、标;在对主教练执教能力进行衡量时,选取主教练执教场数和执教胜率两项指标。3.2明星球员能力球员的得分、篮板、助攻、抢断、封盖、失误、犯规是最常见的基础数据,但仅用这些基础数据不足以评价一个球员的能力。例如,在20052006赛季最有价值选手(MVP)评选的过程中,场均得分18.8分、4.2篮板、10.5助攻的纳什;场均得分31.4分、7.0篮板、6.6助攻的詹姆斯和场均得分26.6分、9.0篮板、2.8助攻的诺维茨基均有当选理由,仅由这些基础数据难以抉择,这时一些高阶数据就可以发挥作用了,例如,进攻效率,效率值等。选择7个基础数据分别为,得分、篮板、助攻、抢断、封盖、失误、犯规;5个高阶数据分

9、别为效率值、真实命中率、胜利贡献值、进攻效率、防守效率综合评判球员能力。其中,5个高阶数据的定义如下:(1)效率值是根据比赛节奏调整后的球员每分钟的表现,数值越大代表能力越强。(2)真实命中率即真实投篮命中率,结合球员两分球,三分球,罚球的表现,用来综合评价球员的命中率。(3)胜利贡献值用于衡量球员对球队胜利的贡献程度,数值越大代表球员对球队的积极影响越大。(4)进攻效率即每100个进攻回合,球员的得分。(5)防守效率即每100个防守回合,对手的得分。对于西部联盟15支球队中的明星球员(选取各队得分最高的球员为明星球员)进行数据的搜集。对收集到的数据进行因子分析。首先,进行凯泽-迈耶-奥尔金(

10、KMO)和巴特利特检验,结果如表1所示。表1中KMO值为0.556,超过0.5。由KMO的意义可知,数据适合做因子分析;巴特利特检验的显著性几乎为0,小于显著性水平0.05,因此拒绝原假设,即说明所分析的变量之间存在相关关系,如果有相关性,则适合做因子分析。同样观察相关性矩阵,发现变量之间存在相关性,如表2所示。通过表3公因子方差可以看出,每个变量的提取值均在0.641.0,说明因子分析是合适的。根据特征根大于1,确定公因子个数,并用最大方差法对载荷矩阵进行旋转,总方差解释如表4所示。由表4看出初始特征值大于1的公因子有4个,且这4个公因子对变量解释的贡献率达到82.255%。其中,公因子1占

11、比31.115%;公因子2占比20.343%;KMO取样适切性量数0.556巴特利特球形度检验近似卡方121.203自由度66显著性0.000篮板 助攻 抢断 盖帽 失误 犯规 得分真实命中率进攻效率防守效率效率值胜利贡献值篮板1.000 0.397 0.094 0.430 0.318 0.015 0.061 0.579 0.489-0.430 0.612 0.564助攻0.397 1.000 0.338 0.069 0.777 0.137 0.478 0.346 0.617-0.305 0.771 0.629抢断0.094 0.338 1.000 0.674 0.322 0.418 0.26

12、5 0.162 0.234-0.372 0.405 0.416盖帽0.430 0.069 0.674 1.000 0.212 0.378 0.267 0.398 0.188-0.507 0.441 0.470失误0.318 0.777 0.322 0.212 1.000 0.181 0.486 0.218 0.269-0.386 0.488 0.296表2相关性矩阵(部分)初始提取篮板1.0000.773助攻1.0000.894抢断1.0000.800盖帽1.0000.895失误1.0000.851犯规1.0000.740得分1.0000.642真实命中率1.0000.855进攻效率1.000

13、0.855防守效率1.0000.743效率值1.0000.933胜利贡献值1.0000.890提取方法:主成分分析法表3公因子方差表4总方差解释222023.7电脑编程技巧与维护公因子3占比17.520%;公因子4占比13.278%。这4个公因子的整体解释效果超过80%,说明因子对变量的解释能力很好。在碎石图中,一颗石头从上面滚下来,取出让石头滚得快的点,即斜率比较大的点,就是该原始变量的公共因子,从图1中可以直观看出,在4个因子后折线变得平缓,这说明提取出的4个公因子效果不错。接下来需要对这4个公因子进行命名。旋转后的成分矩阵如表5所示,各数值即为因子载荷矩阵中的参数,可以看出对于公因子1,

14、最大的值对应的指标为真实命中率、进攻效率、胜利贡献值、效率值等,因此可以把公因子1命名为个人进攻因子;对于公因子2,最大的值对应的指标为助攻、失误、得分,因此可以把公因子2命名为团队影响因子;对于公因子3,最大的值对应的指标为盖帽、抢断、防守效率,因此可以把公因子3命名为个人防守公因子;对于公因子4,最大的值对应的指标为犯规,因此可以把公因子4命名为犯规因子。最终确定的4个公因子分别为个人进攻、团队影响、个人防守和犯规。通过Thompson回归法得出各队明星球员的公因子得分,对这4个公因子得分进行加权求和,权重由其解释变量的方差比例决定(个人进攻占比0.38、团队影响占比0.25、个人防守占比

15、0.21、犯规占比0.16),结果如表6所示。3.3球队基础能力对球队基础能力的研究类似于对明星球员能力的研究。针对NBA数据库中的球队统计指标,选用一些基础统计指标,如投篮命中率、投篮命中数、投篮出手数、三分命中率、三分命中数、三分出手数、罚球命中率、罚球命中数、罚球出手数等和一个高阶统计指标回合数来进行评判,回合数的计算公式如公式(2)所示:回合数=0.96(投篮+失误+0.44罚球-进攻篮板)(2)对于西部联盟的球队进行数据搜集,首先进行KMO和巴特利特检验,发现KMO未大于0.5。通过表7公因子方差可以看出,多数变量的提取值在0.661.0,这也说明了因子分析是合适的。由表8总方差解释

16、看出初始特征值大于1的公因子有4个,且这4个公因子对变量解释的贡献率达到84.389%。其中,公因子1占比为24.995%;公因子2占比为22.004%;公因子3占比为19.441%;公因子4占比为17.950%。4个公因子的整体解释效果超过80%,图1碎石图1成分1234真实命中率0.900进攻效率0.868胜利贡献值0.818效率值0.7830.481篮板0.699失误0.882助攻0.4000.855得分0.6310.426盖帽0.854防守效率-0.734抢断0.6880.505犯规0.821提取方法:主成分分析法旋转方法:凯撒正态化最大方差法a.旋转在24次迭代后已收敛表5旋转后的成

17、分矩阵球队球员个人进攻团队影响个人防守犯规综合得分掘金约基奇2.3280.3840.614-0.4141.043表6明星球员能力得分(部分)初始提取投篮命中率1.0000.970投篮命中数1.0000.888投篮出手数1.0000.883三分命中率1.0000.874三分命中数1.0000.914三分出手数1.0000.810罚球命中率1.0000.518罚球命中数1.0000.969罚球出手数1.0000.952篮板1.0000.839进攻篮板1.0000.887防守篮板1.0000.758助攻1.0000.888回合数1.0000.665提取方法:主成分分析法表7公因子方差12345678

18、9101112碎石图特征值组件号6543210232023.7电脑编程技巧与维护1234567891011121314碎石图特征值组件号543210球队主教练执教经验执教胜率经验得分胜率得分综合得分掘金麦克马龙7430.55358261灰熊泰勒詹金斯3090.58158754国王布朗6450.61309164太阳威廉姆斯7030.52337858快船卢4470.58218757成分1234防守篮板0.828篮板0.793投篮命中数0.765回合数0.753投篮出手数0.712-0.471罚球命中数-0.982罚球出手数-0.959助攻0.4290.6900.458投篮命中率0.976进攻篮板0

19、.466-0.686三分命中率0.6470.502提取方法:主成分分析法旋转方法:凯撒正态化最大方差法a.旋转在15次迭代后已收敛三分命中数0.882罚球命中率0.639三分出手数0.880说明因子对变量的解释能力很好。同样在图2中,可以发现,在4个因子后折线变得平缓,这也说明了提取出的4个公因子效果不错。接下来需要对4个公因子进行命名,观察表9旋转后的成分矩阵可知,对于公因子1,典型变量为防守篮板、篮板、投篮命中数、投篮出手数、回合数,而篮板越多、投篮越多、回合数越多,意味着攻防节奏越快,因此可将其命名为攻防节奏因子;对于公因子2,典型变量为罚球命中数和罚球出手数,因此可将该因子命名为罚球因

20、子;对于公因子3,典型变量为投篮命中率、三分命中率,因此可将其命名为进攻效率因子;对于公因子4,典型变量为三分命中数、三分出手数,因此可将其命名为三分能力因子。通过Thompson回归法分析可得出各球队的4个公因子得分,对这4个公因子得分进行加权平均,权重由其解释变量的方差比例决定,攻防节奏因子占比0.30、罚球因子占比0.26、进攻效率因子占比0.23、三分能力占比0.21。球队基础能力得分如表10所示。3.4主教练执教能力对于主教练执教能力的判断,只考虑了两个指标即执教场数和执教胜率,因为指标较少,所以没有必要进行因子分析降维。采用如下方法进行评判,统计15位主教练的执教场数和执教胜率,拟

21、定在每一项指标中值最大的为100分,以此算出其他的得分;再对两项得分按执教经验占0.45,执教胜率占0.55的比例进行加权平均。计算后主教练执教能力得分(部分)如表11所示。表8总方差解释图2碎石图2表9旋转后的成分矩阵球队攻防节奏罚球进攻效率三分能力综合得分掘金-0.421.101.96-1.360.32灰熊1.100.42-0.07-0.900.24国王0.52-0.651.120.780.41表10球队基础能力得分(部分)表11主教练执教能力得分(部分)成分总计初始特征值方差百分比(%)累积(%)总计提取载荷平方和方差百分比(%)累积(%)总计旋转载荷平方和方差百分比(%)累积(%)14

22、.59632.83032.8304.596 32.830 32.8303.499 24.995 24.99523.72226.58459.4143.722 26.584 59.4143.081 22.004 46.99831.83213.08372.4971.832 13.083 72.4972.722 19.441 66.43941.66511.89284.3891.665 11.892 84.3892.513 17.950 84.38950.9386.70291.09160.7655.46796.55870.2431.73898.29680.1581.12899.42490.0560.40

23、399.827100.0170.12199.948110.0060.04599.993120.0010.00599.998130.0000.002100.000141.781E-50.000100.000提取方法:主成分分析法242023.7电脑编程技巧与维护3.5NBA 球队实力排名通过以上分析,得出了明星球员能力得分,球队基础能力得分和主教练执教能力得分,通过这些因素判断NBA球队实力时面临两个问题,一个问题是这3个影响因素对目标影响的大小不同;另一个问题是这3个影响因素数量级的不同。(1)为了解决数量级的不同,参考在主教练能力研究中的方法,将明星球员能力得分和球队基础能力得分均化为百分制

24、,结果如表12所示。(2)解决各因素对NBA球队实力影响的大小问题,这里参考层次分析法的思想来确定各影响因素的权重。结合NBA专家判断,使用成对比较法和19比较尺度构造的成对比较矩阵如下(从上到下、从左至右依次为明星球员、球队基础和主教练能力)。在此采用和法确定各因素权重,所求得的权重向量为(0.32,0.56,0.12),最大特征根为3.03,利用一致性比率CR做检验,检验结果如公式(3)所示:(3)由公式(3)可知通过了一致性检验,故明星球员能力占比0.32,球队基础能力占比0.56,主教练执教能力占比0.12,由此得出15支NBA球队的排名如表13所示。(3)实际上球队之间的实力差距是不

25、能通过数值上的差距来体现的,因此不能通过综合得分来判断各球队之间实力差距的大小,仅用作排名上的参考。除勇士、雷霆外,其余13支球队的排名基本符合实际情况,分别位于排名榜的前列、季后赛附加赛区左右和后列,略有误差(因常规赛的战绩并不能真实反映球队实力,故排名与实际大致相同,且误差可解释)。而勇士作为卫冕冠军,相比于常规赛排名第六,位于排名前部更为可信。15支球队的实力排名与现实排名和预期基本符合,只有雷霆队误差较大。4结语在前人研究的基础上,取他人之长,结合自己的观点,提出了基于因子分析法和层次分析法的思想,对20222023赛季西部联盟的NBA球队实力建立模型。在模型中,将影响球队实力的因素分

26、为明星球员能力、球队基础能力和主教练执教能力,各因素对实力影响的大小由成对比较矩阵确定。对于明星球员能力,搜集20222023赛季西部联盟15支球队的当家球星的得分、篮板等基础数据与高阶数据,采用因子分析法,得出个人进攻、个人防守、团队影响、犯规4个公因子,计算出因子得分;对于球队基础能力,搜集投篮命中率、投篮命中数等数据,仍采用因子分析法,得出攻防节奏、罚球、进攻效率、三分能力4个公因子,计算出公因子得分;对于主教练执教能力,搜集执教经验、执教胜率2项数据,计算出得分。综合3个影响因素的得分和成对比较矩阵确定的权重,计算出NBA球队实力的综合得分并排名,结果与预期和实际较为符合。因此,采用因

27、子分析法和层次分析法的思想研究20222023赛季NBA球队实力是很有效的,从结果中可以发现,对球队实力影响最大的因素是球队基础能力,其次是明星球员个人能力,最后是主教练执教能力。这启发其他的球队要着重培养球队的基础水平,提升整体配合能力;加快进攻节奏、提升球队三分能力,提高罚球准度;同时着重培养球员的个人能力与主教练的执教能力。参考文献1杨振兴,杨军,白洁,等.基于大数据技术对美国职业篮球联赛的研究J.中国体育科技,2016(52):96-104.球队明星球员能力得分球队基础能力得分主教练执教能力得分掘金1002661灰熊-111954国王-103464表12各影响因素得分(部分)球队综合得

28、分排名勇士701掘金542国王233雷霆224灰熊145爵士96森林狼87湖人78太阳69独行侠-110鹈鹕-211快船-912开拓者-1613马刺-1814火箭-7215表13NBA球队实力排名(下转第44页)252023.7电脑编程技巧与维护2李林杰,张学东.影响NBA常规赛胜负的Logistic分析J.统计教育,2008(4):40-41.3刘狄.NBA联赛各球队实力评价研究J.当代体育科技,2017(7):206-207.4牛兆捷.基于贝叶斯网络的NBA比分预测和球员能力评估模型D.武汉:华中科技大学,2012.5徐雪娇,赵慧,张华丽,等.基于AHP预测体育赛事-以NBA为例J.内江科

29、技,2018(1):37-39.素浓度的更新方法、路径的寻觅方法及最优解的存储尚未做出严格而有效的理论论证。综合上述,基于蚁群算法的排课问题仍需进行更深一步的研究。7结语排课问题一直以来是高校教务的重点、难点,如何快速、高效地排出满足全校师生的课程表受到相关人员的广泛关注。在此简单介绍蚁群算法的基本思想及如何构造二分结构图模型,利用二分图模型的原理将棘手的高校排课问题转换成基于蚁群算法的二分图最大匹配的问题并进行解决。实验结果表明,基于蚁群算法的自动排课方式是可行的,在一定程度上提高了排课效率,对高校教务排课工作具有重要的意义。参考文献1苏贞,陈海关.高校智能排课系统中蚁群算法的应用探讨J.兰

30、州教育学院学报,2013,29(7):120-121.2蒋正锋,覃韩,吕佩佩,等.基于蚁群算法的高校排 课 问 题 的 应 用 研 究J.现 代 计 算 机,2019(25):22-27.3苏明杰,陈建勋.基于线性规划模型的高校排课系统J.微计算机信息,2011,27(8):197-200.4冯月华.改进的蚁群算法在排课系统及约束条件问题中的应用研究J.泰山学院学报,2017,39(6):80-85.5王文君.基于改进蚁群算法的机房排课问题及仿真研 究J.长 春 工 程 学 院 学 报(自 然 科 学 版),2020,21(4):109-112.6孙弋,胡粔珲.基于遗传-蚁群混合算法的排课系统

31、J.计算机系统应用,2019,28(2):81-86.单击界面右下角的“Finish”按钮,类文件创建完成。可 以 看 出,Eclipse自 动 创 建 了 一 个 名 为“E-clipseTest”的源代码文件,在该文件中输入如下代码。public class EclipseTest public static void main(String args)/TODO Auto-generated method stubSystem.out.println(Hello,hadoop);3.3程序的编译运行现在可以编译运行上面编写的代码。可以右击左侧项目节点,在打开的快捷菜单中选择“Run As

32、”选项,继续在打开的菜单中选择“Java Application”选项,可以看到底部的“Console”面板中显示运行结果,如图10所示。4结语Java技术具有卓越的通用性、高效性、平台移植性和安全性,广泛应用于计算机、数据中心、游戏控制台、科学超级计算机、移动电话和互联网,同时拥有全球最大的开发者专业社群4。在此讨论了Linux操作系统中Eclipse和JDK的安装和配置,介绍Eclipse中Java项目的创建和编译运行。目前仅介绍Eclipse最基本的使用方法,后期将介绍Eclipse的一些使用技巧,例如,如何打开一个已建立的工程、怎么设置字体大小和自动提示等。参考文献1冯依嘉,王雷.在Windows上使用虚拟机安装Lin-ux操作系统J.电脑编程技巧与维护,2023(4):60-63.2林子雨.大数据基础编程、实验和案例教程M.北京:清华大学出版社,2017.3CSDN.ubuntu安装eclipse教程EB/OL.4王海,于佳.Java开发工具分析与研究(一)J.吉林化工学院学报,2016,33(3):67-70.图10运行结果(上接第34页)(上接第25页)44

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 自然科学论文

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服