收藏 分销(赏)

基于主成分分析的同时期男明星人气评价.docx

上传人:s4****5z 文档编号:8795552 上传时间:2025-03-02 格式:DOCX 页数:13 大小:69.56KB
下载 相关 举报
基于主成分分析的同时期男明星人气评价.docx_第1页
第1页 / 共13页
基于主成分分析的同时期男明星人气评价.docx_第2页
第2页 / 共13页
点击查看更多>>
资源描述
基于主成分分析的同时期男明星人气评价 摘要 随着经济的发展,娱乐文化产业也进入了一个黄金时代。“小鲜肉”和优质的男星层出不穷,人气的比拼在所难免。有了人气,就以意味着后续优质的资源以及更加长远的星路。作为粉丝,自然是希望自己的偶像拥有最高的人气,登上人气冠军榜的宝座。那么偶像的人气究竟是由什么因素决定的呢?下面我们就应用spss统计软件,应用主成分分析的方法构建数学模型,用统计的思想来仔细分析明星人气的主要决定因素。 关键词:主成分 人气 票数 spss分析 Analysis of those contemporary male stars’ popularity based on principal component analysis Applied Mathmatics 13-1 Hou Yilin Supervisor Leiting Abstract With the development of economy, the entertainment culture industry has entered a golden age. "Fresh meat" and excellent actor emerge in endlessly, as a result the competition among their popularity is inevitable. Popularity means following high-quality resources and more long-term star road. As a fan, they certainly hope their idols have boarded the popularity of the championship. So what is the decisive factors of the popularity? Then we will use SPSS statistical software as well as the application of principal component analysis method to build mathematical model, using statistical ideas to carefully analyze the star is a major determinant of sentiment. Keywords: principal component analysis, popularity, poll, spss 目录 前言 4 一、研究背景 4 二、研究方法 4 三、数据来源 4 数据分析 5 四、数据分析 5 4.1相关系数矩阵 5 4.2数据的KMO和Bartlett球形检验 6 4.3公因子方差值 7 4.4因子的特征根和贡献率以及主成分的构成 7 4.5综合评价 11 结果分析 12 参考文献 13 前言 一、研究背景 从去年开始,偶像经济日益蓬勃,四面八方涌出一批优质的青年偶像。这其中包括歌手,演员,综艺明星等等,偶像经济悄无声息的来临。作为偶像,人气是他们进行后续竞争的基础和未来转型持续发展的跳板,而作为粉丝,无不希望自己能给偶像最高的人气。各种投票粉丝都打起鸡血,希望拿出最漂亮的数据。大数据时代,最有说服力的无疑是各项都飘红的数据,有了数据才有一切。那么现在的当红小生中,数据情况又是怎样的呢?是哪方面的数据影响了他们的人气?现在我们就用主成分分析的方法来仔细剖析小生们的数据构成。 二、研究方法 应用主成分分析的方法,将多维度的数据降低至两三个较为综合的变量进行进一步的综合分析和评估。对多变量的平面数据进行最佳综合和简化,即在保证数据信息丢失最少的原则下,对高维变量空间进行降维处理。显然,在一个低维空间解释系统,要比在一个高维系统空间容易得多。因此在这里,我们用spss软件进行降维,得到新变量。 三、数据来源 由于小生们具有较多数据,这里我们选取了主要的门户网站5月份的一些投票数据,分别是搜狗人气榜票数、360人气榜票数、UC明星热搜榜票数、百度贴吧签到数、网易巨星势力榜票数、百度百科送花数和明星权力榜人气票数。同时我们在同时期的小生中横向比较,选出了涉及中外、各个年龄段以及不同行业的男星进行分析,分别是演员杨洋、李易峰、井柏然、陈伟霆以及歌手吴亦凡、鹿晗、张艺兴、黄子韬和王俊凯。 数据分析 四、数据分析 4.1相关系数矩阵 首先我们得到了几个变量之间的相关系数矩阵。从矩阵中可以看出,一些变量之间的相关性较高。比如UC明星热搜榜和搜狗人气榜票数之间相关性达到了92.3%,而百度百科送花数和360人气榜票数之间相关性更是高达99.9%。这说明这些变量之间存在相互代替的关系,再用这些指标进行评价的话会造成信息的重复,从而影响结果的客观性。 表4-1 相关矩阵 搜狗人气榜票数 360人气榜票数 UC明星热搜榜票数 百度贴吧签到数 相关 搜狗人气榜票数 1.000 .646 .923 .096 360人气榜票数 .646 1.000 .860 .279 UC明星热搜榜票数 .923 .860 1.000 .250 百度贴吧签到数 .096 .279 .250 1.000 网易巨星势力榜票数 .131 -.139 .150 .224 百度百科送花数 .626 .999 .845 .313 明星权力榜人气票数 .821 .823 .865 .078 Sig.(单侧) 搜狗人气榜票数 .042 .001 .411 360人气榜票数 .042 .003 .252 UC明星热搜榜票数 .001 .003 .275 百度贴吧签到数 .411 .252 .275 网易巨星势力榜票数 .379 .371 .361 .297 百度百科送花数 .048 .000 .004 .225 明星权力榜人气票数 .006 .006 .003 .427 相关矩阵 网易巨星势力榜票数 百度百科送花数 明星权力榜人气票数 相关 搜狗人气榜票数 .131 .626 .821 360人气榜票数 -.139 .999 .823 UC明星热搜榜票数 .150 .845 .865 百度贴吧签到数 .224 .313 .078 网易巨星势力榜票数 1.000 -.160 -.262 百度百科送花数 -.160 1.000 .813 明星权力榜人气票数 -.262 .813 1.000 Sig.(单侧) 搜狗人气榜票数 .379 .048 .006 360人气榜票数 .371 .000 .006 UC明星热搜榜票数 .361 .004 .003 百度贴吧签到数 .297 .225 .427 网易巨星势力榜票数 .352 .266 百度百科送花数 .352 .007 明星权力榜人气票数 .266 .007 4.2数据的KMO和Bartlett球形检验 从表4-2中我们可以看出,关于Bartlett球形检验的选项中,sigma值远小于0.05,数据呈球形分布,因此适合进行主成分分析。 表4-2 KMO 和 Bartlett 的检验 取样足够度的 Kaiser-Meyer-Olkin 度量。 .277 Bartlett 的球形度检验 近似卡方 80.138 df 21 Sig. .000 4.3公因子方差值 由表4-3可知公因子方差的提取值大于0.5,故信息是可靠的。 表4-3 公因子方差 初始 提取 搜狗人气榜票数 1.000 .737 360人气榜票数 1.000 .891 UC明星热搜榜票数 1.000 .960 百度贴吧签到数 1.000 .476 网易巨星势力榜票数 1.000 .795 百度百科送花数 1.000 .878 明星权力榜人气票数 1.000 .919 提取方法:主成份分析。 4.4因子的特征根和贡献率以及主成分的构成 由碎石图可知,在第三个成份处,成份的特征值已经小于1。而根据表格,成份1的特征根为4.359,成份2 的特征根为1.298,均大于1 。结合数据和碎石图,我们提取相应的两个公因子。前两个成份的累积因子贡献率已经大于80%,所以提取两个主成分进行评价。 计算可得第一主成分f1的贡献率为0.770,第二主成分f2的贡献率为0.229。写出综合评价方程如下: F=0.770*f1+0.229*f2 表4-4 解释的总方差 成份 初始特征值 提取平方和载入 合计 方差的 % 累积 % 合计 方差的 % 累积 % 1 4.359 62.266 62.266 4.359 62.266 62.266 2 1.298 18.549 80.815 1.298 18.549 80.815 3 .917 13.099 93.914 4 .351 5.015 98.929 5 .069 .991 99.921 6 .006 .079 100.000 7 1.185E-6 1.693E-5 100.000 提取方法:主成份分析。 由成份图可以看出,百度贴吧签到数和网易巨星势力榜票数更能由主成分2体现,而搜狗人气榜票数、360人气榜票数、UC明星热搜榜票数、明星权力榜人气票数、百度百科送花数则拥有较多的第一主成分。 以下是两个主成分的的成份矩阵。从表4-5中可知,我们已经提取了两个主成分。 表4-5 成份矩阵a 成份 1 2 搜狗人气榜票数 .853 .101 360人气榜票数 .942 -.070 UC明星热搜榜票数 .967 .161 百度贴吧签到数 .279 .631 网易巨星势力榜票数 -.061 .889 百度百科送花数 .935 -.069 明星权力榜人气票数 .925 -.252 提取方法 :主成分分析法。 通过上面的特征根计算各个主成分前的系数如表4-6所示。从表中我们得知,第一主成分在第1、2、3、6、7个指标(分别为搜狗人气榜票数、360人气榜票数、UC明星热搜榜票数、明星权力榜人气票数、百度百科送花数)上有较大载荷,而第二主成分在第4、5个指标上有较大载荷。这说明可将百度贴吧签到数和网易巨星势力榜票数归为一类,剩余的票数归为一类。这两个因子即为主成分。第一个因子表示活跃在明星个人论坛并坚持签到的粉丝的数量,而第二个因子表示对于一些重要投票粉丝所投票数。显然,第二主成分对更能体现明星的人气,因为粉丝可以关注多家论坛,但投票只能选取自己最喜爱的明星。下面我们来具体分析一下这两个主成分。由表中系数,主成分可以表示为: F1=0.196χ1+0.216χ2+0.222χ3+0.064χ4-0.014χ5+0.214χ6+0.212χ7 F2=0.078χ1-0.054χ2+0.124χ3+0.486χ4+0.685χ5-0.053χ6-0.194χ7 表4-6 成份得分系数矩阵 成份 1 2 搜狗人气榜票数 .196 .078 360人气榜票数 .216 -.054 UC明星热搜榜票数 .222 .124 百度贴吧签到数 .064 .486 网易巨星势力榜票数 -.014 .685 百度百科送花数 .214 -.053 明星权力榜人气票数 .212 -.194 提取方法 :主成分分析法。 4.5综合评价 利用不同因子对两个主成分的贡献率,构建主成分分析的综合评价模型: F=0.770*f1+0.229*f2 把两个主成分带入上式,可得不同明星的人气综合评价值及结果如下: 表4-7 得分情况 排名 姓名 得分 第一主成分 第二主成分 1 鹿晗 4217854.5 333720.38 1815726.2 2 张艺兴 1800780.2 142175.71 635604.6 3 王俊凯 1743985.1 43950.732 783238.09 4 杨洋 672765.98 -129089.6 18852636 5 李易峰 255028.75 -45909.21 8018036.4 6 吴亦凡 213203.59 43186.29 379446.8 7 黄子韬 120146.76 21216.694 3148.372 8 陈伟霆 55356.915 40257.39 106369.98 9 井柏然 17057.832 1976097 971137.22 结果分析 分析前,我们选取了不同年龄不同发展方向的九位男明星。其中鹿晗、黄子韬、吴亦凡、张艺兴以歌手身份出道,曾经同为韩国大热组合exo的成员,而前三者陆续从韩国的经纪公司解约并回国发展。似乎在中国能让他们更有星途,然而在韩国的成员张艺兴的人气仍然位居前列。张艺兴最近发布了个人单曲《独角戏》,同时参加了东方卫视的人气综艺极限挑战,他在极限挑战中的呆萌表现为他吸引了不少粉丝。这四位中人气最高的是已解约的鹿晗,他凭借精致的外貌和流畅的演技在国内市场稳居人气第一的宝座。鹿晗近几年曾出演了多部电影,其中饱受好评的是和杨幂搭档的《我是证人》以及和杨子姗搭档的《重返20岁》。鹿晗在韩国时就已和有人气,回国之后凭借综艺“奔跑吧兄弟”长期霸屏,更加大放异彩。吴亦凡作为前团的队长,拥有高挑的身材和二次元的外貌,但于人气方面稍稍逊色。不过相信他在接下来的国际大片中的精彩表现一定可以为他加分。黄子韬是这四人中人气最低的,一回国便负面新闻缠身,“耍大牌”、“爆粗口”等黑色新闻层出不穷。回国后的一年对他来说无疑是艰难的,但好在一切都过去了。上个月他在南京开了自己的第一场个人演唱会,而后续资源也预示着他可以越走越远。 这四位年龄都在二十四五,而排名第三的王俊凯今年却只有16岁。少年出道的他拥有着先天的优势:青春。这也是他小小年纪却不输人气的原因。喜欢年轻的偶像有一种“养成感”,看着自己的爱豆慢慢长大,光芒万丈,因此变得更加痴迷狂热。王俊凯作为组合TF-Boys中的队长以及大哥,唱功和舞蹈都非常优秀。最近出演了《诛仙·青云志》中的少年林惊羽,不管从哪个方面来看,王俊凯都是一支后起的新秀。 杨洋、李易峰、陈伟霆和井柏然作为青年演员的代表,人气也是不相上下。李易峰的代表作是14年播出的电视剧《古剑奇谭》,正是这部剧让他和饰演大师兄的陈伟霆受到关注。李易峰早年其实是作为歌手出道,“加油好男儿”让人们第一次认识他,却没能记住他。同样是这个选秀节目出身的井柏然也在多年之后才崭露头角。而《古剑》的大火,让人们记住了“苏苏”这个角色。如今的李易峰拥有数个代言,并且出演了即将上映的《麻雀》和《诛仙·青云志》,正是当红时。而陈伟霆作为香港歌手,如今也来内地发展。他是这几人中年龄最大的,却也是可塑性最强的。井柏然在他们之中人气垫底,所以仍需努力。杨洋出现在人们视野中是网剧《盗墓笔记》播出的时候,出演张起灵的他以清冷的外表和冷冽的眼神秒杀了一众小姑娘。其实早在15年3月份,杨洋就凭借综艺“花儿与少年”让更多人认识了这个阳光开朗的大男孩。很多人不知道的是,他就是电视剧《新红楼梦》中的成年宝玉。17岁便开始演戏,沉寂七年,他终于得以绽放。最近杨洋拍摄了电影《三生三世十里桃花》以及《从你的全世界路过》,期待演员杨洋的后续发展。 参考文献 [1] 中国知网 基于数据挖掘的微博人气用户特征分析与研究 王静, 黄地龙; [2] 利用spss进行主成分分析 13
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传
相似文档                                   自信AI助手自信AI助手

当前位置:首页 > 学术论文 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服