如何使用矩阵数据分析法.doc

资源描述

如何使用矩阵数据分析法（完整版）实用资料 (可以直接使用，可编辑完整版实用资料，欢迎下载）如何使用矩阵数据分析法　　下面通过例子来介绍如何进行矩阵数据分析法。　　1、确定需要分析的各个方面。我们通过亲和图得到以下几个方面，需要确定它们相对的重要程度：易于控制、易于使用、网络性能、和其他软件可以兼容、便于维护。　　2、组成数据矩阵。用Excel或者手工做。把这些因素分别输入表格的行和列，如表所示。　　3、确定对比分数。自己和自己对比的地方都打0分。以 “行”为基础，逐个和“列”对比，确定分数。“行”比“列”重要，给正分。分数范围从9到1分。打1分表示两个重要性相当。譬如，第2行“易于控制”分别和C列“易于使用”比较，重要一些，打4分。和D列“网络性能”比较，相当，打1分。…………如果“行”没有“列””重要，给反过来重要分数的倒数。譬如，第3行的“易于使用”和B列的“易于控制”前面已经对比过了。前面是4分，现在取倒数，1/4=0.25。有D列“网络性能”比，没有“网络性能”重要，反过来，“网络性能”比“易于使用”重要，打5分。现在取倒数，就是0.20。实际上，做的时候可以围绕以0组成的对角线对称填写对比的结果就可以了。　　表1：矩阵数据分析法 A B C D E F G H 1 易控制易使用网络性能软件兼容便于维护总分权重% 2 易于控制 0 4 1 3 1 9 26.2 3 易于使用 0.25 0 0.20 0.33 0.25 1.03 3.0 4 网络性能 1 5 0 3 3 12 34.9 5 软件兼容 0.33 3 0.33 0 0.33 4 11.6 6 便于维护 1 4 0.33 3 0 8.33 24.2 总分之和 34.37 　　4、加总分。按照“行”把分数加起来。在G列内得到各行的“总分”。　　5、算权重分。把各行的“总分”加起来，得到“总分之和”。再把每行“总分”除以“总分之和”得到H列每个“行”的权重分数。权重分数愈大，说明这个方面最重要，“网络性能”34.9分。其次是“易于控制”26.2分。摘要: 本文简述了数据挖掘技术的基本概念、产生和发展的基础以及在现实生活中所发挥的巨大作用。同时还就数据挖掘技术在全国广播监测网的应用做了初步的探索和尝试。关键词: 数据挖掘广播电视监测决策支持 0 引言随着广播电视监测网建设规模的不断扩大和运行时间的不断增加,广播电视监测网数据库积累的各种监测数据也越来越多。激增的数据背后隐藏着许多重要的知识和信息,而目前的数据库系统可以高效地实现数据的录入、查询、统计等功能,但无法发现数据中存在的关系和规则,无法根据现有的数据预测未来的发展趋势。如何运用数据挖掘这一新兴技术从大量的监测数据中发现有意义和有价值的知识,并根据这些知识来指导我们日常的监测工作和维护工作,使我们的工作更有效率,成为广播电视监测领域里一个值得探索和研究的课题。 1 数据挖掘技术简介 1.1 数据挖掘技术的基本概念数据挖掘(Data Mining就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。这个定义包括好几层含义:数据源必须是真实的、大量的、含噪声的;发现的是用户感兴趣的知识;发现的知识要能够易于被用户理解,最好能用自然语言表达;并不要求发现放应用探索 ◎ 杨京国家广电总局监测数据处理中心之四海皆准的知识,换句话说发现的知识都是相对的,是有特定前提和约束条件,面向特定领域的。下面再简单解释一下知识的基本概念。从广义上理解,数据、信息也是知识的表现形式,但是人们更把概念、规则、模式、规律和约束等看作知识。人们把数据看作是形成知识的源泉。而原始数据可以是结构化的,如关系数据库中的数据;也可以是半结构化的,如文本、图形和图像数据;甚至是分布在网络上的异构型数据。发现知识的方法可以是数学的,也可以是非数学的;可以是演绎的,也可以是归纳的。发现的知识可以被用于决策支持和过程控制等。因此,数据挖掘是一门交叉学科,它把人们对数据的应用从低层次的简单查询,提升到从数据中挖掘知识,提供决策支持。数据挖掘所发现的知识最常见的有以下四类: 1. 广义知识(Generalization:广义知识指类别特征的概括性描述知识。根据数据的微观特性发现其表征的、带有普遍性的、较高层次概念的、中观和宏观的知识,反映同类事物共同性质,是对数据的概括、精炼和抽象。关联知识(Association:它反映一个事件和其他事件之间依赖或关联的知识。如果两项或多项属性之间存在关联,那么其中一项的属性值就可以依据其他属性值进行预测。 2. 分类知识(Classification &Clustering:它反映同类事物共同性质的特征型知识和不同事物之间的差异型特征知识。最为典型的分类方法是基于决策树的分类方法。 3. 预测型知识(Prediction:根据时间序列型数据,由历史的和当前的数据去推测未来的数据,也可以认为是以时间为关键属性的关联知识。时间序列预测方法有经典的统计方法、神经网络和机器学习等。 4. 偏差型知识(Deviation:此外,数据挖掘还可以发现其他类型的知识,如偏差型知识,它是对差异和极端特例的描述,揭示事物偏离常规的异常现象,如标准类外的特例,数据聚类外的离群值等。 1.2 数据挖掘技术的基础数据挖掘技术的三大基础技术包括计算机硬件技术、大规模数据库技术和数据挖掘算法。在过去数十年里,计算机硬件技术得到了迅猛的发展,包括单个CPU的处理能力大幅提升、内存和磁盘存储器价格的显著降低、支持多个CPU的并行处理结构的巨大进步等。大型关系型数据库及数据库管理系统在各行各业的广泛应用、最近10年来数据挖掘算法的不断发展、成熟和稳定。数据挖掘是利用了人工智能和统计分析这两种技术致力于模式发现和预测。数据挖掘不是为了替代传统的统计分析技术。相反,它是统计分析技术的延伸和扩展。大多数的统计分析技术都基于完善的数学理论和高超的技巧,预测的准确度还是令人满意的,但对使用者的要求很高。而随着计算机计算能力的不断增强,我们有可能利用计算机强大的计算能力只通过相对简单和固定的方法完成同样的功能。一些新兴的技术同样在知识发现领域取得了很好的效果,如神经元网络和决策树,在足够多的数据和计算能力下,它们几乎不用人的关照自动就能完成许多有价值的功能。数据挖掘就是利用了统计和人工智能技术的应用程序,它把这些高深复杂的技术封装起来,使人们不用自己掌握这些技术也能完成同样的功能,并且更专注于自己所要解决的问题。 1.3数据挖掘和数据仓库之间的关系数据挖掘与数据仓库的发展有着密切的关系。数据仓库的发展是促进数据挖掘越来越热的原因之一。但是,数据仓库并不是数据挖掘的先决条件,因为有很多数据挖掘可直接从操作数据源中挖掘信息。大部分情况下,数据挖掘都要先把数据从数据仓库中拿到数据挖掘库或数据集市中。从数据仓库中直接得到进行数据挖掘的数据有许多好处。数据仓库的数据清理和数据挖掘的数据清理差不多,如果数据在导入数据仓库时已经清理过,那很可能在做数据挖掘时就没必要再清理一次了,而且所有的数据不一致的问题都已经被你解决了(图1。数据挖掘库可能是你的数据仓库的一个逻辑上的子集,而不一定非得是物理上单独的数据库。但如果你的数据仓库的计算资源已经很紧张,那你最好还是建立一个单独的数据挖掘库。当然为了数据挖掘你也不必非得建立一个数据仓库,数据仓库不是必需的。建立一个巨大的数据仓库,把各个不同源的数据统一在一起,解决所有的数据冲突问题,然后把所有的数据导到一个数据仓库内,是一项巨大的工程,可能要用几年的时间花上百万的钱才能完成。只是为了数据挖掘,你可以把一个或几个事务数据库导到一个只读的数据库中,就把它当作数据集市,然后在他上面进行数据挖掘(图2。 1.4 数据挖掘和传统数据分析的区别数据挖掘与传统的数据分析如查询、报表、联机分析处理(OLAP是完全不同的工具,基于的技术也完全不同。传统的查询和报表工具是告诉你数据库中都有什么,OLAP工具则更进一步告诉你下一步会怎么样(Whatnext、和如果我采取这样的措施又会怎么样(Whatif。用户首先建立一个假设,然后用OLAP工具检索数据库来验证这个假设是否正确。联机分析处理的过程是先建立一系列的假设,然后通过OLAP 工具来证实或推翻这些假设来最终得到自己的结论。联机分析处理过程在本质上是一个演绎推理的过程。而数据挖掘和联机分析处理的本质区别在于不是用于验证某个假定模式(模型的正确性,而是在数据库中自己寻找模型。数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识。数据挖掘所得到的信息应具有先前未知的特征。所谓先前未知的信息是指该信息是预先未曾预料到的,既数据挖掘是要发现那些不能靠直觉发现的信息或知识,甚至是违背直觉的信息或知识,挖掘出的信息越是出乎意料,就可能越有价值。数据挖掘在本质上是一个归纳的过程。数据挖掘和联机分析处理具有一定的互补性。在利用数据挖掘出来的结论采取行动之前,你也许要验证一下如果采取这样的行动会给公司带来什么样的影响,那么联机分析处理工具能回答你的这些问题。 2 数据挖掘技术在监测数据分析中的应用探索全国广播监测网数据处理中心数据库里保存着大量的数据,其中包括各种基础资源的数据如各类发射台和发射机的基本信息、各种发射台运行图的数据、监测台的基本信息、监测站点的基本信息等;各种监测数据如指标收测数据、频谱收测数据、由监测站点上报的各种指标报警数据(设备报警数据等。随着全国广播监测网规模的不断扩大、运行时间的不断增加,数据库里保存的各种历史数据也随之不断增多。对这些数据除了可以进行各种浏览和查询操作,进行各种统计分析、生成各种统计报表和图表以外,我们还可以利用功能强大的数据挖掘工具,发现隐藏在这些数据背后一些有意义和有价值的知识、规律和模型,然后用这些知识来指导我们的日常监测和维护工作,使我们的工作更有针对性、效率更高。下面就数据挖掘在全国广播监测网中的应用做一些初步的探索和尝试。 2.1数据挖掘案例1 在全国广播监测网里,各监测台每天都以日报的形式将它所监测的中波台的指标异态数据上报到数据处理中心的数据库里。指标异态包括以下3种:停播、功率异态和调幅度异态,其中停播是最严重的异态。异态数据主要包括以下字段:异态发生日期、发生异态的中波台名称、异态现象、异态起止时间和异态原因等。根据数据挖掘技术里的时间序列预测方法,我们可以根据历史和当前的停播异态数据去推测未来的停播异态数据。具体地说,我们可以根据最近一段时间(如1个月或3个月里所有中波台发生停播的情况预测出在未来一段时间(如1个月里哪些发射台发生停播的可能性最大、哪些发射台发生停播的时间可能最长等。举个例子:假设在最近的三个月里,中波台A、B、C分别发生了10次、9次和8次停播,停播次数在所有中波台里排名前三,造成停播的主要原因是机器故障。而中波台D、E、F虽然只分别发生了1、2和3次停播,但停播时间分别达到10、20和30小时,在所有中波台里停播时间排名前三,造成停播的主要原因是外电因素。根据这些历史数据,运用数据挖掘技术里的时间序列预测方法,我们可以得出这样的结果:在未来的1个月里,中波台A、B、C发生停播的可能性最大,而中波台D、E、F发生停播的时间可能最长。当然,这些预测结果是否准确有待进一步地测试和验证。我们可以采用另外一些数据(如前6个月的数据对预测结果进行测试。而对预测结果的验证则需要通过未来1个月里实际发生的停播情况来进行。假设预测结果准确,我们可以对最有可能发生停播的中波台A、B、C或发生停播时间可能最长的中波台D、E、F,采取针对性的措施(对中波台A、B、C加强机器检修工作,对中波台D、E、F加强备用电源或发电机。这样做的好处是我们可以集中力量预防重点发射台(而不是所有发射台的停播问题,避免平均使用力量,争取用最少的投入得到最好的效果,减少停播发生的次数和时间,提高整体播出效果。2.2数据挖掘案例2 对监测站点的设备报警数据进行挖掘,发现数据背后隐藏的一些有用的知识。通常监测站点的设备报警数据由各监测台每天以设备异态日报的形式上报到数据处理中心数据库。设备报警数据主要包括以下字段:发生故障的监测站点名称、故障现象、故障起止时间、故障原因等。通过运用数据挖掘技术里发现广义知识的算法,对最近一段时间所有的设备报警数据进行挖掘,我们可以发现经常发生设备故障的监测站点具有的某些共同特征或共性。例如发现经常发生设备故障的监测站点的设备大部分由A公司制造,这一发现说明A公司生产的监测站点设备质量较差、根据发现的知识我们可以敦促A公司采取措施进一步改善其产品的质量。此外我们还可以发现,经常发生UPS报警同时故障原因又是外电停或外电电压不稳的监测站点都集中在某几个省份,这说明这几个省份的电力系统在运行过程中经常出现停电或电压不稳的情况,根据发现的知识我们可以向当地电力系统反映这些情况,希望停电或电压不稳的情况能够得到改善。 3 结束语通过上面的数据挖掘案例可以看到:运用数据挖掘技术我们可以从大量的广播电视监测数据中发现很多有意义、有价值的知识。这些知识可以使我们日常的监测工作和维护工作更有针对性,效率更高。数据挖掘技术在广播电视监测领域里的应有前景非常广阔、大有可为。淘宝天猫必备的数据分析工具发布时间：2021-02-10 大家都知道开网店要分析数据，也知道一些数据分析工具比如，淘宝指数，数据魔方，量子横道，但是，对于这些工具如何使用呢，很多卖家就犯愁了，到底应该看哪些数据，看了之后如何指导工作呢。详细为大家介绍一下，如何利用数据分析工具分析自己的数据和竞争对手的数据，做到知己知彼，百战不殆。【知己篇】店内数据分析店内运营简单来看，就是流量和转化这两件事。所以分析也主要从这两个指标出发。因为流量结构和精度直接影响转化，转化好坏再反过来影响流量，所以在分析时，先做流量盘查，再做转化分析。一、流量 1、搜索流量工具：搜索诊断助手、直通车 A.基础条件：不违规，可在“卖家工作台”-“搜索诊断助手”-“宝贝诊断里”检查。 B.相关性：类目属性相关性、标题关键字相关性。 C.人气分：是否橱窗推荐、是否加入消保、DSR评分、支付宝使用率、旺旺效应速度、拍货与发货的时差。 D.图片：很多卖家在优化主搜流量时，经常会忽略图片的优化，然而图片点击率的差距，直接影响了最后的搜索流量。买家不是直接搜索进来的，而是被图片吸引进来的，优化图片就显得非常重要。建议可以用直通车来测试图片(方法下文会介绍到)。 E.价格与销量：销量相当的产品，价格高的有更多展示的机会；价格相同的产品，销量高的有更多展示机会。而检查该项指标主要检查自己与直接竞争对手的差距，尤其是7天销量的差距，以做调整。 F.标题优化：在销量相对低的时候多使用长尾词，销量高的时候多使用泛词、中心词，并反复测试，得出搜索流量×搜索转化率的最大值。 2、付费流量工具：各付费工具的数据报表、量子。 A.直通车：诊断直通车主要看点击率和转化率这两个指标。点击率直接影响淘宝直通车的收入，在行业利润如此透明的年代，每家的出价其实都不可能差很多，而点击率越高，直通车本身的收入就越高，就会提供更好的位置给你。查看工具：行业解析报表。优化办法：挖掘USP。转化率则是淘宝看重的用户体验，直通车转化率要做到约等于或略低于该宝贝整体转化率才算比较健康。查看工具：直通车转化报表、量子-销售分析-宝贝销售排行; 优化办法：在销量较低的时候重点优化长尾词，销量高时优化泛词和定向。 B.钻石展位：诊断钻展其实也和直通车原理基本一致。也是优化图片，然后选择精准的店铺来定向。查看工具：钻展广告位对应类目数据、钻展定向报表-手工统计各项回报率; 优化办法：总结同行优秀素材的构成因素和失败素材的特点、把收集店铺ID的维度做细。 C.淘客：淘客诊断只要看自己与竞争对手的销量和佣金有何差距即可。二、内功 1、转化率工具：量子、数据魔方 A. 内页：首先看销量，其次看评价质量，再来看单品转化率、页面停留时间和询单率。如果连基础销量都没有，评价很差，转化率是不可能好的。两个先决条件解决了，再看单品转化率、页面停留时间和询单率是否不低于行业均值(或店内卖的好的宝贝)。若低于，则一一优化USP卖点、逻辑顺序(是否都做到围绕 USP)、展现内容多样化(数据、图表、细节图、权威认证报告、大量实证、视频等)、展现方式(字体、字号、背景色、配色)。 B.访问深度：由于80%的顾客入店都是从内页进来，所以主要优化内页可导流的位置，分别为店招、宝贝页关联、宝贝页侧边栏、店尾进行优化。再优化首页。查看工具：量子-销售分析-销售总览-平均访问深度、量子-流量分析-宝贝被访排行、量子-流量分析-首页被访数据(停留时间、点击率、跳失率)、量子-店铺装修。优化办法：将店内20%的产品用导航、促销、关联等的方式做集中展示。 C.支付率：是否做到了80%以上。查看工具：量子-销售分析-销售总览。优化办法：利用短电旺给顾客一个必须现在下单的理由。 D.营销活动：定期举办营销活动可提升转化率。 E.客服询单转化率：是否至少做到了行业均值。查看工具：如赤兔等第三方工具。优化方法：顾客的每一个问题都建立标准答案。 2、客单价工具：量子-销售分析-销售总览。优化办法：包邮条件、满减满赠、爆款关联、客服推荐、SKU扩充、促销产品等。 3、DSR 工具：淘宝DSR评分计算器。优化办法： A.淘宝原有服务的升级(7天无理由升级为30天、3天发货升级为24小时发货等); B.淘宝未有服务的创新(围绕客户与商家接触点的创新，如SNS、游戏)。 4、CRM CRM主要查看老客户占比、老客户转化率、二次购买率、客户分组短彩邮的ROI。工具：卖家工作台-会员关系管理、数云、客道等第三方软件。优化的办法：建立老客户分组，根据分组创建老客户的不同特权。越高级的客户拥有越高级的特权。【知彼篇】竞争数据分析竞争数据主要包括整个市场数据和直接竞争对手数据。市场数据的获取能够判定市场容量、市场竞争的激烈程度，避免新产品在还未上市时就输了。直接竞争对手的数据能则能取长补短。一、市场数据 1、市场容量用数据魔方-行业分析-整体情况可以看到整个行业、子类目的市场容量。 2、搜索指数用淘宝指数查看搜索指数和成交指数 3、细分数据工具：淘宝指数和数据魔方 A.买家购买分析用数据魔方-行业分析看到买家的购买分析，可查看购买的单价和客单价及购买的频次。 B.买家信息分析用数据魔方-行业分析看到买家的信息分析，可查看买家的来访高峰时段、购买高峰时段、买家地域、性别分布和年龄。 C/属性热销用数据魔方-属性分析-属性热销排行，查看买家需求的产品属性。 4、趋势工具：数据魔方 A.市场趋势用数据魔方-行业分析-整体情况拉出最近3年、1年、半年和一季度的走势。 B.行业关键词热搜飙升榜(数据魔方-淘词-行业热词榜-行业关键词热搜飙升榜) 5、竞争度用数据魔方-行业分析-卖家分析，查看卖家的数量，值越大，竞争越激励。再用核心关键词在淘宝上搜索，按销量排序，看前3名，第3和第40名的销售笔数的差额，值越低，竞争越激烈。 6、空白市场需要细心的留意，并对整个行业的动态有清晰的掌握。二、竞争对手数据竞争对手的数据建议是每周都收集，然后和自己店内数据进行对比。 1、销售额用数据魔方-品牌分析-品牌详情来查询 2、转化率用数据魔方-品牌分析-品牌详情来查询。 2、点击率用数据魔方-品牌分析-品牌详情来查询。 4、客单价用数据魔方-品牌分析-品牌详情来查询。 5、营销活动定期收集竞争对手的营销活动，包括活动商品品类、商品价格、活动政策、互动平台和媒介投放等。 6、爆款定期收集竞争对手的主要爆款，包括产品名、价格、转化率、销量、单品活动、单品卖点、关联、流量来源、直通车卡位、直通车图片、钻展图片、老客户优惠等。查看工具：数据魔方-品牌分析-品牌详情-热销宝贝排行、手工收集。 7、特色对竞争对手的赠品、包裹、优惠券、客户互动等相关信息进行收集。数据分析说到底就是和自己的过去比，和竞争对手的现在比，和我们期望的未来比。找出现在店铺存在的问题，再思考可以用什么方法来改善它，这样的数据分析才有意义。其他数据分析方法：还有一点补充，数据魔方数据是有限制的，部分店铺信誉未达到标准而无法订购，所以数据分析上达不到要求。即便购买了数据魔方，也会有类目限制，品牌限制，数量限制。那么我们怎么才能获得更多数据分析呢？这里我就推荐几款第三方工具(非广告，仅仅推荐) 1，情报通：主要分析店铺每天运营数据，销量以及营业额的。缺点：此软件定位高端用户群体，价格有点偏高。情报通演示： 2，升业绩工具：主要分析竞争对手推广数据以及流程构成缺点：功能太杂，有些功能根本用不到。升业绩演示： 3，魔镜：专注直通车数据分析，关键词排名。缺点：准确率太低，功能不新鲜。魔镜演示： 4，超级数据：分析竞争对手品类占比，品牌定位情况。缺点：更新数据延迟，很多店铺查询不到。超级数据演示：以上都是老口碑在线工具，再就是从14年到现在，又陆续浮现了很多在线工具。如看店宝、知己知彼、巴巴哈淘宝工具等工具，笔者对比发现了下，就呵呵了，我就不做解释了。大家可以自己对比下。主要是围绕功能体现价值，数据准确率上分析吧，别的都是扯淡。本文出自：转载请注明宣名网络-让天下没有难做的网商!

展开阅读全文