资源描述
花了一周,我总结了 120个数据指标与术语。
数据分析总是离不开各种指标和术语,最近我花了 一周整理了共120个数据分 析指标与术语:用户数据指标、行为数据指标、业务数据指标、数据分析术语、 统计学常用语、数据报告常用术语。
用户数据指标(9个)指标
指标
行为数据指标(51个)
业务数据指标(13个)120个数据分析 指标与术语
120个数据分析 指标与术语
数据分析术语(10个)统计学常用语(19个)
统计学常用语(19个)
数据报告常用术语(18个)文章较长,建议大家先点击本文右上角收藏保存。
用户数据指标IP、UV、PV、VV
IP (Internet Protocol):独立 IP 数。
UV ( Unique Visitor):独立访问客数。
PV ( Page View):页面浏览量/阅读量。
VV (Visit View):访问次数。
注:在对视频产品的数据分析中,VV(Video View)是播放类指标,是指在 一个统计周期内,视频被翻开的次数之和。
DAU(Daily Active User):日活跃用户数MAU(Monthly Active users):月活跃用户数
CPR(Cost Per Response):每回应本钱【以浏览者的每一个回应计费】ADPV(Advertisement Page View):载有广告的 pa-geview 流量
ADimp(ADimpression):单个广告的展示次数数据分析术语
用户画像简单来说,用户画像是根据用户的社会属性、生活习惯、消费行为等 信息而抽象得出的一个标签化用户模型。勾画用户画像的核心在于给用户贴 “标签”。(涉及的元素比方用户的姓名、年龄、收入、喜好、购物习惯等等)消费信用水平
消费信用水平
是否有房
生活爱好
婚否
是否有车
性别
教育程度
颜色偏好
贿买力
是否有孩子
健康状态
体型
社会关系
是否有孕妇
身高
疾病史
饮食习惯
\
宗教信仰
孩子性别
孩子年龄
海盗模型(AARRR)获取用户(Acquisition)、提高活跃度(Activation)、 提高留存率(Retention)、获取收入(Reve-nue)、自传播(Refer),这个五 个单词的缩写,分别对应用户生命周期中的5个重要环节。
RARRA模型AARRR模型的核心在于获客,而在RARRA的模型下,专注用户的留存。
获客还是留存:增长模型的变化获客(Acquisition)
获客(Acquisition)
激活(Activation)
OSM模型
OSM模型(Object-Strategy-Measure)就是把宏大的目标拆解,[对应到部门 内各个小组具体的、可落地、可度量的行为上,从保证执行计划没有偏离大方 向]( :〃 《OSM 模型,最接地气的业 务分析框架》)0UJM模型
UJM模型(User Journey Map,用户旅程地图)就是我们在设计一款产品的 过程中,必须要去梳理的用户生命旅程。
战略目标(0):提升GMV拆解 目标
拆解 目标
目标1:提升用户基数
策略
(S)
通过线下导流线上公众号、社目搭厂引灌两城以及其他 推广集道,揖升用户的蠹活管化效累
目标2:提高转化率
• 说开屯・首页漳■到计情员的分发效率
• 优化下♦的要环节汲程体验
• 箭会反折犯及滋■商事.密团高国.活动商品.樗豆 通晶那么■用户下・
•量源廉•科恬(访问、叠景、加购.下线)
•拉新落地页的蔬出、下隼转化
•新用户的费最.下・转化效果
•吉同农光、点击效率
•下♦的关■节点(浏JW详、哂、援交订・、支y 成功).整体暴化事
度量
(M)RFM
根据客户的交易频次和交易额衡量客户的价值,对客户进行细分。RFM是衡 量客户价值的三个维度,分别为R ( Recency)交易间隔、F ( Frequency)交 易频度、M ( Monetary)交易金额组成。
ABTestAB测试是为APP或Web的界面/流程制作两个(A/B)或多个(A/B/n)版本, 在同一时间维度中,分别让组成成分相同/相似的访客群组(目标人群)随机 的访问这些版本,收集各群组的用户体验数据和业务数据,最后分析、评估出 最优版本,正式采用。
数据埋点 数据埋点是一种常用的数据采集方法,是数据产品经理、数据运营以及数据分 析师,基于业务需求或产品需求对用户在应用内产生行为的每一个事件对应的 页面和位置植入相关代码,并通过采集工具上报统计数据,以便相关人员追踪 用户行为和应用使用情况,推动产品优化或指导运营的一项工程⑶。
用户生命周期价值LTV (life time value)也就是用户生命周期价值,是产品从用户获取到流失所 得到的全部收益的总和。LTV用于衡量用户对产品所产生的价值,是所有用户 运营手段为了改善的终极指标,同时LTV也应该是所有运营手段的最终衡量 指标。
归因分析 在数据时代,广告的投放效果评估往往会产生很多的问题。而归因分析 (Attribution Analysis)要解决的问题就是广告效果的产生,其功劳应该如何 合理的分配给哪些渠道⑶。
跨屏
转化路径
转化购买
视频广告 信息流广告 社交广告
统计学常用语
绝对数和相对数 绝对数:是反响客观现象总体在一定时间、一定地点下的总规模、总水平的综 合性指标,也是数据分析中常用的指标。比方年GDP,总人口等等⑷。
相对数:是指两个有联系的指标计算而得出的数值,它是反响客观现象之间的 数量联系紧密程度的综合指标。相对数一般以倍数、百分数等表示。相对数的 计算公式:
相对数=比拟值(比数)/基础值(基数) 百分比和百分点百分比:是相对数中的一种,它表示一个数是另一个数的百分之几,也称为百 分率或百分数。百分比的分母是100,也就是用1%作为度量单位,因此便于 比拟。
百分点:是指不同时期以百分数的形式表示的相对指标的变动幅度,1%等于1 个百分点。
频数和频率频数:一个数据在整体中出现的次数。
频率:某一事件发生的次数与总的事件数之比。频率通常用比例或百分数表示。
比例与比率比例:是指在总体中各数据占总体的比重,通常反映总体的构成和比例,即部 分与整体之间的关系。
比率:是样本(或总体)中各不同类别数据之间的比值,由于比率不是局部与整 体之间的比照关系,因而比值可能大于1。
变量变量来源于数学,是计算机语言中能储存计算结果或能表示值抽象概念。变量 可以通过变量名访问。
连续变量在统计学中,变量按变量值是否连续可分为连续变量与离散变量两种。在一定 区间内可以任意取值的变量叫连续变量,其数值是连续不断的,相邻两个数值 可作无限分割,即可取无限个数值。如:年龄、体重等变量。
离散变量离散变量的各变量值之间都是以整数断开的,如人数、工厂数、机器台数等, 都只能按整数计算。离散变量的数值只能用计数的方法取得。
定性变量又名分类变量:观测的个体只能归属于几种互不相容类别中的一种时,一般是 用非数字来表达其类别,这样的观测数据称为定性变量。可以理解成可以分类 别的变量,如学历、性别、婚否等。
均值即平均值,平均数是表示一组数据集中趋势的量数,是指在一组数据中所有数 据之和再除以这组数据的个数。
5 4 3 2 1 0 销量、万件
上半年各产品销量比照
品品
■■B品平均值
1月2月 3月4月5月 6月
中位数对于有限的数集,可以通过把所有观察值高低排序后找出正中间的一个作为中 位数。如果观察值有偶数个,通常取最中间的两个数值的平均数作为中位数。
缺失值它指的是现有数据集中某个或某些属性的值是不完全的。
异常值指一组测定值中与平均值的偏差超过两倍标准差的测定值,与平均值的偏差超 过三倍标准差的测定值,称为高度异常的异常值。
方差 是衡量随机变量或一组数据时离散程度的度量。概率论中方差用来度量随机变 量和其数学期望(即均值)之间的偏离程度。统计中的方差(样本方差)是每 个样本值与全体样本值的平均数之差的平方值的平均数。在许多实际问题中, 研究方差即偏离程度有着重要意义。方差是衡量源数据和期望值相差的度量值。
标准差又常称均方差,是离均差平方的算术平均数的平方根,用。表示。标准差是方 差的算术平方根。标准差能反映一个数据集的离散程度。平均数相同的两组数 据,标准差未必相同。
皮尔森相关系数皮尔森相关系数是用来反映两个变量线性相关程度的统计量。相关系数用r表 示,其中n为样本量,分别为两个变量的观测值和均值。r描述的是两个变量 间线性相关强弱的程度。r的绝对值越大说明相关性越强。
数据报告常用术语倍数和番数
倍数:用一个数据除以另一个数据获得,倍数一般用来表示上升、增长幅度, 一般不表示减少幅度。
翻n番:指原来数量的2的n次方。
同比和环比同比:指的是与历史同时期的数据相比拟而获得的比值,反响事物开展的相对 性。
环比:指与上一个统计时期的值进行比照获得的值,主要反映事物的逐期开展 的情况。
3月份居民消费价格分类别环比涨跌幅2.0
1.51.0
0.50.0
-0.5•1.0
交通 教育文化国疗保健其他用品
居住 生活用品 及服务
食品埴酒衣看
娱乐
及服务
通信
增量:增长的绝对量=现期量-基期量增速:增长速度=(现期量-基期量)+基期量
增长率:增量与基期量之比。
增幅:即增长的幅度,也可理解为增量。
基期和现期基期:被用作参照物的时期称为基期,描述基期的量即为基期量。
现期:相对于基期的称为现期,描述现期的量即为现期量。
YTD:截止到今天为止今年的LY:last year 去年
YoY——跟上年相比MAT ( moving annual total):年度动态变化总值
Q4/Q1: 4季度/1季度GDP:国内生产总值
GNH (gross national happiness):国民幸福指数GNP:国民生产总值
# of users wDAU = open your a in a day
DNU(Day New User):日新增用户。
活跃留存率:指某日新增用户在其后N日仍启动该APP的用户数,占所选日 期新增用户数的比例。
2020年*2020年头部汽车斐讯app日新增用户数
单位:万
2020年头部汽车斐讯app日新增用户数
单位:万
易车系
©@©©©0^7.0
悝车带
汽车之家蔡
©0014.8
2020年3
TGI (Target Group Index):目标群体指数。
目标群体中具有某一特征的群体所占比例*100
总体中具有相同特征的群体所占比例
3 -
TGI指数高于100,代表该类用户该特征比例高于整体水平,即具有更高的相 关倾向或偏好;小于100,那么说明该类用户相关倾向较弱;等于100表示在平 均水平。
TGI指数常用于用户画像的评判中,它可以清晰地反映不同群体某一特征的关 联程度,并进行直观的比拟,挖掘更多潜在的用户价值。
行为数据指标
之前我曾经总结过用户行为分析的5类指标,这里的行为数据指标便直接引用 前文⑴。
用户访问类的指标有13个:PV、UV、DV、日新增用户数、获客本钱、用户 访问时长、人均页面访问量、人均浏览页数、平均访问页面、访问来源、平均 停留时间、跳出率、搜索访问次数占比。(其中PV、UV、日新增用户数前文 已介绍,其余指标具体含义如下列图所示。)指标
指标
指标含义PV (Page View)
PV (Page View)
即页面浏览量,是衡量网络新闻的主要指标
UV (Unigue Visitor)
即独立用户,是指通过互联网访问、浏览某网页的自然,
DV (Depth of Visit)
即访问深度,是指用户在一次浏览网站的过程中浏览了[
日新增用户数
在某个时间段内使用网站或应用的新用户总数(统计周!
获客本钱
获取一个客户所花费的平均本钱
用户访问时长
•次会话持续的时间
@公众号:凹凸数据
人均页面访问量
人均页面访问量=通过浏览器访问的Session来记录的访
人均浏览页数
每个唯一身份访问者(UV)页面浏览量(PV)的平均娄
平均访问页面
平均每次访问浏览的页面数量,平均访问页数=浏览量M
访问来源
也称为“推荐来源”,通常互联网用户会通过各种渠道
就是“访问来源”
平均停留时间
访客在一次访问中,平均翻开网站的时长,即每次访问
,个页面的平均值
跳出率
只访问了入口页面(如网站首页)就离开的访问量与所j
跳出率=访问•个页面后离开网站的次数/总访问次数
搜索访问次数占比
搜索访问次数就是访客点击搜索结果到达网站的次数。i
/总访问次数
△点击查看大图
用户转化类指标共有15个:最近购买间隔、购买频率、购买商品种类、平均 每次消费额、单次最高消费额、日应用下载量、一次会话用户数、用户会话次 数、漏斗转化一第一步进入次数、漏斗转化一中间步进入次数(漏斗中)、进
漏斗转化一进入率(漏斗中)、漏斗转化一进入次数(漏斗中)、
斗转化一
进入率(漏斗中)、漏斗转化一退出次数、漏斗转化一退出率,这些指标具体 含义如下列图所示。
指标
最近购买间隔
指标含义
用户最近一次购买距离当前的天数
购买频率
购买商品种类
平均每次消费额
用户在一段时间内购买的次数
用户在一段时间内购买的商品种类
也称为客单价,计算公式:平均每次消费额=用 消费次数
单次最高消费额
日应用下载量
用户在一段时间内购买的单次最高支付金额 单个用户账户下载的应用数量
,次会话用户数
用户会话次数
漏斗转化一第一步进入次数
漏斗转化一中间步进入次数(漏
斗中)
即下载完App,仅翻开过产品一次,且该次使用
数量@公众号:凹凸数据
用户会话(Session),是用户在时间窗口内的所 搜索商品、浏览商品、下单并且支付、最后退出小
第一步进入次数=含有此页面的访问次数
在漏斗上一步进入次数中以上一步为前链进入出
进漏斗转化一进入率(漏斗中)
漏斗转化一进入次数(漏斗中)
进入率=在漏斗上一步进入次数中以上一步为前
入次数
在与前步骤的进入次数中,没有进入漏斗下引
漏斗转化一进入率(漏斗中)
漏斗转化一退出次数
漏斗转化一退出率
△点击查看大图
进入率=在当前步骤的进入次数中没有进入漏斗 数/当前步骤的进入次数
在当前步骤的进入次数中,没有进入漏斗下一步
退出率=当前步骤退出次数/当前步骤进入次数
用户留存类指标共有15个:用户留存率、渠道留存率、次日留存率、退出率、 活跃度、活动参与率、活跃交易用户数、DAU、MAU、用户回访率、用户流 失率、功能使用率、GMV、复购率、退货率,这些指标具体含义如下列图所示。
用户留存率
留存用户数占当时新增用户数的比例(这里的“当时”指的是用户首次使用 的时间点,一般统计周期为天)
渠道留存率
不同用户渠道的用户留存率
次日留存率
计算公式:次日留存率=当时新增用户中在第2天依然使用网站或App的J 新增用户数.
次日留存分析需要结合产品的新手引导设计和新用户转化路径等一起进行
退出率
计算公式:退出率=从该页退出的页面访问数/进入该页的页面访问数。
如,某商品页进入PV为1000.该页直接关闭的访问数为300,那么退出率:
活跃度
线上产品的用户在线时长以及登录频次
活动参与率
参加活动人数占总人数的比重
活跃交易用户数
和活跃用户一样,活跃交易用户也可以区分成首单用户(第一次消费)、 户、流失消费用户等
DAU
日活跃用户数量(Daily Active User),指的是一个统计日内登录或使用某
立不重复的用户数@公众号:凹凸数据
MAU
即月活跃用户人数(Monthly Active Users)
用户回访率
用户回访率=回访用户数/统计周期内流失的用户数X 100%
用户流失率
如果在某段时间内消费的人群中,一局部人在一个流失周期后变为流失人 失人群人数与消费人群的总人数之比被定义为流失率。首先要确定如何定义 为,不同运营人员对流失行为的定义不同
功能使用率
产品重要功能的使用指标,如收藏率、点费率、评论率等
GMV
一段时间内的成交总额
复购率
计算复购率有两种方法。
1 .复购率=重复购买客户数量/客户样本数量。例如,客户样本100人,事 复购买(不用考虑重复购买了几次),复购率=60/100,即60%
2 .复购率=客户购买行为次数(或交易次数)/客户样本数量。例如,客户生 其中60人重复购买,这60人中有40人重复购买1次(即购买2次),有二 买2次(即购买3次),复购率=(40*1+20*2) ”00,即80%
退货率
计算公式:退货率=产品售出后由于各种原因被退回的数量7同期售出的产,
指标指标含义
△点击查看大图
用户社交类指标共有8个:好友数量、帖子数量、看帖数量、回复数量、提供 数量、点赞数量、转发数量、评论数量,这些指标具体含义如下列图所示。
指标
指标含义
好友数量
好友数量
用户提供渠道可以细分为微信好友/群、微信朋友I
帖子数量
发帖数量级按自定义时间窗口统计
看帖数量
浏览帖数量级按自定义时间窗口统计
回复数量
回复数量级按自定义时间窗口统计
提供数量 点赞数量 转发数量
提供数量级按自定义时间窗口统计 点赞数量级按自定义时间窗口统计 转化数量级按自定义时间窗口统计评论数量评论数量级按自定义时间窗口统计
△点击查看大图业务数据指标
互联网线上推广渠道总体上可以分为5种类型:原生广告类社交媒体、普通社 交媒体、搜索引擎、软件商店和换量联盟。
渠道投放相关的数据指标有:曝光量、CPM、CPC、CPA和ROI,这5个指 标的具体含义如下列图所示。
指标
曝光量(渠道到达量)
即产品推广页中有多少用户浏览
CPM (Cost PerMille)
指每千人本钱,即每一千人看到
CPC (Cost Per Click)
指每位用户点击本钱,按每位用
CPA (Cost Per Action)
指每次行动本钱,按每位用户的
渠道RO1
即投资回报比
△点击查看大图
此外,还有指标ARPU与ARRPU,这二者分别的含义为:
ARPU (Average Revenue Per User):每用户平均收入。
ARRPU (Average Revenue Per Paying User):每付费用户平均收益。
最后,关于广告渠道投放的常见CPM、CPC、CPA等指标,还包括以下6个 指标。
CTR (click through rate):点击率,是衡量广告效果非常重要的一个指标: 内容被点击的次数/内容展现的次数。
Clicks* 100
* 100
CTR =Impressions
CVR(Click Value Rate):转化率【衡量CPA广告效果的指标】CAC(Customer Acquisition Cost):获客本钱【获取一个客户所花费的本钱】
展开阅读全文