资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样,*,*,航空公司客户价值分析,2026/1/7 周三,1,预处理航空客户数据,目录,了解航空公司现状与客户价值分析,2,使用,K-Means,算法进行客户分群,3,小结,4,分析航空公司现状,1.,行业内竞争,民航,的竞争除了三大航空公司之间的竞争之外,还将加入新崛起的各类小型航空公司、民营航空公司,甚至国外航空巨头。航空产品生产过剩,产品同质化特征愈加,明显,于是,航空公司从价格、服务间的竞争逐渐转向对客户的竞争。,分析航空公司现状,2.,行业外竞争,随着高铁、动车等铁路运输的兴建,航空公司受到巨大冲击。,目前航空公司已积累了大量的会员档案信息和其乘坐航班记录。,以,2014-03-31,为结束时间,选取宽度为两年的时间段作为分析观测窗口,抽取观测窗口内有乘机记录的所有客户的详细数据形成历史数据,,44,个特征,总共,62988,条记录。数据特征及其说明如右表所示。,分析航空公司现状,航空公司数据特征说明,特征名称,特征说明,客户基本信息,MEMBER_NO,会员卡号,FFP_DATE,入会时间,FIRST_FLIGHT_DATE,第一次飞行日期,GENDER,性别,FFP_TIER,会员卡级别,WORK_CITY,工作地城市,WORK_PROVINCE,工作地所在省份,WORK_COUNTRY,工作地所在国家,AGE,年龄,航空公司客户数据说明,表 名,特征名称,特征说明,乘机信息,FLIGHT_COUNT,观测窗口内的飞行次数,LOAD_TIME,观测窗口的结束时间,LAST_TO_END,最后一次乘机时间至观测窗口结束时长,AVG_DISCOUNT,平均折扣率,SUM_YR,观测窗口的票价收入,SEG_KM_SUM,观测窗口的总飞行公里数,LAST_FLIGHT_DATE,末次飞行日期,AVG_INTERVAL,平均乘机时间间隔,MAX_INTERVAL,最大乘机间隔,积分信息,EXCHANGE_COUNT,积分兑换次数,EP_SUM,总精英积分,PROMOPTIVE_SUM,促销积分,PARTNER_SUM,合作伙伴积分,POINTS_SUM,总累计积分,POINT_NOTFLIGHT,非乘机的积分变动次数,BP_SUM,总基本积分,续表,原始数据中包含,40,多个特征,利用这些特征做些什么呢?我们又该从哪些角度出发呢?,思考,借助航空公司客户数据,对客户进行分类。,对不同的客户类别进行特征分析,比较不同类别客户的客户价值。,对不同价值的客户类别提供个性化服务,制定相应的营销策略。,项目目标,结合目前航空公司的数据情况,可以实现以下目标。,公司,收入的,80%,来自顶端的,20%,的客户。,20,%,的客户其利润率,100%,。,90,%,以上的收入来自现有客户。,大部分,的营销预算经常被用在非现有客户上。,5,%,至,30%,的客户在客户金字塔中具有升级潜力。,客户,金字塔中客户升级,2%,,意味着销售收入增加,10%,,利润增加,50%,。,这些经验也许并不完全准确,但是它揭示了新时代客户分化的趋势,也说明了对客户价值分析的迫切性和必要性。,了解客户价值分析,客户营销战略倡导者,Jay&Adam Curry,从国外数百家公司进行了客户营销实施的经验中提炼了如下经验。,熟悉航空客户价值分析的步骤与流程,航空客户价值分析项目的总体流程如图所示。,1,预处理航空客户数据,目录,了解航空公司现状与客户价值分析,2,使用,K-Means,算法进行客户分群,3,小结,4,通过对数据观察发现原始数据中存在票价为空值,票价最小值为,0,,折扣率最小值为,0,,总飞行公里数大于,0,的记录。票价为空值的数据可能是客户不存在乘机记录造成,。,处理方法:,丢弃票价为空的记录,。,其他,的数据可能是客户乘坐,0,折机票或者积分兑换造成。由于原始数据量大,这类数据所占比例较小,对于问题影响不大,因此对其进行丢弃处理,。,处理方法:,丢弃票价为,0,,平均折扣率不为,0,,总飞行公里数大于,0,的记录。,处理数据缺失值与异常值,航空公司客户原始数据存在少量的缺失值和异常值,需要清洗后才能用于分析。,本项目的目标是客户价值分析,即通过航空公司客户数据识别不同价值的客户,识别客户价值应用最广泛的模型是,RFM,模型,。,R,(,Recency,)指的是最近一次消费时间与截止时间的间隔。通常情况下,最近一次消费时间与截止时间的间隔越短,对即时提供的商品或是服务也最有可能感兴趣,。,F,(,Frequency,)指顾客在某段时间内所消费的次数。可以说消费频率越高的顾客,也是满意度越高的顾客,其忠诚度也就越高,顾客价值也就越大,。,M,(,Monetary,)指顾客在某段时间内所消费的金额。消费金额越大的顾客,他们的消费能力自然也就越大,这就是所谓,“,20%,的顾客贡献了,80%,的销售额,”,的二八法则,。,构建航空客户价值分析的关键特征,1.RFM,模型介绍,RFM,模型包括三个特征,,,使用三维坐标系进行展示,如图所示,。,X,轴表示,Recency,,,Y,轴表示,Frequency,,,Z,轴表示,Monetary,,每个轴一般会分成,5,级表示程度,,1,为最小,,5,为最大。,构建航空客户价值分析的关键特征,2.RFM,模型结果解读,在,RFM,模型中,消费金额表示在一段时间内,客户购买该企业产品金额的总和,由于航空票价受到运输距离,舱位等级等多种因素影响,同样消费金额的不同旅客对航空公司的价值是不同的,因此这个特征并不适合用于航空公司的客户价值分析。,构建航空客户价值分析的关键特征,3.,传统,RFM,模型在航空行业的缺陷,本项目选择客户在一定时间内累积的飞行里程,M,和客户在一定时间内乘坐舱位所对应的折扣系数的平均值,C,两个特征代替消费金额。此外,航空公司会员入会时间的长短在一定程度上能够影响客户价值,所以在模型中增加客户关系长度,L,,作为区分客户的另一特征。,本项目将客户关系长度,L,,消费时间间隔,R,,消费频率,F,,飞行里程,M,和折扣系数的平均值,C,作为航空公司识别客户价值的关键特征(如表,3 2,所示),记为,LRFMC,模型。,构建航空客户价值分析的关键特征,4.,航空客户价值分析的,LRFMC,模型,模型,L,R,F,M,C,航空公司,LRFMC,模型,会员入会时间距观测窗口结束的月数,客户最近一次乘坐公司飞机距观测窗口结束的月数,客户在观测窗口内乘坐公司飞机的次数,客户在观测窗口内累计的飞行里程,客户在观测窗口内乘坐舱位所对应的折扣系数的平均值,完成五个特征的构建以后,对每个特征数据分布情况进行分析,其数据的取值范围如表所示。从表中数据可以发现,五个特征的取值范围数据差异较大,为了消除数量级数据带来的影响,需要对数据做标准化处理。,标准化,LRFMC,五个特征,特征名称,L,R,F,M,C,最小值,12.17,0.03,2,368,0.14,最大值,114.57,24.37,213,580717,1.5,LOAD_TIME,FFP_DATE,LAST_,TO_END,FLIGHT_,COUNT,SEG_K,M_SUM,AVG_DIS,COUNT,2014/3/31,2013/3/16,23,14,126850,1.02,2014/3/31,2012/6/26,6,65,184730,0.76,2014/3/31,2009/12/8,2,33,60387,1.27,2014/3/31,2009/12/10,123,6,62259,1.02,2014/3/31,2011/8/25,14,22,54730,1.36,标准化,LRFMC,五个特征,L,、,R,、,F,、,M,和,C,五个特征的数据示例,上图为原始数据,下图为标准差标准化处理后的数据。,L,R,F,M,C,1.44,-0.95,14.03,26.76,1.30,1.31,-0.91,9.07,13.13,2.87,1.33,-0.89,8.72,12.65,2.88,0.66,-0.42,0.78,12.54,1.99,0.39,-0.92,9.92,13.90,1.34,1,预处理航空客户数据,目录,了解航空公司现状与客户价值分析,2,使用,K-Means,算法进行客户分群,3,小结,4,K-Means,聚类算法,是一种基于质心的划分方法,输入聚类个数,k,,以及包含,n,个数据对象的数据库,输出满足误差平方和最小标准的,k,个聚类。算法步骤如下。,从,n,个样本数据中随机选取,k,个对象作为初始的聚类中心。,分别,计算每个样本到各个聚类质心的距离,将样本分配到距离最近的那个聚类中心类别中。,所有,样本分配完成后,重新计算,k,个聚类的中心。,与,前一次计算得到的,k,个聚类中心比较,如果聚类中心发生变化,转,(2),,否则转,(5),。,当,质心不发生变化时停止并输出聚类结果。,了解,K-Means,聚类算法,1.,基本概念,K-Means,聚类算法是在数值类型数据的基础上进行研究,然而数据分析的样本复杂多样,因此要求不仅能够对特征为数值类型的数据进行分析,还要适应数据类型的变化,对不同特征做不同变换,以满足算法的要求。,了解,K-Means,聚类算法,2.,数据类型,K-Means,算法在,R,语言中实现的核心函数为,kmeans,,来源于,stats,软件包,其基本语法如下。,kmeans,(x,centers,iter.max,=10,nstart,=1,algorithm=c(,Hartigan,-Wong,Lloyd,Forgy,MacQueen,),常用,参数及其,说明如表所,示,。,了解,K-Means,聚类算法,3.kmeans,函数及其参数介绍,参数名称,说,明,x,接收,matrix,或,dataframe,。表示进行聚类分析的数据集。无默认。,centers,接收,int,。表示初始类的个数或者初始类的中心。无默认。,iter.max,接收,int,。表示最大迭代次数。默认为,10,。,nstart,接收,int,。表示选择随机起始中心点的次数。默认为,1,。,algorithm,接收特定,character(,Hartigan,-Wong,Lloyd,Forgy,MacQueen,),。默认为,Hartigan,-Wong,。,K-Means,模型构建完成后可以通过属性查看不同的信息,如表所示。,了解,K-Means,聚类算法,3.kmeans,函数及其参数介绍,属性,说明,cluster,返回,int,。表示每个点被分配到的簇。,centers,返回,num,。表示聚类中心矩阵。,totss,返回,int,。表示所生成簇的总体距离平方和。,withinss,返回,num,。表示每个簇内的距离平方和。,betweenss,返回,num,。表示每个簇之间的距离平方和。,size,返回,int,。表示每个簇内的数量。,分析聚类结果,对数据进行聚类分群的结果如表所示。,聚类,类别,聚类,个数,聚类中心,L,R,F,M,C,客户群,1,5336,0.483,-0.799,2.483,2.425,0.309,客户群,2,4171,0.056,-0.003,-0.226,-0.229,2.200,客户群,3,15742,1.160,-0.377,-0.087,-0.095,-0.156,客户群,4,24663,-0.700,-0.415,-0.161,-0.161,-0.254,客户群,5,12132,-0.313,1.686,-0.574,-0.537,-0.173,分析聚类结果,针对聚类结果进行特征分析,如图所示。,分析聚类结果,结合业务分析,通过比较各个特征在群间的大小对某一个群的特征进行评价分析,从而总结出每个群的优势和弱势特征,具体结果如表所示。,群类别,优势特征,弱势特征,客户群,1,F,M,R,客户群,2,C,R,F,M,客户群,3,F,M,L,客户群,4,L,C,客户群,5,F,M,R,分析聚类结果,基于特征描述,本项目定义五个等级的客户类别:重要保持客户,重要发展客户,重要挽留客户,一般客户,低价值客户。每种客户类别的特征如图所示。,会员的升级与保级,:,航空公司可以在对会员升级或保级进行评价的时间点之前,对那些接近但尚未达到要求的较高消费客户进行适当提醒甚至采取一些促销活动,刺激他们通过消费达到相应标准。这样既可以获得收益,同时也提高了客户的满意度,增加了公司的精英会员。,首次兑换,:采取的措施是从数据库中提取出接近但尚未达到首次兑换标准的会员,对他们进行提醒或促销,使他们通过消费达到标准。一旦实现了首次兑换,客户在本公司进行再次消费兑换就比在其他公司进行兑换要容易许多,在一定程度上等于提高了转移的成本。,交叉销售,:通过发行联名卡等与非航空类企业的合作,使客户在其他企业的消费过程中获得本公司的积分,增强与公司的联系,提高他们的忠诚度。,模型应用,根据对各个客户群进行特征分析,采取下面的一些营销手段和策略,为航空公司的价值客户群管理提供参考。,1,分析方法与过程,目录,了解航空公司现状与客户价值分析,2,使用,K-Means,算法进行客户分群,3,小结,4,本项目结合航空公司客户价值分析的案例,重点介绍了数据分析算法中,K-Means,聚类算法在客户价值分析中的应用。针对,RFM,客户价值分析模型的不足,使用,K-Means,算法构建了航空客户价值分析,LRFMC,模型,详细描述了数据分析的整个过程。,小结,
展开阅读全文