1、数据驱动业务增长:如何做转化意愿预 测引言数据驱动业务增长”是以业务线全链路海量数据的收集、存储、可视化、分析、 挖掘作为核心支撑的,需要协同上下游参与且目标一致,最终将数据精准化、精 细化为实现商业目的。一、业务背景1 .业务介绍本产品主要是挖掘孩子的综合素质,覆盖思维、英语、语文等能力,帮助孩子在 认识世界、探索世界的同时,打好全方位的能力基础,陪伴孩子共同成长。2 .商业模式通过低价课吸引用户,经过一些列课程培养和体验服务,最终转化成年课用户。3 .分析主题转化分析。VI Ready Add versionBuildAnalyzePredictModel status88.775The
2、model predicts the correct Trans_core 88.775% of the time.OverviewScoringColumn impact。Q Search columns.) 0.03.cImpact of active.day on prediction of trans.corePredict 1J active.day10.665%total attendantregister_timetotaLgmvchannleretain.dayuser .lifetime9.62%9.481%8.68%8.511%7.964%All other classes
3、 ,0-08-active_dayIII Total columns: 19= Total rows: 1,409 HH Total cells: 26.771 trans.core 9 3+ category predictionCloseConversion Wish PredictionVI Ready (?) Add version2X ShareConversion Wish PredictionSelectBuildAnalyzePredictModel statusPredict88.775The model predicts the correct Trans_core 88.
4、775% of the time.OverviewScoringColumn impactImpact of active day on prediction of trans_core(7) active_day2 total_attend_cnt3register.time4totaLgmv5channle6retain_day7user lifetime10.665%9.62%9.481%8.68%8.511%7.964%UOA*pa-d UOJeduJ_All other classes _0 CSactive.day向 N5?化工sv III Total columns: 19 =
5、Total rows: 1.409 iS Total cells: 26,771 trans.core 9 3+ category predictionClose特征分析:这个可以根据转化意愿分值进行查看指标的影响和分布,这个功能是非常棒的,在数据产品视角对模型分析师偏概览的,这个可以细致的挖掘更深层的理解。计分概述active_day 对 trans.core 预测的影响active_day100 UOU - p d uotiBdluI列影响oQ搜索列活动日O10.665%2 total_attend_cnt9.62%3 注册时间9.481%4 total_gmv8.68%5 频道2)特征相
6、关性根据初次筛选彳导出一些和转化有显著相关性的指标因子,并且可利用分布情况, 分析背后原因。显著相关性概览:根据是否显著相关性整理一局部比拟有趣,可以看出有一些认 为有影响因素的其实问题并不大,有的标签其实和转化这个点关系并不强烈,但 是可以作何核心的营销因素。年龄强显著根据统计结果可以查看受众人群范围。竞品安装强显著可以分析用户对于当前产品的诉求强弱。城市一般根据统计分析主要是看地域的受众性。关注公众号强显著分析用户对当前产品的兴趣程度和吸引度。沟通意愿强显著高强判断用户转化特征,通过沟通传递购买价值。到课率强显著分析用户对产品的产品力认可程度完课率强显著手机品牌不显著初步构思判断用户购买力
7、,但是并没有很强相关性。渠道来源强显著判断渠道带来用户的质量高低。用户身份强显著用户的身份受众人群的判断,比方女性对该产品的关注度高、购买力弓学习能力一般主要是分析用户能力提升体系作为转化抓手标签 指标相关性分析逻辑3)相关性排行根据相关性整理了分值排行,更能直观看到哪些影响因子的重要程度。Feature importance (gain)3.数据分析1)分析理论 卡方检验:着重观察值与理论值的偏离程度,选择的考虑主要是基于特征的二分类 问题和相互独立事件居多。 斯皮尔曼相关性分析:核心针对两个连续性变量且成线性关系,所以需验证其相关性。3500300025002000150010005002
8、)地域分析从地域人群量级和转化率上来看,整体手中人群集中在二三线城市,所以在产品 的投放和布局中,需针对等级进行策略规划。城市例子量top50转化率4000llllllllllllllllllllllllllllllllllllll一例子量转化率3)竞品分析卡方校验非常显著,从此指标可以看出,用户安装了竞品,直接可以筛选到核心的种子用户,因为该用户对此有强烈的潜在需求。4)留存分析这里的留存主要指用户来学习的次数,分析图标看,用户持续学习提现出对产品课程的认可性,非常有利于后续营销转化。s 一ae LL.0.230.850.8310.90.920.240.930.910.920.8510.28
9、0.920.930.910.850.230.850.8310.90.920.290.9810.830.930.910.2910.980.850.920.9310.290.290.230.280.24bl_transjmke_num -b l_f i rst_da y J i n ke_n u m -bl ocktra n s_f i n is h_n u m -block_trans_enter_num -block_first_day_finish_num -b I ock_f i rst_d a y a tte n d_n u m -is_buy_regular-lunulusc一JIAe
10、plJS=JIpo-qtunu llscM=SUB- xoo-qEnu*Aeplsu-qFeaturesCorrelation Meter-1.0 -0.5 0.0 0.5 1.04.训练模型1 )持续训练防止数据量稀疏和数据量较小(试用最大100w单元格),所以需要加大数据源的量级,加强预测能力,防止结果的偶然性。V1 Ready Add versionConversion Wish PredictionSelectBuildAnalyzePredictSelect a dataset to generate predictionsPredictionsSelect datasetQ Sea
11、rch predictionsDatasetRowsCreatedStatus04/20/2022 9:39 PM Readybatch Inter-Conversion Wish Predictioivh%e.csv-16 1,4092)模型调优调整不合理指标,防止特征穿越(比方浏览产品详情页,这种标签穿越特别严重, 其实在模型中做预测是不太可取,反而可以成为营销策略的用户标签)。对模型进行合理的剪枝规那么,增强模型可解释性(针对特别明细标签,进行归因和 聚合)。3)预测模型重新上传一组数据对模型进行预测,通过预测结果和本地训练集进行比对,准确 率在70%左右,整体来说已经不错了,后续可以加
12、大投入力度进行验证和训练, 尤其是双向结合的方式,效率会大大提高。Conversion Wish PredictionVI Ready (5) Add versionX ShareBuildAnalyzePredictModel status82.491The model predicts the correct Trans_core 82.491% of the time.PredictScoringImpact of active_day on prediction of trans.coreColumn impact。1 active.day二10.665%29.62%3 registe
13、r.time9481%4 totaLgmv8.68%5 channle8.511%6 ) retain_day 7.964%7 user lifetimeAll other classes 饵2444648104124144164184204active.dayOvorviowS N转化csvIII Total columns: 19 三 Total rows: 1,409 IS Total cells: 26,7716 trans.core Q 3+ category prediction四、推动数据策略数据分析也好、数据挖掘也罢,只是实现商业目标的手段,真正想赋能业务并且 驱动业务,一定要
14、从实际场景触发,找到切入点。策略一:提效1)用户分层根据用户的转化意愿预测值,进行用户分层,形成营销SOP清单,可以针对中 高意愿以上的的用户进行精准触达,对于大局部销售人员可以减少人工判断成 本,优先触达转化意向高的用户,合理分配时间和触达深度,并且可以制定标准 的SOP动作,大大提高运营效率。2)价值收益提高了 80%的人效,人效主要针对单个销售服务的用户比值。;今日必做;家访任务:头像用户A转化意愿:极高服务事项:1、重点讲解启蒙理念查看话术2、查看话术营销SOP动作策略二:抓手1)用户标签在营销工具中实时更新用户的高意向标签(沟通意愿强烈)或者策略标签(学习 能力画像:中),可联动知识
15、库进行组合式营销,为用户解决痛点,提供优质的 服务。比方:用户的能力画像中思维能力薄弱,那么可以根据用户在学习过程中哪 些思维题做的不好,引导用户如何针对性、系统化的提升,解决核心痛点。2)价值收益提高了 15%的转化率,转化率二购买年课用户/购买体验课用户。模型预测未报名过启蒙课用户沟通意愿强旅服务频次低于平均服务次数出勤率高,并使用扩展频次高 复习次数多用户累计完课频率高用户出勤率低推荐策略:转化意愿:极局沟通意愿强烈对课程的认可度高话术A百来d市布用户薄弱点:思维能力用户特征池营销管理后台五.参赛总结1e产品体验1 )用户体验产品设计样式上紫色的主色调非常符合当前互联网人的视觉喜爱,紫色
16、本来带有一些神秘 感觉,在加上机器学习的加持,整体样式设计很足,而且紫白结合很干净和简洁。产品交互体验流程很顺畅,用起来很方便,比方在模型全链条是以流式,从选择数据集- 构建模型-模型分析-模型评估,整体有从无到有的感觉,使用深度逐渐加深,比 较符合预期。产品友好功能细节上做的比拟出色,感触较深的第一是数据集的预览,这样可以直接看见 数据集的概览和样式,线上和本地会有数据解析的格式问题,第二个是模型的推 荐,会根据内容的选择推荐相对应的模型,有充足的解释性引导和应用例如。2)产品功能1 .模型构建:模型构建速度较快,这个有点超出预期。2 .模型评价:模型分析可以直接杳看到相关性已经数据更强的透
17、视能力,这个能力提 升了很多效率。3)优化功能1 .数据集兼容能力:这个针对不同数据源可以在上传做检验和预览,前置风险暴露能 力。2 .模型调优能力:增强平台对模型进行调优的能力,比方可以考虑多个特征因子的融 合、指标区间分析等。3 .数据源能力:可以把数据源的上传和存储考虑融合在产品内部。4 .现状痛点1 .营销运营的目标不够清晰和聚焦,人效较低。2 .很难快速掌握用户转化的核心痛点,转化率不高。5 .分析目标目前属于开掘的新业务,所以业务需要在招生分析的链路上,想要通过一系列的全面复盘和分析,核心提高转化率。二、分析思路所有的分析思路都应该以场景作为切入点,以业务决策为终点,因此本次工程梳
18、理了五个步骤:1 .挖掘业务含义2 .梳理用户行为路径3 .拆分场景特征4 .构建模型预测5 .推动数据决策1 .挖掘业务含义2 .心路历程参赛目标:首先想了解一下当前亚马逊的产品力;其次就是想在整个过程中梳理一 下分析思路,复盘工程可以增加更多的思考。 参赛总结:整体产品体验我觉得还不错,有一点超出预期,后续会持续关注产品, 也感谢人人都是产品经理提供本次参赛的机会用户画像基本信息姓名:小雅妈妈 工作:全职妈吗 学历:本科毕业 城市:二线城市用户旅程图:从用户角度出发,以用户调研和业务场景中发现用户在整个使用过程中的痛点和满意点,思考产品的增长点。目标愿景目标:培养孩子的启蒙兴趣竞品:对兴趣
19、启蒙有一些了解问题:面对市场上的众多产品,不知道哪一个更适合自己I 需求阶段I需求目标找到适合的课程留存转化裂变日常素质能力拓展二、APP学习页面捋续培养,到达能力提升三、APB程详情页推荐周围小伙伴-四、APP活动推荐|触达过程过程:1、获得推荐积分(推告2、提供给小伙伴(点:过程;1、课程挺吸引人的(翻开APP)2、课程必须有用(*看课程体系)3、体验课价格挺廉价(购买体验课)过程:1、课程需要用APP (下I1APP)2、需要填写宝宝信息(登录/注册)3、每日课程学习(课程中心)过程:1、需要持续的学习(翻开详情页)2、了解完整的课程体系(浏览详情页)3、平衡产品的价值(领取优惠券)情绪
20、曲线用户痛点过程:1、推荐双方的信任关另2、推荐奖励真的能领,过程:1、新品牌无品牌背书,缺乏基础2、课程体系是否足够吸引人3、师资能力的是否足够专业过程:1、课程内容是否足够吸引孩子2、孩子体物后有什么提升过程:1、担忧课程体系的质量2、整个周期学习后能带来什么收益3、产品价格有点贵解决方案1、加强主品牌联合营销2、可以挖掘主品牌流量池中二娃1、外化学习效果,形成比照2、加强活动运营,提升活跃1、形成学习能力画像,提升薄弱点2、根据转化节奏进行优惠券剌激1、新增推荐阶梯规那么用2.梳理用户行为特征1)路径拆解在用户旅程的大框架下,通过对用户行为数据的采集,监测获得的数据进行分析 可以让更加详
21、细、清楚地了解用户的行为习惯,将他们的目标、需求与商业宗旨 相匹配。2 )用户行为根据用户旅程的体验中,可以把用户分为三个阶段,其中包含:获客、留存、转 化,每个阶段的衡量反响出的分析目标和逻辑那么不同。分析目标阶段是否为目标用户获客是否和产品匹配留存是否认可产品价值转化3 .拆分场景特征1)相关性分析主要用于研究用户行为事件的发生对转化的影响程度,针对这一行为特征进行相 关性分析,确认导致该行为的影响因素和影响权重。2)梳理特征(定义数据集)涉及到原始的数据源,我们需要在亚马逊中找到S3的存储桶,将数据源文件传输至此。数据源(行为特征):第一版本共梳理了 70+特征因子,这一版本是通过产品
22、和业务的直觉梳理和转化有的相关性,通过模型在去做筛选和相关性分析。阶段行为特征获客地域信息、用户年龄、用户身份、设备属性、渠道来源、下载渠道等20+留存注册天数、竞品信息、是否加微、关注公众号、沟通意愿度、到课率、完课率等40+转化用户生命周期、用户RMF模型、用户类型、学习能力模型等10+S3存储桶:亚马逊的数据源需要借用S3存储桶服务。Amazon S3X存怖耿宗 对今lambda接入点 多区域接入点 批处理掾作S3的Access分析器此张户的“阻止公有访问设置 Storage Lens 控能面板 AWS Organizations功能聚焦Q适用于 S3 的 AWS Marketplace
23、 产 品 如何优化公能S3本钱.Amazon S3 存储桶 data demo 1data-demo!信空对象权限 指标 管理 接入点对象(3)对金星??储在MiazonS3中的谷本妄像.辔可以使用Amazon S3清单。获取存储中断将对盆鸵列表.妻允许其他人访问雌灼鱼.忽塞要明谕囱其近我用.了话更名。I I CjS3URI | I C 4制UR! | C 下筐| |翻开G3 | 删除|操作 | |创立文件臾一Q按龌案亘找对今国上传B名际美矍V上次修改时向V大小V存话类QD 侪仔案iSBSS.csvCSV2022K月 20日 pm 1:24:05 CST9.5KB标准LB N%化CSV2022
24、年4月 20日 pm7:56:46 CST122.2KBtfjvttB new造化声区预测.csvCSV20220月 20日 pm 1:26:53 CST23.1MB标准数据集:S3存储桶中数据源可以直接同步至画布的数据集,并且可以针对数据预览数据,这点两个功能点很棒,因为正式预览才发现数据源乱码的问题。N转化.CSVPreviewing first 100 rowsagestudy.levolprovincecitycityjcvdrolemobile.osmobilo.phonecompoitor63四JI僮资阳市55androidV2020CA021四Jilts乐山市45androidV
25、CE-ALOO052四JI僮成都市15androidMl 8 Lite131四修成都市11androidM2002J9E152四JlHi曲充书45androidJMM-TL10063QJIIW岩山市51androidLenovo TB-J606F152四Ji信成都市11androidVRD-W09073QJHW达州市41iosU36131四JI僮成都市15androidvivo X9s Plus052四后自贡市45androidART-ALOOx042四JI僮宜宾市45androidRedmi Note 7052叫他黑阳市35androidiPad mini 5063B/HW达州市4siosP
26、ACM001ImportC Upload* S3Add conChoose files to importAmazon S3 / data-demo1Q Search Amazon S3NameLast updated J台 N4化csv04/20/2022 7:56 PM由 nec转化摩预测x$v04/20/2022 126 PM自例子发通质量.CSV04/20/2022 124 PM1 new datasetPreview allCancel三、构建模型预测1.构建模型第一步:直接就选择上传的数据集就ok 了,这一步非常的简单。. Amazon SageMaker Canvas(9) Mo
27、dels:= DatasetsConversion Wish Prediction Ready Add versionmk ShareSelectBuildAnalyzePredictSelect datasetYou can import a tabular dataset or choose one that has already been imported. Your dataset must contain at least one input column and a target column.NameSourceColumnsRowsCreatedStatusN转化.CSV1.
28、40928,18004/20/2022 7:57 PM Ready HelpH Account第二步:选择预测的指标很好理解,关键点在于模型的选择,转化预测本质是一 个二分类的问题,预期是0-1的一个概率值,实战中选择的【xgboost】模型进 行预测,通过和转化率强相关的因子和转化预测分层进行后续的营销策略。这里的模型选择会根据我的数据集推荐模型,也会有一些内容的引导,不过 other的模型有的不可选择,所以默认使用推荐的模型,看下初次效果。j Amazon SageMaker期 CanvasG) Models:= Datasetstrans_precitonShare HelpH Acco
29、untSelectBuildAnalyzePredictModel typeSageMaker Canvas automatically recommends the appropriate model type for your analysis.9 3+ category predictionYour model classifies trans.core into 3 or more categories.Change typeQuick buildPreview modelQ Search columnsColumn name JData typeMissing。Mismatched。
30、Unique Mean / ModeCorrelation tQuserjifetimeNumeric0.00% (0)0.00% (0)1050.004trans.coreTargetNumeric0.00% (0)0.00% (0)5170Qtotal_gmvNumeric0.00% (0)0.00% (0)1552,0480096Qtotalfinish_cntNumeric0.00% (0)0.00% (0)7800008N 转化.CSV= III Y 1=还没有建模时候可以简单对目标的相关性做个分析比照。trans_precitonV1 Draft Add versionL Shar
31、eBuildAnalyzePredictQuick buildPreview modelSelect a column to predictChoose the target column. The model that you build predicts values for the column that you select.Target column trans.coreModel typeSageMaker Canvas automatically recommends the appropriate model type for your analysis.9 3+ catego
32、ry predictionYour model classifies trans.core into 3 or more categories.Change typeQ Search columnsN 转化.CSV= III Y 三Column nameData typeMissing Mismatched Unique Mean / ModeCorrelation tstotal_finish_cntNumeric0.00% (0)0.00% (0)7800.008QchannleCategorical0.00% (0)0.00% (0)11appstoreN/AQcityjevelNume
33、ric0.00% (0)0.00% (0)730.057total_gmvNumeric0.00% (0)0.00% (0)1552,0480.0962.模型表现1)模型能力处理速度:模型个处理速度在耗时3min左右,还是蛮快的,比拟超出预期。餐Conversion Wish PredictionviSeltBuildAnalyzePredict:= Model overviewExpected bwld time 2-15 minutesBuild typeQuick buildDetailed progressGenerating column impact模型得分:模型分数和预期(70-80 )相比会较高一些,可能由于数据量级较小,造成数据得分偏高;自建模型训练环境中的Fl=0.78、AUCH.85。