ImageVerifierCode 换一换
格式:DOCX , 页数:8 ,大小:15.79KB ,
资源ID:4743202      下载积分:5 金币
验证码下载
登录下载
邮箱/手机:
图形码:
验证码: 获取验证码
温馨提示:
支付成功后,系统会自动生成账号(用户名为邮箱或者手机号,密码是验证码),方便下次登录下载和查询订单;
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/4743202.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

开通VIP折扣优惠下载文档

            查看会员权益                  [ 下载后找不到文档?]

填表反馈(24小时):  下载求助     关注领币    退款申请

开具发票请登录PC端进行申请。


权利声明

1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4009-655-100;投诉/维权电话:18658249818。

注意事项

本文(数据科学家的五大黄金法则.docx)为本站上传会员【二***】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4009-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

数据科学家的五大黄金法则.docx

1、数据科学家的五大黄金法那么近些年来,数据科学家这一岗位已经变得越来越炙手可热,也吸 引了大批年轻人涌入渴望在激烈的竞争中抢占一席之位。各个网 络平台上都已经有无数干货数据科学行业的简历、求职、面试教 程,但是很显然成为一位优秀数据科学家的旅途不会因为求职成 功就结束。收到offer仅仅只是第一步。 我在麦肯锡咨询公司的那些年,很荣幸能跟许多厉害的数据科学 家以及各行各业的顶尖公司合作。我从中也受益匪浅,并从长期 实践和观察中总结出来许多数据科学界的经验和体会。你可能会 觉得震惊的一个事实就是:最优秀的数据科学家不是那些会用各 种新奇模型或者代码写得很好的,事实上,真正优秀的数据科学 家是掌握

2、了丰富理论知识的同时还拥有各种“软知识”的人。 因此,这篇文章总结了我在麦肯锡的学到的成为优秀数据科学家 的五大关键准那么。 1.使用金字塔原那么沟通是成功的钥匙 巴巴拉・明托的金字塔原那么是一项层次性、结构化的思考、沟 通技术。这项原理被视为最有效率的信息沟通方式,并且被广泛 运用于公司、企业、甚至个人生活中。金字塔原那么背后的原理很 简单:当你想要交流某个观念或想法的时候,最高效的方法:1. 结论先行2.以上统下3.逻辑递进使用金字塔原那么进行沟通有以下两个优点: 1 .不管你的实际内容有多深奥,使用金字塔原那么可以帮助你 的听众更好理解你的观点。通常学术论文、或企业报告的开 头都会

3、有个摘要,总结整篇文章或材料的中心思想。这样的作法可以确保读者在没方法理解、记住所有文章细节的情况 下,也能理解其核心思想。 2 .金字塔原那么可以帮你适当节省下为不同观众群体准备不同材 料(比方演讲ppt)的时间。你可以运用金字塔原那么做一份你所 要展示的问题的核心思想的演讲材料,针对不同受众群体适当补 充他们所感兴趣的细节和论点。 对于大局部数据科学家而言,由于他们本身的工作大局部时间都 在关注细节、深挖可分析的点,金字塔原那么可能看上去并不那么 适用。事实上,我也经常看见许多数据科学家在演讲中并未采取 金字塔原那么,先从细节开始讲起,而这些演讲的效果也并不好, 观众们很难快速理解到他

4、们的核心思想和问题所在。 如何练习/提升:最简单的方法就是在一切最开始前先根据金字 塔原那么写下自己的结论、论点、和逻辑递进,并在沟通过程中参 照自己最开始前写下的内容确保自己没有跑题。时不时地反问自 己一些问题(类似于中心结论和问题到底是什么,问题真的被解 决了吗)也可以确保你走在正确的道路上。 2 .你是数据的“翻译官” 如果你看麦肯锡的企业蓝图 s:// mckinsey. com/industries/finaneial-services/our-insights/b ui 1 ding-an-effecti ve-analytics-organi zation?

5、你会发现上面强调 了 数据的”翻译官“这个角色的重要性。数据的“翻译官”的也可 以理解为企业与数据中心之间的沟通桥梁,需要把一个个数据分 析的结论和观点翻译成实际可行性方案。我相信一个数据科学家 肯定被问过以下问题:可以请你用大白话或清晰易懂且非专业性 的语言解释一下你的观点和结论吗?因此,一个数据科学家应该 具备把专业性极强的机器学习模型用清晰易懂的语言解释给CEO 或者任何非专业背景的听众的能力,并且同时也应该具备把自己 的结论观点翻译成企业实际可行性方案的能力。 具备这些能力有以下优点: 1.不具备专业背景的人很难成为数据的“翻译官”。麦肯锡曾 经尝试过很多方法去培训战略顾问成为“翻

6、译官”,但是在我看 来,从未成功过。失败的原因很简单:一个人必须具备足够的专 业背景和分析能力才能精准地解释那些复杂的数据分析背后隐 藏的意义,而丰富的专业背景和杰出的分析能力都不是短期的培 训就能培养出的能力。举个例子,如果你并不理解k均值聚类背 后的数学逻辑和原理,你没方法清晰解释为何要这么选这个数字 作为你的k值而不是其他数字。而作为一个数据科学家,与其花 费时间向那些非专业人士解答他们难以理解的专业术语和原理, 不如想方法用清晰易懂的话语“翻译”给他们。2.如果数据科 学家可以自己解释自己的工作成果,可以大幅度防止信息在传播 过程中导致的扭曲和失真。我相信大局部人都玩过传话游戏,传 播

7、过程越长,涉及的人数越多,信息越容易在传播过程中被扭曲、 误传。这种情况也同样适用于数据科学家的日常工作中,如果你 通过别人来“翻译”你的工作成果,你很难保证当信息传播到终 端用户的时候跟你最开始想要传达的没有一点偏差。 如何练习/提升:找一位身边的朋友(最好是非专业人士),向 他解释你的模型和数据分析结果。在解释的过程中,如果你发现 你不知道如何把一个概念用清晰易懂的方式表达出来,大局部情 况下是因为你并没有完全掌握这个概念。因此,这个练习也是一 个很好的查漏补缺的机会。 3.时刻把解决实际问题放在第一位 这一黄金准那么并不只限于数据科学家,事实上,“时刻把解决实 际问题放在第一位”适

8、用于任何行业中的任何职位。发现问题并 提出问题的能力尤为重要,而更重要的是有解决问题的能力。如 果没有时刻把解决问题放在第一位,开会讨论的时候经常会陷入 一个怪圈:过度关注于问题本身而不是想方法去解决问题。 在我看来,大局部顶尖咨询公司都奉行“时刻把解决实际问题放 在第一位”的准那么。作为一个数据科学家,你可能经常会因为不 具备专业背景的同事提出一些在你看来很可笑的稀奇古怪的问 题或需求而感到懊恼。我见过许多数据科学家们在这种情况下束 手无策,直接拒绝他们的需求。比起直接拒绝,更好的做法是运 用自己的分析能力和专业背景帮助他们重新定义问题所在并想 方法切实地解决他们的问题。 “时刻把解决实

9、际问题放在第一位”并不意味着你不能在工作中拒绝任何需求。事实上他意味着每当你拒绝后,你可以紧跟着 提出“或许……做可以解决你的问题吗? ” 如何练习/提升:当你遇到问题时,在跟同事沟通讨论前,先自 己花时间想一想如果是你的话你会如何解决。面对问题时,多运 用你的创造性思维开掘新的解决方案,不要害怕做那个提出新的 解决方案的人。有时候换位思考的能力也很重要,尝试着以整个 公司或者其他业务部门的角度去思考他们会如何解决这个问题。 从大局出发思考,有时候也会带来意想不到的解决问题的方 案。 4 .有时候可以为了模型的可解释性而适当牺牲模型的准确 率。 没有人真的想精准预测出结果,所有人都只是在

10、尝试分析、理解 结果。当一个企业想要建立模型去预测出未来客户流失数时, 大局部情况下,人们都忘了在第一时间问为什么我们需要预测客 户流失数。企业想要预测出某些结果是因为他们可以提前采取措 施应对以防止损失。所以当你的模型告诉CEO ”在预测客户流 失数里网站访问量的立方根是最显著的特征”意味着什么呢? 很可能在他看来毫无意义。 作为一个数据科学家,我以前也经常过度追求模型的准确性。但 是我逐渐意识到了通过添加一些无法解释、没有意义的变量;或 者调参仅仅只是为了把准确率从96%提高至98%对整个公司来说 并没有太大的意义(当然,这个观念仅仅只适用于业务导向的数 据科学家们,对于其他领域的机器学

11、习工程师而言,模型准确率 可能极其重要)。 对于大局部高管和业务部门来说,如果你无法解释你的模型和模 型的结果,那你的模型可能在他们眼里看来并没有那么可靠。模 型只是为了辅助他们去更好地做出商业决策,所以模型更大的意 义是可解释性而不是准确率。如何练习/提升:当你在建模或 做数据分析时,时刻反问自己“这会如何影响公司呢”。建模过 程中,尽量防止放一些随机、意义不大的交互特征。当你的模型 或分析有结果后,可以根据结果具有针对性地写下对公司的建设 性意见,这样的作法也会帮助你更好的评估自己的模型是否适 用。 5 .在开始前,确保自己有个假设场景,但是不要仅局限于 一个假设。 在开始任何分析工

12、作之前,设立好自己将要分析的假设场景尤为 重要。如果不设立好分析背景,你可能在前期数据处理、EDA或 者是如何选择特征时一头雾水。如果没有任何假设,AB测试也 没方法进行。尽管提前设立好自己的假设如此重要,我也见过没 有提前设立好假设就开始处理问题的数据科学家。在这种情况 下,数据科学家们往往把设立假设这个关键任务丢给了缺乏专业 背景的业务部门,而他们往往会因为缺乏一些专业背景和对数据 的熟悉设立一些实际工作场景中无法检验的假设。因此,在我看 来最好的做法是数据科学家们在一开始就应该参与到设定假设 的过程中去指引他们哪些是可尝试的而哪些是无法尝试的。 设立假设尤为重要,因为它是一切的起点,但

13、是这并不代表设立 好一个假设后就万事大吉了。我经常看见许多数据集科学家们过 于执着于一个假设,尽管这个假设带来了自相矛盾的结果。太过 于执着于一个假设可能会导致为了满足这个假设而去人为的更 改一些数据或进行一些影响准确率的操作。如果你听过辛普森悖 论,那你一定很清楚数据是具备撒谎的能力的。一个好的数据科 学家应该把数据可靠性放在第一位,因此不要仅仅只局限于一个 假设。如何练习/提升:设立假设是具备业务思维和敏锐度尤 为重要。有了假设之后跟着你的假设去进行数据探索,但是当数 据呈现出与你的假设相反的结果时,也不要过度执着于自己一开 始的假设。 人们通常把人才分为两种:战略性人才和分析性人 才,这样的分法就好像在暗示一个人无法同时拥有这两种能力。 但是事实上,一般最好的分析性人才恰恰是那些能理解公司战略 性政策和想法,并且懂得如何和业务部门沟通的人。而最好的战 略性人才也恰恰是那些具备足够数据分析能力的人。

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服