1、DeepSeek,赋能数据分析,日期,:2025,年,3,月,20,日,1,Deep,S,e,ek,大模型初步,2,Deep,S,e,ek,本地部署,3,使用Deep,S,e,e,k,+,提示词,进行数据处理,目录,COMENTS,4,使用,DeepSeek+Excel,进行数据处理,01,DeepSeek,大,模,型,初,步,大语言模,型,LLM,引发AI,新热潮,大语言模型(,Large,Language,Mode,,,LLM,),,也称预训练模型,(Pre-Trained,Model,PTM),,是一种人工智能模型,旨在理,解和生成人类语言。它们在大量的文本数据上进行训练,拥有几十亿的
2、参数,可执行广泛的任务,包括文本总结、翻译、情感分析 等,等。,通用人工智,能,AGI,技术,发,展趋势,Chatbot,自然语言对话,Reasoner,基本的推理和 问题解决能力,Agent,代表用户执行基 本任务,具备自 主行动能力,Innovator,参与发,明,和创,造,,增强人类的创造 力和创新能力,Organization,承担整个组织的 功能,独立管理 并执行复杂的操,作,Sam,Altman,:,AGI,发展的五个阶段,当前处于推理,者,阶,段,,正,在,向,智,能,体,阶,段,发展,DeepSeek,R1,推,理,模型,开,辟,了,中,国,低,成,本,开,源,路,径,,,引,
3、爆,市场,生成模型,推理模型,DeepSeek,R1,OpenAI,o1,OpenAI,o3-mini,Gemini,2.0,Grok3,Kimi,1.5,OpenAI,GPT4o,DeepSeek,V3,BERT,Gemini,Qwen2.5,智能体,自动驾驶机器人,(当前,L3,),具身智能机器人,Manus,MetaGPT,DeepSeek,公司,DeepSeek,,,全,称,杭州,深,度,求,索,人,工,智,能,基,础,技,术,研,究,有,限,公,司,。,DeepSeek,是,一,家 创新型科技公,司,,,成,立于,2023,年,7,月,17,日,,,使,用,数,据,蒸,馏,技,术,,
4、得,到,更,为,精,炼,、,有用 的数据。由知,名,私,募,巨头,幻,方,量,化,孕,育,而,生,,,专,注,于,开,发,先,进,的,大,语,言,模,型,(,L,LM,),和相关技术。,DeepSeek:,来自东方的神秘,力,量,梁文锋,男,,1,9,8,5,年,出,生,,,广,东,省,湛,江,市,吴,川,市,覃,巴,镇,米历,岭村人,浙江,大,学,毕,业,,拥,有,信,息,与,电,子,工,程,学,系,学,士,和硕 士,学,位,,,杭,州,幻,方,科,技,有,限,公,司,、,DeepSeek,创,始,人,。,2008,年起,,,梁,文,锋开,始,带,领,团,队,使,用,机,器,学,习,等,技
5、术,探,索全,自动量化交易,,,在,七,年当,中,资,金,规,模,从,8,万,元,增,长,到,5,亿,元,。,2015,年,,,幻,方,量,化,正,式,成,立,。,2016,年,,,幻,方,量,化,推,出,第,一,个,AI,模,型,,,实,现,了,所,有,量,化,策,略,的,AI,化,转,型,。,2019,年,,其,资,金,管理,规,模,突,破,百,亿,元,。,2020,年,开,始,,,幻,方,的,AI,超,级,计,算,机,“,萤,火,一,号,”,正,式,投,入,运,作。,2021,年,,,幻,方,投,入,十,亿,建,设,“,萤,火,二号,”,,搭,载,了,一,万,张英,伟,达,A100,显
6、卡,,资,产,管,理,规,模,突,破,1000,亿,元。,2023,年,7,月,,,幻,方,量,化宣,布,成,立,大,模,型,公,司,DeepSeek,,,正,式,进,军,通,用,人,工,智,能,领,域,。,2024,年,5,月,,DeepSeek,发,布,了,DeepSeek-V2,;,同,年,12,月,27,日,,,DeepSeek-V3,面,世,。,这,款,性,能,优,越,且,性,价,比,极,高,的,大,语 言模型,被硅,谷,同,行,誉为,“,来,自,东,方,的,神,秘,力,量,”,。,2025,年,1,月,20,日,,,DeepSeek,正,式,发布,DeepSeek-R1,模,型,
7、同,日,,,梁,文,锋,参,加,了,总,理,座,谈,会,。,2,月,17,日,,梁文锋参加了,总,书,记,主持,的,民,营,企,业,家,座,谈,会,。,梁,文,锋,凭,借,约,1260,亿,美,元,(,约,合,人,民,币,9000,亿,元)的个,人 财,富,估,值,问,鼎,中,国,首,富。,DeepSeek,大模型发展历程,DeepSeek,成,立,2023,年,7,月,2024,年,1,月,2024,年,5,月,2024,年,9,月,2024,年,12,月,2025,年,2,月,2024,年,11,月,2025,年,1,月,发布首个大模 型,DeepSeek LLM,宣布开源第二代,MO
8、E,大模型,DeepSeek,V2,推理模型,DeepSeek R1-,L,i,t,e,预览版上线,正式发布,DeepSeek,R1,模型,,在大模型排名,Arena,中列第三名,推出,D,e,e,p,S,e,e,k V2.5,DeepSeek,V3,发布,并同步 开源模型权重,DeepSeek,开 源,G,E,MM,等核 心代码,DeepSeek,7,天实现,1,亿用户,成为增长,最,快的,超,级产品,DeepSeek,大火的原因:核心,能,力突,破,、开,源,、超,低,成本,、,国产化,DeepSeek,大模型核心技术突破,实,现,复杂,推,理任,务,的精准 处理与高效执行,覆盖,多,模态
9、场,景应,用,。模,型,综合,性,能跃 居世界第一梯队,技术,指,标与,顶,尖大,模,型相,比,不相,上,下。,DeepSeek,V3,可以对标,GPT-4o,,但,训,练成,本,只有,558,万 美元,不到后者的二十,分,之一。,DeepSeek R1,在数据、代码和推理任务上课,对,标,OpenAI,o1,。,相 比 于,OpenAI,的 闭,源,策 略,,DeepSeek,全量开源训练代码、数据 清洗工具及微调框架,,开,发者,可,以快,速构建教育、金融、医,疗,等垂,直,领域 应用,推动协同创新。,开展大量模型架构优化,和,系统,工,程优 化,训,练,成本,显,著低,于行,业同类,模
10、型,打破高价壁垒;推理成,本,降低,83%,,,API,定价为行业平均价格,的,1/10,,,千,亿参数模型适配中小企,业,需求,,,加速 商业化落地。,将国产模型与美国的代,际,差距,从,3-5,年,缩短至,3-5,个,月,,,突,破卡,脖,子,技,术,瓶,颈,,,全面支持国内产业智能,化,升级。,开源,超低成本,国产化,DeepSeek,通,过,核,心能,力,突,破,+,开,源,、,低,成,本,、,国,产,化,三,大,优,势,,,推,动,AI,技,术,平,权,和,国,产,AI,生,态,繁,荣,,,成,功 进入全球大模,型,第,一,梯队,,,促,使,行,业,从,唯,规,模,论,向,性,价,
11、比,、,高,效,能,、,工,程,化,方,向,转,变。,核心能力突破,02,DeepSeek,使用,方式,DeepSeek,使用方式,A,P,I,调用,API,调用,:DeepSeek,、硅 基流动、阿里百炼、火,山,引 擎等。获取,API,秘钥调用,适合开发者集成。,直接使用,电脑,端,访问官网,(https:/chat.deepse,e,k,.com)或第三方百度 搜索、腾讯元宝等,手机端下,载,DeepSeek,App,本地部署,个人部署:个人在本地,设,备 运行应用,依赖自身资,源,。,企业部署:企业内网搭,建,私,有化系,统,,支,持多,用户协,作,,,数据更加安全。,一体机:直接购买
12、部署了,D,e,ep,S,e,e,k,模型的具备一定 算力的一体机。,DeepSeek,私有化部署,大模型私有化,部,署,方,式:,Ollama,部署:,个,人,本,地,部,署,,,方,便,快,速,,,适,用,于,蒸,馏,模型,vLLM,部署:生产、开发、,垂,直,领,域,私,有,化,部,署,,,精,度,可,控,,,更,专,业,其他,推理模型,基座模型,特点,DeepSeek-R1-Distill-Qwen-1.5B,Qwen2.5-Math-1.5B,蒸馏模型,能力稍弱,实际上是增加了推理能,力,的,Qwen,模型和,Llama,模型,DeepSeek-R1-Distill-Qwen-7B,
13、Qwen2.5-Math-7B,DeepSeek-R1-Distill-Llama-8B,Llama-3.1-8B,DeepSeek-R1-Distill-Qwen-14B,Qwen2.5-14B,DeepSeek-R1-Distill-Qwen-32B,Qwen2.5-32B,DeepSeek-R1-Distill-Llama-70B,Llama-3.3-70B-Intruct,DeepSeek-R1-671B,DeepSeek-V3-Base,满血版,能力,最,强,硬件配置最低要求,模型简称,CPU,要求,内存要求,GPU,要求,硬盘空间,适用场景,1.5B,4,核(,Intel/AMD,
14、8GB,无(纯,CPU,),或,2GB,(,GPU,加速),3GB+,旧笔记本电脑,简单文本生成,7B,4,核(多线程支持),16GB,4GB,8GB+,本地开发测试,轻量级,NLP,任务,8B,6,核,16GB,6GB,8GB+,代码生成,逻辑推理,14B,8,核,32GB,8GB,15GB+,企业级文本分析,长文本生成,32B,12,核,48GB,16GB,19GB+,复杂场景对话,深度思考任务,70B,16,核(服务器级),64GB,24GB,(多卡),70GB+,创意写作、算法设计,671B,32,核(服务器集群,),128GB,80GB,(,4,张,A100,),300GB+,科
15、研级任务,,AGI,探索,最,低,配,置,指,模,型,可,以,运,行,,,但,流,畅,度,稍,差,。,硬件配置推荐要求,模型简称,CPU,要求,内存要求,GPU,要求,硬盘空间,适用场景,1.5B,6,核(现代多核),16GB,4GB,(如,GTX1650,),5GB+,实时聊天机器人、物联网设备,7B,8,核(现代多核),32GB,8GB,(如,RTX3070,),10GB+,文本摘要、多轮对话系统,8B,10,核(多线程),32GB,10GB,12GB+,高精度轻量级任务,14B,12,核,64GB,1,6G,B,(如,R,T,X409,0,),20GB+,合同分析、论文辅助写作,32B,
16、16,核(,如,i9/R,yz,en,9,),128GB,2,4GB,(如,R,T,X409,0,),30GB+,法律,/,医疗咨询、多模态预处理,70B,32,核(服务器级),256GB,40GB,(,如,2,张,A100,),100GB+,金融预测、大规模数据分析,671B,6,4,核(服务器集群),512GB,160GB,(,8,张,A100,),500GB+,国家,级,AI,研究、气候建模,推,荐,配,置,指,模,型,可,以,流,畅,运,行。,个人推荐使用方式,入门级:直接使用方式对于个人来,说,最为,方,便,,需,要联,网,。,进阶级:个人可以在本地部署小规,模,蒸馏,模,型,,比,
17、如,1.5B,、,7B,,建,议,使,用,Ollama,来部署。,进阶级:个人可以在部分工具(比,如,Excel,)中调,用,API,。,03,使用,Deep,S,e,e,k,+,提示,词进行数据处理,DeepSeek,提示词技巧:通用,公,式,任务,背景,目标,负面限定,M1,M2,M4,M3,做什么,给谁用,期望效果,担心的问题,内心戏很多,DeepSeek,提示词技巧:通用,公,式,我要,做,XX,X,,要,给,XXX,用,,希望,达到,XXX,效果,,但,担心,XXX,问题,例如:我要做,一,个,山,东三,日,游,攻,略,,,给,大,学,生,用,,,希,望,行,程,充,实,有,趣,,,
18、但,担,心,预,算,不,够,影,响,体,验,。,深 度,思 考,正 式,回 答,DeepSeek,赋能数据分析过程,问题,定义,数据,收集,数据,预处理,数据,分析,数据,可视化,报告,撰写,01,02,03,04,05,06,DeepSeek提供强大的,数据诊断功能,帮助用 户识别缺失值、异常值 和重复数据等问题,提 供数据质量报告。,DeepSeek可以开展标 准化、归一化处理,自 动填充缺失值和标注关,键变量影响因子,。,DeepSeek可以帮助用 户快速收集和处理大量 数据,生成数据提取脚 本,支持从各种来源导 入数据,包括,Excel,文 件等,DeepSeek,提供了丰富的 统计分
19、析功能,包括描述 性统计、回归分析、聚类 分析等。用户只需输入相 关数据,DeepSeek,即可 自动进行分析,并生成详 细的统计报告,用户可以将DeepSeek 的分析结果与Power,BI,等工具结合,进行数,据可视化,从而更直观,地展示分析结果,自动生成专业的分析报 告。报告中包含数据概,览、分析结果、可视化,图表等,DeepSeek,赋能数据分析的四,种,方式,提示词工程,Excel,、,PowerBI,嵌入,DS,模型,Data,Agent,C,h,atBI,场景,1,:数据清洗,核心价值:,清洗耗时从,3,小时,1,分钟,,,准确,率,100%,。,核心痛点:,用户行为日,志,中3
20、0%,字,段缺,失,,且,存,在异,常,值,,例,如:,异,常时,间,戳(,如,:2999-01-01)。,传统方式:,手动写,Python,逐行,排,查,,耗,时易,错,。,DeepSeek,操作,步骤一:输入提示词。,请修复以下数据的质量问题:,1.缺失值:用前向填充补全,user_id,device_type,用“未知”填充 2.异常值:删除,timestamp,超过当前时间的数据行,3.格式统一:将,price,从字符串“$12.5”转为数值“12.5”,步骤二:生成代码。,#,DeepSeek,生成代码,dfuser_id.fillna(method=ffill,inplace=Tr
21、ue),dfdevice_type.fillna(,未知,inplace=True),df,=,dfdftimestamp,详,情,页,流,失,率,上,升,25%,(,页,面,加,载,时,长,增,加,3,秒),加购,-,支付失,败,率,上,升,18%,(,因,优,惠,券,校,验,接,口,超,时,),数据分,析,DeepSeek,提问技巧,为什么你的提问总得不,到,答案?,DeepSeek,提问错误示范:,“分析下销售数据,”AI,会陷入迷茫,该提问违反了,AI,分析三要素:,目标不明确:,未说明是诊断问题/预测趋势/制定策略,范围缺失:,无时间范围、品类限定、指标定义,方法模糊:,未指定分析框
22、架或验证标准,DeepSeek,提问正确公式,问题要具体:,女装9月销售额同比下跌,37%,的核心动因是什么?,提供数据要具体完整:,周维度经营数据、竞品活动日历、行业大盘,明确数据计算方法:,要求用三层归因模型,+,贝叶斯验证,+,库存衰减曲线分析,场景,3,:数据可视化,核心需求:,向,管,理,层,展,示,各,地,区,销,售,占,比,及,趋,势。,DeepSeek,操作,步骤一:输入指令。,用渐变红色系,绘,制:,饼图显示华东,/,华,南,/,华北,占,比,折线图叠加显,示,近,12,个,月,增,长,率,标注华东,Q4,异,常,值,情况,(,疫,情,封,控,),步骤二:输出结果。,输出,M
23、atplotlib,代码,执行,04,使,用,DeepSeek+E,x,cel 进行数据处理,ChatExcel:,在线完成,Excel,表格,和,数,据,处理,ChatExcel(,北大团队开发),用简单,的,对话,聊,天交,互,来完,成,Excel,表格和数据的,处,理 官网,:htt,ps:/w,ww,.cha,tex,下载对应版本(支持,Office,2016及以上),双击安装包,勾选“我接受协议”,安装路径保持默认,完成 重启,Excel,顶部菜单栏出现,“,OfficeAI,”,按钮,请计算销售额,环,比,百,分比,并,更,新,到,F,列,请,计,算,销,售,额,的,中,位,数,请计算客单价,的,中,位,数,






