1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,.,*,机器学习基础,1,.,引言,什么是机器学习?,让机器“学习”的技术,指令工作,数据工作,例子:,约会,机器学习方法:,利用已有的数据,(,经验,),,,得出了某种模型,(,迟到的规律,),并利用此模型预测未来,(,是否迟到,),2,.,引言,机器学习的定义:,例子:,房价,:,房价面积,a,b,关键概念:,训练,模型,预测,训练集和测试集,3,.,引言,机器学习的定义:,广义:,一,种能够赋予,机器学习,的,能力,以此让它,完成直接,编程,无法,完成的,功能,的,方法。,实践:,一,种通过利用数据,
2、训练,出模型,然后,使用,模型,预测的一种方法。,4,.,引言,机器学习的范围:,模式识别机器学习,数据挖掘机器学习数据库,统计学习和机器学习,计算机视觉图像处理机器学习,语音识别语音处理机器学习,自然语言处理文本处理机器学习,5,.,算法分类,不同类型应用场景:,回归:,预测鲍鱼的年龄,随着,时间波动的股票,价格,6,.,算法分类,不同类型应用场景:,分类:,电影题材归类,垃圾邮件,7,.,算法分类,不同类型应用场景:,聚类,对地图上的点进行聚类,人脸识别,8,.,算法分类,不同类型应用场景:,关联分析,啤酒和尿布,Twitter,源共现词,9,.,算法分类,经典算法分类:,学习方式:,
3、监督学习,非监督学习,半监督学习,10,.,算法分类,经典算法分类:,功能分类:,11,.,算法选择,如何选择合适的算法:,12,.,算法选择,如何使用算法:,13,.,工具的使用,机器学习常用的工具:,R,语言,linux,版和,windows,版,强大的算法包,可移植性比较好,Matlab,windows,版比较强大,可移植性是个问题,版本问题比较严重,Python,Numpy,、,statsmodels,、,scripy-learn,、,pandas,spark,分布式框架,mllib,14,.,建议,看懂一个例子开始;,算法的重试;,参数的选择;,没有最好,只有更好。,推荐书目:,机器学习,(周志华),R,语言初学者指南,机器学习实战,15,.,Thank you!,16,.,