单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,数据标注训练,人工智能的定义,人工智能(,Artificial Intelligence,),英文缩写为,AI,。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。,人工智能应用领域,人工智能学习的过程,不断地用标注后的数据去训练模型,不断调整模型参数,得到指标数值更高的,模型。,什么是数据标注,标注是对未处理的初级数据,包括语音、图片、文本、视频等进行加工处理(如标识发音人性别,判断噪音类型等),转换为机器可识别信息的过程,。,提供标注服务的厂商,,叫做,人工智能基础服务供应商。,数据标注中的角色,数据标注部分,可以分为,三,个角色,标注员,:标注员负责标记数据。,审核员,:审核员负责审核被标记数据的质量。,管理员,:管理人员、发放,任务。,只有在数据被审核员审核通过后,这批数据才能够被,算法学习利用,。,数据,标注(数据处理)的业务分类,数据,审核,:,色情,审核,、,暴恐,审核,、,政治敏感,审核,、,违禁敏感,审核,、,广告,审核,、,灌水谩骂,审核,数据清洗:对于杂乱的、有错误的数据进行分类、归纳及重新排列和存储,。,数据标注,不漏,标,正确标注,理解需求,标注原则,账户,:姓名,全拼,密码:,123456,