1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,数据可视化课程建设经验交流,陈 为,chenwei,新浪微博:浙大陈为,浙江大学计算机学院CAD&CG国家重点实验室,课程背景,以归纳介绍核心的信息可视化原理为主,覆盖最重要、基础的数据可视化知识点,每个知识点辅之以案例和伪代码,并以,D3/Processing,等开源软件为基础平台设计课程作业。,课程设计,课程主旨,组织和提供一个学习数据可视化的环境和氛围。,已经知道如何进行程序设计的同学,加快各位同学的学习进程,对数据可视化
2、感兴趣的同学,学会数据可视化应用的沟通和交流,科技人员和艺术家的思维方式不一样,推荐以技能实践为主的学习方式,从实例(,samples,)中快速起步,Project-based learning,教学目标,基本了解和掌握数据可视化的基本原理,开发流程,组织开发理念,可视化内容相关的知识要点,对数据可视化的某一个方面达到较高水准,“,想,”,到,“,做,”,到,更强调努力去,“,做,”,“,从我做起,从现在做起,”,教学方法:课题讲授,搜集数据可视化当前研究热点和动向,介绍基础知识和前沿研究情况,又分析具体案例。,课堂内包含相当多的实例(配以交互的动画、视频),每个实例能讲述一个故事,启发学生观
3、察和思考能力。,教学方法:动手实践,课程中期,公布微博、世界经济统计数据、手机通信等实际数据,作为大程作业让学生们动手设计可视化方案、编程实践可视编码、交互和可视化呈现实践。,在最后一节课后公开发布最好的可视化设计方案,并予以奖励。后续跟进,争取转化为科研项目和论文。,课程考核,没有书面考试,评分分为,2,个部分,每个部分分数分配如下:,3,个技术片断的程序编写:,60%,空间数据的可视化,非空间数据的可视化,高维数据的可视化,每个人独立完成,推荐使用,D3,Processing,采用特定的数据,查看,js,代码。,课程考核,基本完整的项目大程:,40%,提前布置三组数据,学员将以大组为单位完
4、成数据可视化设计和实现。在最后一次课上,每组报告,10,分钟,介绍所完成的大程作业。,老师和相关研究生现场点评,给出最佳修改意见。,评出最佳案例,颁发奖项,(iPAD,三只,),。,大程任务,故事梗概,美国驻,Flovania,大使馆的信息安全组在网络日志中发现一些无法解释的非常规行为,他们要求大使馆反情报部门协助调查,发出间谍红色警报,一个雇员把机密信息泄露给犯罪组织,数据集和任务,网络日志和雇员登记信息(员工卡),雇员的社交网络,Flovania周边的地理信息,任务,分析间谍嫌疑人、同伙以及他们的犯罪证据,雇员信息,60,名雇员,对大使馆设备有,24h,*,7d,的使用权,包括机密信息室,
5、员工卡登记信息,雇员编号,ID,,卡编号,在什么时间,/,地点刷卡,网络日志,登入的雇员编号,电脑的静态,IP,,目标地址,上传,/,下载量,端口号,雇员信息,数据样本,雇员刷卡记录:,Prox-in:登记进入,Prox-out:登记离开,Classified:机密区,雇员电脑网络日志,Task-1,内奸使用哪台(些)电脑发送信息给他的联系人(同伙),描述有嫌疑的电脑使用行为特征,为发送机密信息的电脑行为提供一个列表,包括信息发送的时间,/,地点,/,方式,社交网络信息,Flitter,是一个在线社交工具,大使馆的雇员用来和同事、朋友(不一定是大使馆内部人员)联络,Flitter,不是实名制社
6、交网络,Flitter,提供,nickname,(不是真实姓名),以及他们之间的社交关系,社交网络模式可能性,这个雇员(,employee,)会和他的接头人(,handler,)通过社交网络联系,1.,这个雇员大约有,40,个联系人,接头人有,3,个,接头人有,30-40,个联系人,接头人之间不互相联络,2.A,接头人和犯罪组织之间还有一个中间人,代号,Boris,,,Boris,只和组织中一两个人联系(其中有他老板),2.B,接头人和犯罪组织之间各有一个中间人,代号,Boris,Morris,和,Horace,,中间人只和组织中一两个人联系(其中有他们的老板),3.,中间人的,boss,代号
7、Fearless Leader,,他的,Flitter,联系人有上百个,包括其它国家的联系人,社交网络模式可能性图示,内奸,接头人,1,接头人,2,接头人,3,中间人,boss,内奸,中间人,1,boss,中间人,2,中间人,3,接头人,1,接头人,2,接头人,3,Task-2-Part-1,根据你对数据的分析,哪个可能性更大(一个中间人还是三个中间人)?或者你发现还有其它模式,提供你分析出来的信息泄露网络,包括内奸、接头人、中间人、boss以及他们的社交关系,不需要提供关联的雇员ID,信息泄露网络涉及越少节点,越多关键人物越好,地理信息,这些关键人物的地理位置有所限制,内奸和接头人在大城市
8、中间人在附近的一个小城市,,boss,在一个更大的城市,Task-2-Part-2,Flitter,用户是如何在城市间分布的?请提供表格。,Flovania,的城市位置信息是否支持你对,Task-2-Part-1,的猜想,Flovania,的哪个邻国和这次犯罪行为有关?为什么?,D-Day,任务一优秀作业1,IP,活动前,100,名记录,交互:鼠标在右侧细矩阵内上下移动可对左侧单条记录进行高亮,右上角呈现具体信息,雇员行为的Time Cake可视化,灰色:,时间轴,图中分为上下两个半圆,每个半圆表示从6:0022:00。两个半圆的时间是对应的,以一条橘黄色线条对齐,绿色:,一个员工一个月一来
9、在各个时间段的活动频繁度。,任务一优秀作业2,最集成的可视化,雇员所在位置与行为的可视化,任务一优秀作业3,社交网络关系图,By,段定龙,尚辛迪,谢亚南,任务二优秀作业2,Fearless Leader,Borris,Handler&,Employee,International,Contacts,By,余泽鹏,张超,邹天旻,教材出版与参考教材,陈为,张嵩,鲁爱东。数据可视化的基本原理与方法。,科学出版社,,2013,年,6,月,.ISBN 978-7-03-037488-2,。,课件、数据、案例全部上网并公开,陈为,沈则潜,陶煜波。数据可视化。,电子工业出版社,,2013,年,8,月出版。,未来计划,进一步完善课程的项目的设计,三分之一时间用于互动,以教为主变为以学用为主,2013,年,7,月,22-25,日,以本课程、教材为基础,举办全国范围内的“数据可视化”课程教学研讨会。,邀请,12,位全国专家,网易公开课录像,超过,300,人注册,包括,100,余名高校教师、,60,名企业人士和,10,名政府职员。,谢谢!,chenwei,新浪微博:浙大陈为,






