1、数据可视化技术及其原理简介 现实之中,各类炫目的数据可视化内容巳经遍布人类社会的各个角落,其具体过程涉及 制图学、图形绘制设计、计算机视觉、数据采集、统计学、图解技术、数型结合以及动画、立 体渲染、用户交互、影像学、视知觉、空间分析、科学建模等诸多领域。数据可视化是美学和 工程科学相结合的产物,往往需要利用创造性的艺术设计来呈现沉闷繁冗的数据。数据可•视化 一般是以图形或图像的形式进行信息传递或隐喻,但是其表达的含义能够比文字和语言都更为 有力,完全能够满足信息传递的要求。 广义上来说,数据可视化并非是计算机应用时代的特有产物,从人类认知的角度看,凡 是能够被认知的事物、关系或法则均可以表
2、示为数据,而不仅仅局限于数字化时代的数字信息。 而数据可视化的意义就在于它是•个生成图形图像的过程,事实也就是人类对数据所代表含义 形成认知的过程。而数据可视化技术的研究则是强调如果要达到和实现某种数据可视化目标, 所需要采取的方式、方法或技术手段,在当前以互联网、大数据、人工智能等核心技术引领的 时代,一般会对应计算机领域的某种工具或算法。 1数据可视化技术的演进 数据可视化技术的发展史与测信、绘画、人类现代文明的启蒙和科技的发展一脉相承, 在地图、科学与工程绘图、统计图表中,可视化理念与技术己经应用和发展了数千年并不断发 挥指引人类科技发展的作用。数据可视化技术的演进路线可以归结为以下
3、几个主要阶段。 (1) 抽象图形表示 人类采用抽象图形表示的方法进行数据可视化作品的设计,究其根源可以追溯到穴居人 所在的旧石器时代。图1是法国南部肖维特洞壁画,洞穴位于法国南部的阿尔代什省,根据考 古鉴定其制作时间为旧石器时代前期3-3.2万年前。这些壁画清晰地描述了当时人类所处的环 境及狩猎方式等具体信息。抽象图形表示法在古代人类社会及人类历史进步过程中发挥了不可 磨灭的作用。图I右侧为阴阳八卦的简图,出现在距今8000-4000年之间,它提出了万物阴阳 交替及相互转化的基本原理。 右:阴阳八卦简图 图1左:旧石器时代的壁画图; (2)科学可视化的发展 lltr八亮玳浪压夹-f
4、i*誓'瘩款».曲之卜“
sr 气成凳览£*林1&-4-%-8;^'着1芳<.巳¥卷存 v<&<*-Y-f»-rt1sJt*。村 8 尤.*.*,«金«友 办<&
古」上念*彖宥式** V若宥女K 5、2展 示了公元7世纪的敦煌星图,这也是世界上现存古星图中星星数量较多而又较为古老的一幅, 星的位置误差在1.5度到4度间,星图的绘制采用了圆柱和方位投影法。敦煌手绘星图的画法 也是现代星图的鼻祖。
图2敦煌星图:最早的手绘星象图
17世纪以后,物理学等科学领域持续发展,人类己经掌握了精确的观测技术、设备和相 关理论,使得航空、测绘、制图和地理勘测获得了空前发展。真实性的测量数据被直接应用于 数据可视化领域,进而引发了科学可视化技术的发展。
(3)统计图表的爆发
18世纪是统计图形学的繁荣时期,其奠基人William Playfair发明了折线图、柱状图、显示 局部与整体关系的饼图等常用 6、的统计图表。图3左侧是丹麦与挪威1700-1780年间的贸易进出 口时间序列图,右侧为1789年土耳其在亚洲、欧洲和非洲的疆土比例,是世界上首张利用饼 图进行数据可视化的案例。
图3左:丹麦与挪威1700-1780年间的贸易进出口时间序列图;右:1789年土耳其在亚洲、
欧洲和非洲的疆土比例
(4)数据与艺术的有机结合
图4展示了 1857年近代护理事业创始人南丁格尔创作的玫瑰图,其主要目的是减少枯燥 的统计数据的使用,变换为容易让人理解的圆形直方图的形式,主要用来表达军医院的季节性 死亡率的数据。玫瑰图的发明充分表明了数据可视化的重要作用和意义,尽管统计数据本身具 有意义,然而其表现 7、和表达形式更加重要,如何高效地向其他人员展示出统计结果则是数据可 视化所要解决的主要问题。
APRIL 收 MARCH MM
AFRIL 1886.MARCH 1S55
DIAfiKAM “ Tm CAUSKS er MORTALITY IM THt ARMY IH THE EAST.
A* M*** —d尸tht-Vg nnit-arwv
Z Hu /hnu,驴1^/—. Mr
■MrAU
Ak而如金,«/wr «mncw 8、业创始人南丁格尔创作的玫瑰图
(5)交互可视化与信息可视化
随着科学与工程计算的不断发展,数据量的增加使得数据的分析和理解更加复杂化,统 计图形学者们为促进对数据的深入理解,将数据可视化技术引入统计分析,以1975年以后陆 续出现了多种新型的可视化数据工具,如图5中的增强散点图(三条移动统计均线)和散点图 矩阵等方法。
DIMMER
。,一 £>>*'oracFe
USA 1 070 Draft Lottery Data
SETTWG
■ Center
▲ Sitter
• P*r«nt
OIHHER STRANGER PRO61EW
STRANGER
PRO6LEU
9、
图5左:增强散点图(三条移动统计均线);右:散点图矩阵
信息可视化是2()世纪8()年代以后才出现的可视化技术,是可视化技术在非空间数据领域 的应用,是将数据信息转化为视觉形成的过程,可以增强数据呈现效果,让用户以直观交瓦的 方式实现对数据的观察和浏览。信息可视化处理的对象是抽象的、非结构化数据集合(如文本、 图表、层次结构、地图、软件、复杂系统等)。传统的信息可视化起源于统计图形学,又与信 息图形、视觉设计等现代技术相关。其表现形式通常在二维空间,因此关键问题是在有限的展 现空间中以直观的方式传达大量的抽象信息。与科学可视化相比,信息可视化更关注抽象、高 维、不具有空间位置属性的数据,因 10、此要根据特定数据分析的需要,分别确定数据元素在空间 的布局。
2数据可视化与计算机图形学
计算机图形学是科学数据可视化的基础。实际上,可视化就是讲数据转化为图形元素的 过程,再由计算机图形学的方法将这些图元转换为图片或动画。具体涉及图形渲染、颜色、光 照、视角等基本的计算机图形学元素。那么,如何将这些基本元素有机地组织起来,从而最终 形成具有一定效果的可视化图形,其具体的方法与过程是怎样的:另外,既然有了计算机图形 学,为什么还要有个数据可视化,二者的本质区别是什么。
数据可视化的目的是将原本枯燥、难懂的数据进行生动活泼的展现,从而实现具有一定 视觉呈现效果的数据展示方式。在这一过程中, 11、不可避免地要用到计算机图形学方法,可以说, 计算机图形学是实现数据可视化的基础。所谓计算机图形学,其主要目标是模拟或表示物理对 象的几何形状。通过应用各种各样的数学技术,包括点、线、多边形、曲线和各种形式的样条 的组合,甚至各类数学函数与方法的运用,从而形成多种多样的图形效果。然而,这种具体的 图形显示问题事实并不属于数据可视化。
数据可视化技术并不直接关注这些几何图形在计算机中通过怎样的算法和公式来模拟和 创建出来,而是直接从可视化的目的和展示效果出发,为可视化数据构建一个几何模型,其中 就包括所要展示物体的形状、位置、显示效果等关键性要素。
3数据可视化技术原理
数据可视化是通过一定 12、的技术手段,将数据以更加形象和直观的方式加以展现。所谓展 现,就会涉及两个核心问题。…是用于展示可视化效果的场景,二是在场景内用于展示的可视 化数据表现形态。在早期的数据可视化案例中,场景构建是通过人工设计和绘制的方法手工建 立,而当今的数据可视化技术就是要通过算法将颜色、光照、视角、坐标系等基本元素综合起 来,形成一种数据展示的场景(scene),而可视化内容就充当了演员(actor)的作用。
对于普通的平面可视化问题,场景和演员的设置一般较为简单,只需要保证可视化所展 示的内容能够在其展示框架中居中即可。对于三维可视化问题,就必须为场景和演员进行立体 化建模,形成具有佼、宽、高的立体化场 13、景。演员的呈现需要设置一个三维变换矩阵,用于控 制其在场景中的位置和比例。
完成可视化场景的渲染以后,就需要通过计算机图形的方法来实现其具体的显示。这一 过程与常规的计算机图像处理相同,都是将显示图像通过光栅设备进行呈现。具体的显示图形 需要转换为像素,并结合显示器等设备的分辨率形成具有一定精度的呈现结果。
对于演员来说,从算法层面进行分解就可以得到大量的三角形或多边形表示的基元,属 于几何类型的数据。将几何数据表示的内容转换为光栅图像的过程称为光栅化或扫描转换。当 前的硬件设备一般会采用以对象排序为特征的光栅技术。
4小结
数据可视化在当今人工智能、大数据为导向的科学发展阶段发挥了重 14、要的桥梁和承载作 用,能够优美而有效的展现数据的含义和特征,无形之中推动和促进了众多智能化应用的发展。 我国先后发布了新一代人工智能发展规划和大数据产业发展规划等方面的发展纲要,鲜明地提 出要加快研发新一代数据可视化软件产品,鼓励高校探索培养大数据和数据可视化领域专业型 人才和跨界复合型人才机制。数据可视化技术是一项应用性强、实用而有效的技术,在各行各 业的人工智能和大数据发展中均占据非常重要的位置,属于相关专业能力培养的重要元素和社 会迫切需要的职业技能。更多数据可视化技术的内容可以参见西安电子科技大学出版社的图书
《数据可视化技术》,书中涵盖了可视化的图形基础,提供了对可视化原理与过程、数据表示、 算法设计、建模技术的讲解,还对数据可视化相关的图形处理技术以及体可视化的技术与发展 进行了探讨。






