大数据时代数据可视化的概念研究

本文基于对DT时代下数据可视化概念进行解读与分析。在大数据时代大背景下,作为前端工程师,接触数据,使用数据,分析数据的次数会越来越多,开发数据可视化的应用也会越来越多。不管是使用Echarts.js,G2,HighCharts.js,SVG.js等已经封装好的高级可视化工具库,还是使用底层的d3.js,three.js,pixi.js等可视化数学库。我们都应该去了解数据可视化的一些基本概念,从而来让我们更好地去理解业务与需求。

1.数据可视化发展历程

年代 发展历程
15世纪-17世纪 可视化思想诞生初始,数据可视化的早期探索正式拉开序幕。
18世纪 数据可视化初步发展,直方图、柱状图、饼图、圆环图等开始出现。
19世纪前半叶 数据开始得到重视,数据图形出现。
19世纪后半叶 19世纪后半叶
20世纪前期 前期的可视化表达方式己经够用,图形表达的研宄并无新的进展。
20世纪中后期至今 数据可视化依附计算机科学与技术拥有了新的生命力,并将在不久的未来大放异彩。

2.数据可视化相关概念

广义上来说,数据可视化本身是一种泛称,它统一了较成熟的科学可视化和较年轻的信息可视化。而在大数据时代,除了包含这两种以外还囊括了在他们基础上发展起来的知识可视化以及结合了数据分析的可视化分析。

如下表,为可视化分类表:

类别 研究对象及其特点 研究目的 主要技术及表达方式 交互类型
数据可视化 包括空间、非空间数据等各种类型的大数据 将无意义的数据以含义丰富的形式表现出来,便于人们理解或提供启发、挖掘规律的可能 计算机图形、图像 人机交互
科学可视化 一般为具有几何属性的空间数据 将数据以真实可感的图形图像等方式表示,帮助人们更好理解相关概念和结果 计算机图形、图像 人机交互
信息可视化 非空间的,抽象、非结构化的数据集合,也可以是信息单元 以直观图像展现抽象信息,并帮助人们理解挖掘深层信息和含义 计算机图形、图像 人机交互
知识可视化 知识经过加工、整合和处理后在人脑中存储为知识结构的信息,可不断更新 用视觉表达的方法来描述知识,推动人们之间的知识等传播和创新 手绘或计算机草稿图、知识图表,视觉隐喻等等 人人交互
思维可视化 可不断更新的具有主观想法的知识结构的信息 用视觉表达的方法来描述知识,推动人们之间的观点、态度等的传播和创新 手绘或计算机草稿图,思维导图、概念图等 人人交互
可视化分析 包括空间、非空间数据等各种类型的大数据 变信息过载为机遇;使分析师或决策者能及时、高效地考察大量数据、信息流并完成分析推理和决策 计算机图形、图像,用户的知识、经验和主观认知 人机交互

[图片上传失败...(image-8050f3-1522675139611)]

3.数据可视化流程

Ben Fry在他的著作《可视化数据》里把数据可视化的流程分为了七步:获取、分析、过滤、挖掘、表示、修饰、交互。
[图片上传失败...(image-210c97-1522675139611)]

如上图,通常为了便于理解,可视化整体可分为三大部分:原始数据的转化-数据的视觉转化-界面交互。

image

上图为目前应用最广的可视化流程模型,后继几乎所有著名的信息可视化系统和工具都支持、兼容这个模型。

其实各类模型本质上还是离不开分析-处理-生成三步。

3.1 分析

  • 任务:分析我们这次可视化的出发点和目标是什么?
  • 数据:分析数据
  • 领域:针对不同领域进行相应的分析

3.2 处理

  • 数据处理:数据处理、数据规范、数据分析
  • 设计视觉编码:指如何使用位置、尺寸、灰度值、纹理、色彩、方向、形状等视觉通道,以映射我们要展示的每个数据维度。(下文详细介绍)

3.3 生成

把之前的分析和设计付诸实践,在制作或写代码过程中,再不断调整需求、不断地迭代(有可能要重复前两步),最后产出我们想要的结果。

4.数据模型

数据可视化的主要任务是将数据转换为易于感知的图形。因此,为了更准确更形象的表达数据,我们需要了解一些数据相关的概念。

数据模型是一组数字或符号的组合,它包含数据的定义、类型等,可以进行各类数学操作等。

概念模型描述的是事物的语义或状态行为等。

现实世界可以用概念模型来描述,而概念模型又可以用数据模型来描述。经过两层抽象,数据便可以描述我们的现实生活中的方方面面。

数据类型

  • 类别型:用于区分事物,例如水果分为苹果,香蕉等。
  • 有序型:表示对象间的顺序关系,例如排名从高到低等。
  • 区间型:用于对象间的定量比较,比如身高170-180cm之间的。
  • 比值型:用于比较数值间的比例关系。例如,体重 80kg 是体重 40kg 的两倍。
数据类型 操作 集合操作 统计操作
类别型 =、≠ 互换元素位置 类别、模式、列联相关
有序型 =、≠、>、< 计算元素单调递增(减) 中值、百分位数
区间型 =、≠、>、<、+、- 元素间线性加(减) 平均值、标准方差、等级相关、积差相关
比值型 =、≠、>、<、+、-、×、÷ 元素间相似度 变异系数

视觉编码

视觉编码:描述的是将数据映射到最终可视化结果上的过程。

视觉通道:图形符号<——>信息<——>视觉系统

[图片上传失败...(image-84e59a-1522675139611)]
如上图所示,把图形符号分为两种:

  • 位置变量:一般指二维坐标
  • 视网膜变量:尺寸、数值、纹理、颜色、方向和形状

以上基本的图形符号共有 7 种。将其映射到点、线、面之后,就相当于有 21种编码可用的视觉通道。后来人们还又补充了几种其他的视觉通道:长度、面积、体积、透明度、模糊/聚焦、动画等,所以可用的视觉通道其实太多了。

视觉通道的三个性质

    1. 定性性质(或者叫分类性质)。适用于类别型数据。比如形状或颜色,这两个视觉通道,非常容易被人眼识别。
    1. 定量性质或定序性质。适用于有序型和数值型数据。比如长度、大小特别适合于编码数值/量的大小。
  • 分组性质。具有相同视觉通道的数据,人眼也能很快识别出来,将其归为一组。

当然视觉通道还需要考虑:

  • 色彩搭配
  • 交互
  • 美学因素
  • 信息的密度
  • 直观映射、隐喻

本文主要对大数据时代数据可视化的一些基本概念进行了总结,希望这篇文章能帮助到你。

参考文献


  • [1]数据可视化基础
  • [2]陈为 沈则潜 陶煜波. 数据可视化[M]. 电子工业出版社, 2013.
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 162,825评论 4 377
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 68,887评论 2 308
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 112,425评论 0 255
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,801评论 0 224
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 53,252评论 3 299
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 41,089评论 1 226
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 32,216评论 2 322
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 31,005评论 0 215
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,747评论 1 250
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,883评论 2 255
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,354评论 1 265
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,694评论 3 265
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,406评论 3 246
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,222评论 0 9
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,996评论 0 201
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 36,242评论 2 287
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 36,017评论 2 281

推荐阅读更多精彩内容