Blog

懒癌晚期


Project maintained by VirusPC Hosted on GitHub Pages — Theme by mattgraham

Back Home

Interactive Dynamics for Visual Analysis

目的是帮助人们评估和创建可视化分析工具

有助于用户分析的动态交互涉及12种任务类型,将它们分为3组。


DATA AND VIEW SPECIFICATION

灵活的可视分析⼯具必提供适当的控件来指定数据和相关视图。这些控件让分析师选择性地可视化数据、过滤⽆关信息以专注于相关的项以及将数据分类排序来揭示某种模式。分析师同样需要从输⼊的数据中得到新的数据,例如归⼀化的值、统计学摘要或聚合。

VISUALIZE

确定数据的一个可视化,是可视化分析最基础的操作。分析者需要表明哪些数据需要被展示,以及它们是如何被绘制出来的。

可视化方法有3种:

  1. 图表库(chart typology)。预先提供可视化组件,可视化组件位于中。库中有很多可视化模板(条形图、饼图等),分析者选择模板,并导入数据来对数据可视化。
  2. 数据流图(data-flow graphs)。把可视化过程解构成细粒度的元件,来进⾏数据输⼊、转换、排布、着⾊等。分析者交互地将元件组合到一起,以此构建新颖的表现形式。
  3. 正规文法(formal grammar)。这些文法构成高级语言,用来描述如何将数据映射为视觉特征。通过一系列这样的描述来构建复杂的可视化。有些对编程能力有要求,如ggplot2 for the R、Protovis for HTML5等。有些对编程能力没要求,如Tableau,它通过拖曳操作来制定可视化。

FILTER

对数据进行筛选和过滤。

过滤的交互方式有2种:

  1. 直接对视图进行操作(direct view manipulation)。直接选择屏幕里的某一项,然后高显或排除他们。
  2. 使用辅助控件和动态查询装置(auxiliary control and dynamic query widgets)。控件类型由数据类型决定。分类或序数数据可以使用简单的单选按钮、多选框(项目较少时)、滚动列表、分层和自动补全的搜索框(项目很多时)等控件来进行过滤。序数、数量和时间数据可以使用标准滑块(用于单个阈值)或范围滑块(用于指定多个端点)来进行过滤。搜索框可能支持复杂的查询机制,其复杂程度从简单的关键字搜索到正则表达式匹配,再到成熟的结构化查询语言。筛选还与其他操作互动:筛选部件可以对以用户指定方式排序的数据进行操作(见下一节),或者用户可以创建派生值(见下一节后)并根据结果进行筛选。

SORT

分类排序。⼀个适当的分类排序可以⾼效地展现趋势、数值的集群以及根据常⻅的分类单元组织数据。

分类排序控件可以是⼯具栏上的简单的选项,或是对表格抬头进⾏的的⼀个点击来实现数量或⽂字的升序或降序(类似excel)。

在多视图显示的情况下,分类排序变得更加复杂,在这种情况下,不仅各个视图内的数据可以被分类排序,也可以对所有子视图进行分类排序(改变视图的排列顺序等),以揭示模式或异常。在图之间按照一定值进行分类排序(例如,按其边际平均值或中值)可以揭示模式,同时便于比较各图。

对于一些特殊数据类型,如 multivariate tables、networks,它们并不总是适合按值进行简单的分类排序。这样的数据可能需要更复杂的分类方法,用来视图最小化项目之间的距离测度。其目的是解师数据之下隐藏的结构(如聚类)。以 社交网络的矩阵视图为例,可以按字典排序,可以按结点度数排序,也可以按社区结构排序。。。你会发现按社区结构排序数据特征更明显。

DERIVE

提取,获取。从输⼊数据中获得新的数据的能⼒。通常,这种功能是通过计算语言提供的。

获取新数据的方法有2种:

  1. 数据转化(transform data)。比如归一化,对数转换等,以产生更有效的对比效果。
  2. 从现有值中导出新的属性(derive new attributes from existing values)。比如求均值、方差、统计各组数量等。

VIEW MANIPULATION

在创建可视化后,分析者应该可以对视图进行操作,以突出显示模式、调查假设并深入了解更多细节。分析者需要能够选择项目或数据区域并对他们进行突出显示、过滤([filter]filter)或其他操作。大的信息空间可能需要分析人员对视图进行滚动、平移、缩放等操作,以检查高级模式和细节。相比孤立的视图,多个、相连的可视化通常可以使分析者对多维数据有更加清晰的认知。分析工具必须能够协调多个视图,以便选择和过滤操作同时适用于所有视图,并组织由此产生的仪表板和工作空间。

SELECT

选择。指出一个项目或一块区域。这些选择通常决定了一组要操作的对象,可以对它们实现高亮、注释、过滤或按需提供细节。

可视化中常见的选择形式包括鼠标悬停、鼠标点击、区域选择(如矩形、椭圆形区域或自由形状的拉索)、区域光标(如刷子、气泡光标)。

在选择选择方法时,还必须考虑到交互的上下文。例如,在平板电脑或手机上使用基于触摸的输入时,响应悬停事件提供细节是不合适的。

大多数接口都支持对一个项目集合的选择。可以通过查询的方式来进行选择。保持查询结构可以增加可视化应用的表现力。例如,在图表中绘制一个矩形,而不是直接选择所包含的项目,可以在平面上指定一个范围查询。指定的的选择标准(范围查询)可以被保存并应用于动态数据(更新项目可能进入或退出查询区域)或其它的可视化。

设计更具表现力的选择方法仍然是一个活跃的研究领域。例如,研究人员已经提出了在时间序列可视化上映射鼠标手势的方法,以选择感知上突出的数据区域,如峰、谷和斜率或查询复杂的时间变化模式。初始选择也可以作为更复杂的选择的起点,因为分析人员可能会点击一个有代表性的对象,然后根据对象的属性制定更广泛的选择(例如,”选择所有像这个一样的蓝色项目”)。选择不局限于鼠标和键盘,输入模式,如触摸、手势和语音,可能会允许新的、有效的选择形式。

通常不能一下子把所有信息可视化出来,分析师需要在不同的信息部分之间浏览。分析师如何浏览可视化信息在一定程度上取决于他们的起点。

浏览的方式有2种:

  1. 先是概览,再是放大和过滤,然后是按需提供细节。
  2. 搜索、显示上下文、按需扩展。

无论哪种方式,可视化都只是作为信息空间的一个观察窗口(viewport)。分析师需要操纵这些视口来浏览这个空间。常见的例子包括通过滚动条或鼠标拖动滚动或平移显示,以及使用缩放滑块或滚动轮在不同级别之间进行缩放。缩放不一定是几何缩放,也可以是语义缩放。语义缩放可以显示重点区域内的更多细节。

为了进一步帮助导航,研究人员开发了多种焦点加上下文的方法:

  1. 一种方法是“双焦”视图(”bifocal” view),同时显示详细视图和概览视图。其中一种思想是使用概述和细节显示,比如地理可视化把详细地图放在概览地图的一角。在这种情况下,详细视图提供了焦点,而概览提供了背景。需要设置变焦系数。
  2. 另一种不同的方法是使用变形或放大技术来改变整个显示区域,从而使上下文区域被缩小。一般采用鱼眼变形。更复杂的方法是采用多维度的变形,但不实用。

除了操作显示空间外,焦点加上下文的方法可以直接应用到数据本身。其目标是确定哪些数据项目前具有高度的兴趣(焦点),哪些数据项具有高度的重要性,无论当前的焦点(上下文)如何,哪些数据项可以安全地从视图中移除。DOI(degree-of-interest)函数根据一般的重要性(例如,层次结构中的顶级类别,或图中具有高中心性的节点)和当前的兴趣(例如,通过鼠标点击、搜索查询或与其他高兴趣项目的接近程度来表示)来计算信息内容的分数。然后,DOI分数的分布可以用于根据当前视图大小和交互的上下文选择性地控制项目的可见性。DOI分数会动态更新。

可视化可以提供提示,帮助分析人员决定在哪里和如何浏览。视图操作的控制往往是不可见的,例如通过鼠标移动进行缩放/平移。改进后的策略便于分析人员发现,并在图例或其他方式(如滚动条位置)中提供可见的设置指示,从而提供信息反馈。一个重要的挑战是显示选定的项目,即使它们不在视图中。例如,当前不在视图中的文本搜索结果可以通过滚动条或显示屏外围的标记来显示。

COORDINATE

视图协同。许多问题的分析需要多视图的协同,让分析师从多个角度洞察数据。 通过在一个视图中选择一个项目或一组项目的方式,分析人员可以在其他视图中看到与之相关的细节或突出显示的项目。多变量数据还可以深入到组的子集、标记集合以及导出选择集。

多视图有利于进行比较,例如 small multiples。

多视图可以使用多种可视化类型–如直方图、散点图、地图或网络图–来显示多维数据集的不同投影。

多视图显示还可以实现跨视图的交互式探索。刷动和链接(brushing and linking)是实现在一个视图中选择项目的同时,在其他视图中也高显这个项目的实现方式。可见每个可视化视图都是揭示整个数据模式的输入通道。关联式的选择支持多维度的推理,通过让分析师看到一个视图中的模式是如何投射到其他视图。分析师可能通过多种方式来协调视图:在一个视图中选择项来高显该项在其他视图的对应项,或者是提供筛选标准来过滤其他屏幕的信息。关联式导航也为视图协调提供了另外的形式,当一个视图进行缩放、平移时,其他视图也发生对应操作。

ORGANIZE

页面组织。当分析者利用多重视图时,它们面临着相应的挑战:如何管理这一些可视化。

传统的基于窗口的界面中,要想观察多个可视化视图需要打开多个窗口,并通过手动调整窗口位置和大小等来组织布局。

更方便的系统提前设计好在一个窗口中显示多个图表,规定好他们在窗口中的位置大小布局。

典型的系统允许分析者动态添加视图。更先进的系统或许借助自动化来辅助这一视图组织过程。这种支持可以使多个窗口作为一组来打开/关闭,并以有序的方式排列。理想的功能是在添加或删除视图时自动(重新)调整大小,以及将相关视图置于空间邻近的布局程序。

人们对平板电脑和智能手机可视化的需求促进了布局组织的创新,这些布局组织结构紧凑,可通过简单的手势进行重新配置。缩放、平移、翻转和排序策略也将改善分析师的体验,并提供对他人的更有效的展示。

PROCESS AND PROVENANCE

可视化分析并不局限于可视化的生成和操作–它涉及一个反复探索和解释数据的过程,因此一些提供便利的可视化分析工具被广泛采用。

工具应该可以通过记录分析者的行动和见解来保存分析的来源(provenance),以便能够回顾和改进工作历史。活动的文字记录有其好处,但活动的可视化概述可以更紧凑、更容易理解。如果分析人员能够注释模式、离群值和感兴趣的观点,他们就可以记录他们的观察、问题和假设。

RECORD

用来记录可视化分析人员的交互历史。至少,应用程序应该提供基本的撤销和重做支持。

虽然鼠标和键盘事件等低级输入很容易捕获,但如果记录了高级语义操作,那么历史记录就会变得更有价值。通过对用户操作的空间(视图规格、排序、过滤、缩放等)进行建模,可以构建更丰富的日志并将其可视化。

可视化的历史也揭示了分支历史的层次模式。将相关的动作 “分块 “在一起的技术可以进一步减少杂乱无章的情况。(蛇形排放顺序:连续的Undo新起一行从右向左,连续的Redo新起一行从左向右,单个Goto新起一行从左向右,其他情况不换行顺序排放。)

可视化的历史可以支持一系列的交互:

  1. 首先,历史提供了一个方便的机制,可以重温之前的分析状态,并恢复未完成的探索。
  2. 在状态中添加元数据,如评论、标签或评级,可以促进以后的回顾和共享。
  3. 交互式历史记录还可以捕获可重复的操作序列,这些操作可以被命名并保存为一个可重复使用的宏。这个强大的功能使处理许多类似数据集的分析人员能够自动化工作。
  4. 历史记录可能会刺激共享:分析师可以将选定的分析轨迹(从屏幕截图到交互式演示)导出到外部媒体。
  5. 最后,历史记录还提供了一种研究分析师和模拟分析过程的手段。

ANNOTATE

对可视化历史中的状态进行文本注释。

通过与视图的直接交互,使用前面讨论的选择技术,可以实现更具表现力的注释。分析人员可能希望“指向”可视化中的特定项目或区域,并将这些注释与解释性文本或其他视图的链接联系起来。

自由形式的图形注释提供了一种“指向”的表现形式。在一组项目周围画一个圆圈或用箭头指向图表中的一个峰值,可以引导观众的注意力。以矢量图形形式实现的自由形式注释可以通过几何变换(如平移和缩放)而持续存在,但如果它们不是 “数据感知 (data-aware, 与数据有关)”的,那么在面对过滤或聚合等操作时,它们可能变得毫无意义。

注释也可以以选择的形式实现,使其具有数据感知(data-aware)能力。可以为一个选择集添加注释。数据感知注解允许将指向性意图重新应用于同一数据的不同视图,从而能够在不同的视觉编码选择中重用引用。数据感知注解还可以使分析人员搜索所有引用特定数据项的评论或可视化。于数据感知注解是可机读的,它们也可用于导出选定的数据或汇总以确定高度关注的数据子集。

SHARE

可视化分析工具应该支持社会互动。至少,工具必须能够导出视图(png、jpg、ppt等)或数据子集(csv、json、xls等),以便共享和重新访问。

一个重要的功能是导出控制面板的设置,这样其他分析师可以看到同样的可视化。

sense.us是一个结合了视图共享、注释和讨论的协作式可视化分析工具。该系统包括:(a) 一个交互式可视化,(b) 一套图形注释工具,(c) 保存视图的书签轨迹,(d) 一个用于添加评论的文本输入字段(可将书签拖到文本字段上,以将视图与评论联系起来),(e) 附在当前视图上的文本评论,以及(f) 一个可共享的URL,随着可视化状态的改变而自动更新。

一个简单而有效的协作辅助工具是通过应用书签进行视图共享:一个可视化分析系统应该能够建模并导出其内部状态。视图共享通常采用URL或类似标识符的形式,允许合作者快速导航到感兴趣的视图。有效的视图共享面临的一个挑战是如何处理动态数据:书签视图应该保持历史数据的快照,提供对最新数据的访问,还是两者兼而有之?

另一种分享和传播的方法是发布可视化。Spotfire和Tableau等商业工具可以将可视化仪表盘作为交互式网页发布。这些基于Web的组件提供了交互式功能的子集(例如,选择、搜索和深入),以实现某种程度的后续分析。

其他的协作关注点取决于使用环境。合作者是同步工作(同一时间)还是异步工作(不同时间)?他们是同地办公(同一地点)还是分散办公(不同地点)?这些配置中的每一种都可能需要专门的访问控制、存在指标和活动意识策略。

GUIDE

分析师可能需要为新人和专家用户提供操作引导。可视分析系统可以通过集成导向分析(guided analytics) 来引导分析师完成常规任务的工作流程。

有些流程显然是线性的,但许多可视化分析任务需要更丰富系统化而又灵活的流程,允许分析人员进行游览,同时跟踪他们所做的事情。例如,SocialAction 将社交网络分析过程组织成一个活动序列(例如,排列节点、绘制节点、查找社区);系统允许分析人员有选择地跳过步骤,并记录哪些步骤已经完成。面板中会给出构建社会网络分析的常见步骤,并提供了进度指标。

专家们经常开发出供知识较少的团队成员使用的可视化工具。需要进行大量的研究,以确定有效的可视化分析流程,并使专家分析人员能够创建可重复使用的工作流程。

还有一种用途是引导普通观众参与线性叙事,互动式叙事。


References

Interactive Dynamics for Visual Analysis