Press "Enter" to skip to content

基于深度学习推荐的分析面板设计 (MultiVision: Designing Analytical Dashboards with Deep Lear…

本站内容均来自兴趣收集,如不慎侵害的您的相关权益,请留言告知,我们将尽快删除.谢谢.

从数据表格出发的自动可视化设计长久以来受到许多关注。1986年乔克麦金莱 (Jork Machinlay) 就提出基于用户对不同通道的感知有效性的APT [1] 工具。然而传统的方法依赖于经验规则,可能并不能得到最优结果。近年来,可视化研究社区也使用机器学习方法以支持可视化的自动创建[2]。但这些方法关注于给定数据属性之后的映射方法的选择,用户仍然需要花费时间与精力选择合适的数据项。为帮助用户选择数据,来自香港科技大学和微软亚洲研究院的伍翱宇等人提出MultiVision[3],旨在使用深度学习方法自动构建多视图的可视化。

 

该工作关注如何选择重要有意义的数据属性(列)构成图表,以及选择多个图表构成多视图可视化。图1展示了方法的整体框架。数据表格(Data Table)是输入。单图表评估模型和多图表评估模型共同构成了推荐器,用户交互可以给推荐器提供约束,推荐器的结果渲染成可交互界面。用户在与MultiVision 交互的结果也将作为多图表评估模型的训练数据。整个框架的最终输出为一个多视图的可视化。

图 1:MultiVision 的整体框架

MultiVision 将多视图选择问题抽象成为三层结构,如图2所示,分别为属性,视图,多视图。其中数个属性构成一个视图,数个视图构成一个多视图。本工作的任务为1.选择多个属性构建一个视图,2. 选择多个视图构建一个多视图。一个视图的输入为多个数据属性和视图的种类。此问题可以转化成为给定多个数据属性和对应的图表类型,结果表格的评分是多少。类似地,一个多视图的评分由多个图表决定。因此两个问题都可以转化为一个多输入到一个输出分数的问题。

图3:多视图选择问题的三层结构

然而,并不存在直接的从图表到评分或者是从多视图到评分的直接数据集。两个图表或者两个多视图的比较关系的数据则较为易得。因此,该问题可以转化为比较问题来解决:即通过两个共享权重的评分网络(图3 A),将结果输入到比较层中,若评分结果不满足偏序关系,那幺则施加惩罚。由此可以由成对的偏序关系得到全局的评分。

图 3:MultiVision 的模型结构

对于单图表评估部分(图3 B),每个数据属性的向量都包含了语义向量、数据统计特征、和属性类别。多个数据属性通过双向长短期记忆模型获得一个向量。并且同图表类型共同作为输入决定最后的分数。对于多视图评估部分(图3 C),每个单视图评分的结果和一些多视图的指导法则共同构成图表的向量。多个向量通过双向的LSTM和线性层得到最终的多视图的评分。单视图的评分网络的训练数据来源于Excel中表格和图表的对应关系数据集,对于每个图表,其中选中的图表和其他的图表构成一种比较关系:选择的比其他的图表评分要高。对于多视图,由于相关的数据较为缺少,MultiVision 基于用户对系统的操作记录进行学习。具体方法为,用户在编辑的过程中有许多中间结果,最终的结果是用户较为满意的,因此最终结果优于过程中的中间结果。MultiVision将现有的模型结构和NN和RankSVM进行比较。现有的模型在两个任务中都由于其他模型结构。

 

MultiVision 提供了两种方式的推荐方法。一种是被动地推荐一个多视图结果,另一种是主动地根据用户的交互提供实时的推荐。这两种分别对应了多视图推荐器(Multiple-View Recommendation,图4 B)和图表构思(Chart Ideas,图4 D)。由于全局遍历所有的结果随着属性数量的增加,算法复杂度呈现指数爆炸的趋势,因此在两种方式中都采用贪心算法,每次选择增加一个图表使得总评分最高。

图4 MultiVision交互界面

该工作在包括专家、各专业学生在内的被试中展开了用户实验。邀请用户熟悉系统之后选择相应的图表,并且选择自己不熟悉的数据展开数据分析。最终被试将给出MultiVision的评分。反馈表明MultiVision有用、便捷并且易于学习。同时在开始分析或者中途卡壳时系统能够很好提供灵感。同时,被试们反馈,自动化方法和用户的结合将十分有效。

 

【参考文献】

 

[1] Jock Mackinlay. Automating the Design of Graphical Presentations of Relational Information. ACM Transactions on Graphics, 5(2):110–141, 1986.

 

[2] Dominik Moritz, Chenglong Wang, Greg L. Nelson, Halden Lin, Adam M. Smith, Bill Howe, Jeffrey Heer. Formalizing visualization design knowledge as constraints: Actionable and extensible models in Draco. IEEE Transactions on Visualization and Computer Graphics , 25(1):438–448, 2018.

 

[3] Aoyu Wu, Yun Wang, Mengyu Zhou, Xinyi He, Haidong Zhang, Huamin Qu, and Dongmei Zhang. MultiVision: Designing Analytical Dashboards with Deep Learning Based Recommendation. IEEE Transactions on Visualization and Computer Graphics (IEEE VIS 2021) , Accepted.

Be First to Comment

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注