首页 文学文摘 时政新闻 科技科普 经济法律 健康生活 管理财经 教育教学 文化艺术 社科历史

基于XML可配置图形样式的数据可视化工具的设计与实现

作者:周成林 黄长江 黄坤 李超 来源:电子技术与软件工程

随着Internet技术的高速发展,大数据、云计算已经成为计算机软件领域的主题。特别在数据可视化技术方面,出现了很多数据可视化软件,但是不能灵活地改变图形的样式,本文通过对数据和数据挖掘可视化技术研究,提出一种对可视化图形样式配置的概念和实现方法。

【关键词】数据可视化 数据挖掘可视化 图表 XML

1 引言

大数据时代,通过数据挖掘对数据库中的大量业务数据进行抽取、转换、分析等处理,从而提取辅助商业决策的关键性信息。但是,当前数据可视化工具的灵活性较大地影响了数据挖掘系统的使用、解释能力和吸引力。丰富而灵活的数据挖掘结果可视化技术使抽象的信息以简明的形式呈现出来,加深用户对数据含义的理解,更好地了解数据之间的相互关系和发展趋势。

本文对于数据可视化技术作为研究的起点,在于实现可灵活改变可视化图形样式,并允许通过交互手段控制数据的抽取和画面的显示,使隐含于数据之中不可见的现象成为可见,为人们分析、理解数据、形成概念、找出规律提供了强有力的手。

2 软件设计

2.1 设计思想

XML(Extensible Markup Language)是一种元标记语言,也就是说它没有一套能够适用于各个领域中所有用户的固守的标签和元素,它允许开发者根据需要自定义元素。由于XML有这样的优势,用XML作为数据交换格式,实现了修改XML配置灵活改变图形的样式。

2.2 数据表示层次结构设计

每个图表的基本设计概念是相似的,它的数据层次结构包含:图表集合、图表、坐标系集合、坐标系、(特征值集合;序列线集合;标注集合)、(特征值、序列集合)、标注点等对象。具体描述如图1所示。

在图1中,箭头的指向表示包含关系,即“图表集合”中可以包含多个“图表”,而“图表”中又包含多个“坐标系集合”,依次类推,直至最低层的“序列线”和“序列点”。

2.3 数据交换格式设计

利用XML的良好结构对数据层次结构进行表达,图1中的对象在数据中都描述为XML的一个节点,对象的包含关系则反映到XML的层次结构上,对象的属性则反映到对应节点的属性。具体描述如图2所示。

3 软件实现

本软件实现了多个图表;每个图表可以定义位置、大小、方向,图表的名称、背景颜色可以修改;通过坐标系集合实现坐标系的共用,坐标系可以同时存在8个,总共有16个坐标系可以使用,每个坐标系的颜色等样式可以自定义,每个坐标系中可以有大量的特征值线和序列线;每个特征值线、序列线的颜色、粗细等属性可以自行定义;每个序列中的点可以定义颜色、大小等属性。

另外实现了实体多布局分析方式以及基于图表的交互操作,包括图形页面上选项自定义,选择缩放,排序,查询,选择子集显示等交互手段,更新图表显示结果。

4 结论

通过将XML作为数据交换格式,不仅实现了扩展性好的数据可视化软件,并且实现对图形元素的自定义配置以提高在数据挖掘过程中有价值信息的辨别度,提供更加丰富的手段来发现数据间隐含信息,也可以通过配置生成不同的图表来表现数据的联系和区别,这在数据挖掘过程中发挥重要作用。

参考文献

[1]陈建军,于志强,朱昀.数据可视化技术及其应用[J].红外与激光工程,2001(05).

[2]韩子良,毕妤.数据可视化在数据挖掘中的应用[J].计算机应用与软件,2003(11).

[3]王紫生,边馥苓.基于applet的数据挖掘信息可视化[J].地理空间信息,2007(01).

作者单位

湖北民族学院信息工程学院 湖北省恩施市 445000