首页 文学文摘 时政新闻 科技科普 经济法律 健康生活 管理财经 教育教学 文化艺术 社科历史

基于领域的本体抽取技术研究

作者:王智学 张瑞 来源:科技风

摘 要:本文以一个微型本体片段为例,采用程序切片技术对实验本体进行抽取,内容涉及基于本体的依赖图构建、分层化简本体依赖图的生成以及本体切片方法的设计,是程序切片技术在本体构建领域的一种尝试。

关键词:微型本体片段;本体抽取;程序切片技术

程序切片(Program Slicing)是Mark.W于1979年在他的博士论文中第一次提出的一种用于分解程序的程序分析技术[1]。该方法是从程序中抽取出用户感兴趣的代码,组成一个新的程序,即程序片。

本文以一个微型本体片段为例,将程序切片技术中的依赖图构建和切片生成算法映射到对实验本体的抽取研究中,给出了本体的依赖图定义、基于分层本体依赖图的化简规则以及本体切片的生成方法,是程序切片技术在本体构建领域的一次应用探索。

1 本体依赖图的构建

本文基于本体定义元模型(ODM)构建了实验本体的本体依赖图[2],并给出了相关的定义,在此基础上根据依赖的程度对图进行了分层处理。

定义(本体依赖图Ontology Dependent Graph,ODG):一个本体的本体依赖图是一个有向图G=,其中V是节点的集合,E是边的集合;节点的元素v=是本体定义元模型类的individual,其中vt是节点的类型,它对应本体定义元模型的类名,A是指节点的属性集;边的集合的元素e=是本体定义元模型中关联的实例,其中,et是指边的类型对应本体定义元模型的关联名字,from和to指边的起始点和终点,边的方向表示节点之间的依赖关系。

本体依赖图的构造思想:根据ODM中OWL与RDFS元模型的层次结构,对本体中的节点进行访问,每访问一个节点,就从具体向抽象进行遍历,在遍历的同时构造该节点对应的本体依赖图中的节点,当访问到根类型,也就是RDFSResource的时候结束遍历过程,返回完整的本体依赖图的节点集。

本文扩充了金龙飞等人的论文中举的本体实例作为实验本体[3],根据本体依赖图的定义,得到实验本体对应的ODG的内容如下:节点集合V={v0,v1,..v19},边集合E={e1,e2…e29}。

2 分层化简本体依赖图的构建策略

本文提出一种基于本意依赖图的边的分类方法,用来降低本体依赖图的复杂程度。根据ODM和ODG的定义,可以将边分为以下几类:A类:等价边,边的两个顶点是对同一概念的不同描述;B类:继承、部分与整体聚合关系边;C类:对象属性;D类:交、并、补等连接关系的边;E类:数据属性;F类:其它限制、约束(如基数约束)等关系。

根据上面对于边的分类,我们可以将本体中元素间的依赖关系分为以下几类:等价依赖:对应A类边;继承依赖:对应B类边;属性依赖:对应C类和E类边;关系依赖:对应D类边;限制约束依赖:对应F类边;

可以根据不同本体的实际情况选择需要考虑的类型的边,来将ODG进行分层。一般来说,有以下结论成立:1)等价边的两个节点是对同一概念的不同描述,2)继承、部分与整体聚合关系边;3)对象属性:对象属性将两个概念相互关联起来,被对象属性关联起来的两个概念存在关系。化简后的ODG为V={v0,v2,v3,v4,v6,v7,v8,v10,v12,v13,v14,v16,v17,v19}, E={e2,e3,e4,e7,e8,e9,e10,e11,e14,e18,e21,e22,e23,e24,e25}。

对比看出,化简后的ODG减少了7个节点(占总节点数的35%),15个边(占总边数的51%),由此可看成分层化简本体依赖图可提高本体切片的效率。

3 本体切片的生成

定义(本体切片)本体切片可以看做是一个G和C到G1的映射:,其中,G表示本体依赖图G=;C表示本体的切片准则,C=,其中I指定了初始节点的集合,本体切片准则中的元素D指定了切片的路径。

本文对Car本体进行分层切片就是在ODG中v2能到达的所有节点和边。令C=,其中D={et|et属于边的类型},得到的本体切片G1如下:V={v0,v2,v4,v10,v14,v16},E={e2,e3,e4,e18,e21,e22}。

4 結论

通过计算比较得出,本体切片中包含了6个节点和6条边,相对于实验本体来说,节点减少了70%,边减少了79.1,这大大降低了本体的复杂度。在实际的本体构建中,我们可以利用本体切片的简化性,从原有本体中抽取出我们感兴趣的本体,在此基础上构建新的复杂的本体。

参考文献:

[1]Mark W.Program slicing:Formal,psychological and practical investigations of an automatic program abstraction method [D].University of Michigan,1979.

[2]甘健侯.语义Web及其应用-基于本体、描述逻辑、语义网络[M].昆明:云南科技出版社,2007.

[3]金龙飞,刘磊.一种本体演化波及效应分析方法[J].电子学报,2006,34(8):1469-1474.