即时通信基本概念范例(3篇)

时间:2026-02-28

即时通信基本概念范文

关键词:形式;关系;意义;信息;形上之思

中图分类号:B08文献标识码:A文章编号:1000-2731(2012)02-0028-04

在信息论创立之初,对于是否选择“信息”一词来称谓他所发现的一个新函数,香农曾感到颇为犹豫,因为这个词令人困惑,在英语中,它已经有了太多的含义,当前学界也极易将形式、关系与意义等与信息概念混为一谈。然而,从哲学传统的角度思考,现代信息论及其哲学观念中的“信息”一词确然契合了诸多深刻的思想渊源。从词源学上说,英文“information”一词的词根“form”,首字母大写时(Form)指称柏拉图哲学的“理念”,小写时指称亚里士多德哲学的“形式”,都是西方哲学传统中的重要概念,而且“Information”的动态形式是“inform”,它常取“赋予某对象以形式或特征”之意。由此概念分析处人手,我们便可开启信息哲学的形上之思。一、从“形式”概念看信息哲学中的形上问题

在信息哲学中,关于形式概念的哲学思考乃是隐而不显的,因其可谓信息哲学的根基之思,其内容本身本不纳入信息哲学的理论框架之中,却又时时处处贯穿于信息哲学的诸论之内。因此,在一定意义上,将形式之思的理路阐述清晰化、在场化,或许既是一种哲学形而上学沉思中的必然,又是一种信息元哲学探究中的可能。

在柏拉图哲学中,理念(Form)是一种绝对的、永恒的和超验的实存之物,世间万物因分有或者模仿理念而成其为自身,获得其本质,成为理念的一个摹本。分有物或者模仿物显然只能部分地具有理念的“完美性”,而永远不能成为它。因此,现实世界是虚假的,是杂多,而唯有理念世界是真实的,是完美的“一”。形象地说,柏拉图为我们描述了一幅由上而下的形式分有的运动图像,即形式作为内容由理念散发而流动到世间万物之处,进而塑造出万物之显像,而这也正是“inform”一词的本义。或许我们可以说信息(information)作为“inform”的名词化,正是表达这一形式分有之流动过程的描述性概念,正是由它描述了柏拉图哲学中世间万物形成的动力源泉、内在机理和时空构式。由此,我们便可看出信息在哲学中的存在论意蕴,即信息虽不能直接被看作万物形成的实体性本原,但它作为形式分有、流动的显像仍然是万物“形――成”的过程性本原,由此,我们便也重新理解了赫拉克利特的流变之说。

亚里士多德关于形式(form)的思想是对柏拉图理念论的继承和转换。在柏拉图那里,理念高于世间万物,而亚里士多德则说形式蕴含于万物之中,它与万物须臾不可分离,甚至形式就是第一实体。在四因说中,亚里士多德指出,形式因乃是第一因,动力因和目的因都可以归于形式因,即使是质料也离不开形式,因为我们在任何地方都不可能发现“原初质料”这样的东西,即没有无形式的质料,形式就是一切事物的“是其所是”,质料只是潜在性,而形式则是现实性,甚至自然的过程就是质料从一种形式到另一种形式的连续转换的过程。由此我们可以看出形式概念在亚里士多德哲学中的核心地位,而如果将此思想延展开来,我们便会发现亚里士多德的形式与信息哲学中的信息之间有着一条可以明确沟通的纽带。

在柏拉图哲学中,形式乃是被给予物质的,而亚里士多德将其转换为形式内在于物质的问题,这便形成西方哲学传统中的一个重要分歧。17和18世纪的欧洲经验论哲学认为知识所赖以构成的形式寓于知觉之中,而休谟则怀疑离开了客观的形式,经验只能是散乱无序的,后来,知觉被笛卡儿的主观理性所代替。走出独断论迷梦的康德又将质料(matter)和形式(form)纳入到先验范畴之中,指出心灵本就是形式之家,知觉的形式乃是由先验心灵所赋予的,由此我们才能认识世间万物。然而20世纪的哲学则更倾向于形式与质料内在不可分离的观点。向来少谈客观实在问题的现象学家海德格尔也说:“我们对这个物的概念,即把物当作具有形式的质料的概念,也是有怀疑的。……质料与形式的区分,而且以各种不同的变式,绝对是所有艺术理论和美学的概念图式。不过,这一无可争辩的事实却并不能证明形式与质料的区分是有充足的根据的”。

如果我们返回到亚里士多德的形式之思中去,便可以发现这样一种扩展,即世间万物的运动,体现为由潜在性向现实性的转换,实质上亦是形式显示的过程,是事物之本质生成的过程。如果相对于柏拉图的形式分有思想,我们将亚里士多德的运动理论称之为形式显示,那么信息(information)便可具有如下含义,即事物生成和存在的过程性显示。这一思想在当代信息哲学中得到了鲜明地回应。关于信息本质的研究指出:“信息是标志间接存在的哲学范畴,它是物质(直接存在)存在方式和状态的自身显示。”由此不仅承接了古代哲学的哲思,而且扩展了其思想内涵。这主要体现在信息哲学作为20世纪的哲学思潮,作为时代精神的精华,坚持摒弃二元分立,将形式与质料内在的统一起来,认为在形式显示之中,质料乃是始终作为一个不可分割的基底起作用的。“潜能当它还未曾转化为现实的时候,它是关于将要产生的现实的信息的载体;由潜能转化而来的现实则是它由以转化而来的在它之先的潜能的信息载体,同时,它又作为一种新的潜能而潜在规定着更新形式的现实的信息。”。由此,信息哲学以一种崭新的方式回答了古老形而上学的基础性发问,即“究竟为什么在者在而无反倒不在?”。信息哲学认为信息乃是在者在之根据,曾经在、现在在和将来在之根据,而无,即无信息,因而无形式显示,无本质生成,无成其自身之过程和根据,因而不在。

二、信息哲学中形上问题的“关系”维度

在学界关于信息哲学的论辩中,形式和关系概念往往处于核心地位,也往往被赋予浅薄化、平面化和实体化的解释。如同上述关于形式概念的研究旨在深刻化、立体化和过程化信息哲学的形上之思,关系概念在其中也应体现更加丰富的意义。如果说形式是信息哲学中的奠基性概念,那么关系概念则将信息哲学的形上架构铺展开来。

在信息哲学中,人、自然与社会,以及身与心的关系得到了崭新的诠释。在信息哲学关于存在领域分割的逻辑推演中,存在领域被划分为四个面相:客观实在、客观不实在、主观实在与主观不实在。从唯物主义的实在观出发,我们可以认为客观实在=物质,客观不实在+主观不实在(精神)=信息,由此,整个世界在其基础的关系层面便获得了一

个新奇的诠释视角:人,作为身心的统一体,便包含着客观实在(物质)与主观不实在(主观信息)的双重因素;非人化的自然,便是客观实在(物质)与客观不实在(客观信息)的统一;社会,具有人化与化人的统一性,便更是客观实在(物质)、客观不实在(客观信息)与主观不实在(主观信息)的三元一体。

基于上述论断,可以认为信息作为不实在,贯穿于人、自然与社会的构成之中,实际上,它也同样处于三者间的关系之中。

一方面,在人与自然及其相互关系中,信息构成二者,并作为“显示”与“意向”的统一将二者联结起来。在坚持“世界统一于物质”原则的基础上,我们认为自然,尤其是非人化的自然乃是以物质为其基质的,同时又由下而上地将自身在客观信息层面上显示出来,而这种基质与显示的统一才是完整的自然本身。任何将信息排除于自然的构成之外的思想,都无一例外地沉陷于实体思维的樊笼之中了。人,作为“一切社会关系的总和”,乃“是一个多维的存在:自然的、社会的(文化的);肉体的、灵魂的;生理的、心理的、行为的。”人,体现着自然、社会、心灵、身体等因素相互作用的复杂性关系,或者说,在信息哲学的视角中,人是多重信息综合建构的产物。在此意义上,人是世界上具有最为复杂维度的存在者,因此,无法对其进行简单还原性的分析。然而,就人与自然的关系而言,“意向”却构成了其中最基本的联结模式。“意向”,在当代哲学研究中,其内涵并不局限于在胡塞尔哲学中的原初意义,具有更为丰富内涵的“下向相关”或“指向”应该成为“意向”一词的深化意义。在信息哲学中,对“意向”一词的使用,便是赋予了其如此更深刻的意义:在广义上,它表征着信息作为原发点,以一种指向的姿态,将其自身相关于物质的动态关系;在狭义上,它意指着主观信息作为原发点,通过多重中介,指向并将其自身下向相关于客观存在物的动态关系。由此而言,具有主观能动性的人正是通过“意向”模式,与物质的自身“显示”相“冲撞”,进而建立起其与自然的密切关系,于是,诸多相互作用产生于其中。

另一方面,在人与社会及其相互关系中,信息亦构成二者,并作为“突现”与“还原”的统一将二者联结起来。“能动地把握、利用、开发、创造和实现信息是人类社会的本质。”这是信息哲学从人与社会的关系出发,对社会概念高度抽象的概括。建基于物质――信息世界的双重演化观念,从社会的内在生成视角出发,认为社会乃是人与自然、人与人之间的相互关系在物质层面与信息层面双重演化的动态过程。社会中人与自然之间相互关系的主要内容已经在前文中简单论述,这里仅指出,其中的“意向”在社会中突现为“集体意向”的复杂状态,而“显示”则更具有了间接性的、多维度的中介机制,从而使得人与自然的关系更趋复杂化。就社会中人与人之间的关系而言,“人之所以展示为人是因为人通过了以社会为中介的生理、心理和行为的二维结构的建构。”并且,正是通过这二维结构的进化发展,将人与社会的关系建构成为一个“突现”和“还原”双向作用的动态过程。“一方面,人的个体集合形成的类构成了人的社会,另一方面,人的类的存在形式社会又规定和影响着人的个体的存在;一方面,社会的活动必须以人的个体的活动为基础,并且,社会的活动又只能存在于一个个的个体的活动之中;另一方面,个体的活动又必然会自觉或不自觉地以与社会整体的活动模式相一致的方式来塑造自身,并且个体的活动又一定会被整合到社会整体的活动模式之中。”

由此可见,“显示”与“意向”“突现”与“还原”乃是信息哲学中关系问题的具体双向维度,它们两两相合,协同整体架构起信息哲学中世界如其所是的复杂性图景。

三、形式生成和关系构成:信息哲学中的意义忖度

在信息哲学诞生之前,信息概念远没有意义概念那么深厚的哲学意蕴。亚里士多德在《范畴篇》中便已经涉及到意义理论的诸多面相。然而,意义问题却仍然是西方哲学传统的―个盲点,因为“意义这个‘东西’太原本了,它很难被完全对象化,但是这不是说它跟对象没关系,对象恰恰因为它而可能。”在20世纪哲学中,受摒弃二元分立的思维方式影响,哲学传统中的意义层面被重新“捕捉”到了。信息哲学将意义问题纳入其研究视域中既是自身研究发展的需要,也是20世纪哲学研究日益走向深化的产物。当前国际信息哲学研究主要表现出两种路径,一是信息的形而上学路径,二是语言和逻辑分析的路径。在第一条路径中,意义问题往往被淡化,而没有形成主题研究,而在第二条路径中,由于相关术语的误用则造成一种“可悲的混乱”。实际上,在信息论创立之初,韦弗就指出:“信息一词在该理论中是在特殊意义上使用的,不应与日常用法混为一谈,尤其是不应与意义混为一谈。”许多信息语义学者持有意义实在论的立场,而将主体的因素排除在外,从而未能给信息哲学中的意义问题提供合理的解答。在20世纪80年代以后,随着以英美哲学家为主体的日常语言哲学传统和以欧洲大陆哲学家为主体的诠释学、普遍语用学及超验语用学日益走向融合,哲学研究也出现了从意义主题到信息主题的转向,其中,信息与意义的关系凸现出来,而对这一问题的思考体现在信息哲学领域中,便形成了信息哲学中的意义问题。

在分析哲学中,意义问题并不处于形而上学的,研究域中,然而信息哲学中的意义思考却与形式、关系等形而上学基本概念相关紧密,甚至可以说,“形式生成”与“关系构成”共同呈现了研究意义问题的出发点和前进方向。

一方面,从形式之思来看,作为物质(直接存在)存在方式和状态的自身显示的信息,从其原初的生成来看,乃是与人无涉的、纯粹自然的物理学现象,由此而呈现的信息,即为客观信息,或称自在信息。“在这个阶段里,信息还只是以其纯自然的方式,自身造就自身、自身规定自身、自身演化自身,从而展开其自身纯自然起源、运动、发展的历程。”这里的“自身”二字表明了将某种类似于主体的自主性赋予信息,从而为客观信息中意义的生成架设了理论基础。从传统形而上学的视角来看,物理事物之间最根本的相互关系便是以形式为动力的相互流动和以形式为目的的相互转换,而在物理学中,它是以“相互作用”为量纲的。“从现代科学的理论来看,事物间的相互作用是通过物质(包括质量和能量)和信息交换来实现的,……就相互作用必然引起参与相互作用之事物的物质和信息结构的改变这一隋景来看,凡是相互作用过程都必然会伴有价值关系之发生。”在这里的价值关系便是客观信息中原初生成的意义内容。这里的意义乃是“表示在价值和地位含义上的意义(Bedeu-tung)。”

另一方面,“在一种另外的含义上,意义所表示的就恰如一个语词的意义、语词组合所能够具有的意义。而意义的这一含义以某种方式是与那种我们称之为意蕴的东西联系在一起的,并且,此含义要比意义和意蕴的上述那种所谓‘价值’含义远为源本。”由此看来,由于信息哲学不容许将其自身仅仅作为科学哲学的一个分支,而且具有一种元哲学的宏大视域,因而探究意义的源本结构便更是题中之义。

即时通信基本概念范文

关键词:数据元素;数据;数据标准化;元数据;信息分类与编码

1数据元素基本理论

1.1数据元素及相关定义

在数据元素理论研究中,下面的术语是很重要的,理解好这些术语是理解数据元素的基础。

①数据元素(DataElement):用一组属性描述定义、标识、表示和允许值的一个数据单元。

②数据元值(DataElementValue):数据元能许值集合中的一个值。

③数据项:数据元的一个具体值。

④同义名称:与给定名称有区别但表示相同的数据元概念。

⑤限定词:帮助定度和呈递唯一性概念的术语。

⑥域:一种属性的可能数据值的集合。

⑦值域:允许值的集合。

⑧域名:将数据元的值域及度量单位利用一个统一的名称来表示。

⑨对象类:对象集,现实世界中的想法、抽象概念或事物集合,有清楚边界和含义,并且特性和其行为遵循同样的规则面能够加以标识。

⑩对象:可要想象或感觉的世界的任一部分。

(11)特性:对象类的所有个体所共有的某种性质。

(12)表示:值域、数据类型的组合,必要时也包括度量单位或字符集。

(13)对象类词:数据元名称的成分,用于表示其所属的对象类。

(14)特性类词:数据元名称的一个成分,用于表述对象类的特性,(数据元名称的一个成分,表述数据元所属类别)。

(15)表示类词:数据元名称的成分,用于描述数据元的表示形式。

(16)数据模型:以反信息结构的某种方式对数据组织的某种描述。

1.2数据元素规范与标准化框架

1.2.1数据元素的组成

数据元由对象类、特性和表示三部分组成,其中对象类用于收集和存储数据的事物,例如,人、井、岩芯、管线、储罐都是对象类等;特性是用来区别和描述对象的,例如,颜色、性别、年龄、收入、地址、价格等均为特性;数据的表示部分中最为重要的方面是值域,值域是数据元允许(或有效)值的集合。对于值域,数据元中存在两种类型的值域,一种是所谓取值是固定的,即取值是可枚举的,例如,人眼睛颜色这个数据元,其取值可能包括:Brown、Gray、Green、Hazel、Blue,另一种是概括的,即数据元取值是有定义域约束的,其取值可能是有限的,但是无法列出全部值,例如人的年龄,其取值范围可能是1-200,并且每位要求是十进制表示。

1.2.2数据元结构模型

(1)数据元概念(DEC):对象类与特性联合在一起形成数据元概念,数据元概念在数据分类中是非常有用的,一般来讲,数据元概念是一个抽象意义上的数据元,但这类数据元的对象类已经限定,只有经过对数据元概念中的各个要素再进一步的限定,才使数据元概念变成真成有意义的应用数据元素。所以,数据元概念本身具有抽象性与分类性。

(2)通配数据元:特性与表示联合在一起形成通配数据元,通配数据元素也具有抽象意义,对于这类数据元来讲,它的特性与表示已经确定,所以它具有通配性,如果将这类数据元与具体的对象类联系在一起,那么该类数据元就可以具体化为有意义的应用数据元。

(3)数据元类型:数据元概念与通配数据元形成数据元类型。

数据元是由数据元概念和表示两部分组成。当一个表示被联合到一个数据元概念上时,就能够产生数据元。数据元和数据元概念间存在多对1的关系,也就是一个数据元必须对应一个数据元概念,而一个数据元概念可以有多个数据元,换句话说,多个数据元可以共享一个数据元概念。

数据元与表示之间的关系是一对一的关系,也就是一个数据元需要一个表示。当数据元的概念模型相同而表示不同时就是两个不同的数据元,数据元中的表示是描述数据元中的数据元概念中的特性,即数据元中的特性有且仅有一个表示。

在数据元概念中对象类和特性之间是一对一的关系,一个对象类需要只需要一个特性(或者特性类),一个特性(特性类)只描述一个对象类,当一个特性和一个对象类建立关联时就产生了一个数据元概念。

同实体关系类的数据模型相比,模型中的实体相当于数据元中的对象类,而实体的属性本当于数据元中的特性和表示。

1.2.3数据元素的属性

数据元素本身也是一个事物,既然是事物那么就需要属性来描述这一事物,通常我们也将描述属性称为描述数据元素的元数据。

1.2.4数据元结构模型

经过对数据元理论的深入研究,我们抽象出图2的模型,该模型反映出了数据元概念、表示、基本数据元以及应用数据元间的关系。

1.2.5值域基本模型

按照数据元素理论,给出了数据元的值域模型。该模型将数据元素的值域抽象为概念域,即所谓的“域名”,一个概念域可能会与多个值域有关系;概念域可能是枚举类型的,也可以是非枚举类型;同样,值域可能是枚举值域,也可能是非枚举值域。

2数据元的元模型

经过对数据元理论与实际数据规范化应用的研究,我们提出了数据元的元模型。

该框架模型是将对象类、特性类、分类模式由此演生的基本数据元和应用数据元、值域以及数据标准值、实例标准值以及标准实体有机的关联在一起。揭示了数据元与应用的紧密关系。整个模型高度概括了数据标准化的核心工作。

3数据元素与信息编码间的关系

有些学者讲过,信息标准化实质是信息代码化的过程,周知,信息分类与编码在整个企业信息标准化中占有基础的不可替代的地位。因此如何对企业的各种信息进行有效的分类,并对其进行编码这是信息化过程中一个非常重要的过程。其实数据元素与信息分类及编码有着密不可分的关系,在表1中给出了数据元素分析方法与信息分类与编码的对应关系。

4数据元应用的领域

数据元素理论属于信息标准化的基础理论,即是数据规范化理论基础。数据元分析在信息分类、数据的集成参考模型、数据模型优化设计、数据元字典以及制订数据交换标准等方面得到应用。

数据元的研究,目前在国际上相当流行,而在国内的研究还处于起步阶段。通过几年的研究,目前,我们已经将这一方法论用于石油上游的数据规范化中,并取得了良好的效果,目前,正在将这一方法论用于中石油的ERP数据平台中的数据规范化中。相信,随着这一方法论的在石油石化领域的不断应用,必将为石油石化信息化建设起到科学的指导与推动作用。

即时通信基本概念范文篇3

摘要:为了从语义层次上解决P2P资源匹配问题,本体论被引入,试图通过采用可扩展的信息建模工具使得网络资源发现系统能够高效、精确地发现P2P网络资源,同时获得良好的灵活性。然而当前采用的技术要求网络节点共享一个集中的网络资源本体,这种技术不适合高度动态性和分散性的P2P网络。提出一种基于局部本体的P2P网络全局知识视图构建方法,提供了网络资源的全局描述,同时保持了对资源语义的揭示,这种方法不需要网络节点维护一个共享的集中的本体,可扩展性强,对资源的描述更灵活,更适合用于P2P网络资源匹配。

关键词:本体;P2P,本体映射;知识视图

中图分类号:TP301文献标识码:A文章编号:1007-9599(2012)19-0000-03

1介绍

随着P2P(对等网络)技术的飞速发展,对网络节点的信息存储、传输和处理能力的要求迅速增长,对海量信息的搜索与利用成为当前P2P网络资源搜索技术的一个重要研究和应用领域。目前实用化的P2P资源搜索技术主要是基于关键字的匹配,其对资源信息的语义的揭示上有局限性。本体论[5]作为一种能够在语义和知识层次上描述资源信息系统概念模型的建模工具,自提出以来就引起国内外众多科研工作者的广泛关注。本文提出一种基于P2P网络局部本体概念聚类,构建网络全局知识视图的方法,全局知识视图为分散在网络中的节点提供了网络资源全局视图的结构化描述,为在P2P网络中进行基于局部本体的分布式资源匹配提供了有效途径。

2相关技术

2.1本体

本体[5](ontology)是用于描述或表达某一领域知识的一组概念或术语,既可用于组织知识库较高层次的知识抽象,也可用来描述特定领域的知识。本体通过知识来表示元语,从而捕获某个领域的语义,使得机器能够(部分)理解该领域中概念间的关系,通过公理或规则,还可以捕获其他知识,如领域背景知识等。本文中将本体定义为,其中C表示概念集合;P表示属性集合;R表示关系集合;A表示公理集合。概念表示特定领域中的一组或一类实体或者事物,每个概念可以由属性分别描述其不同方面的特点;关系描述了概念与概念之间或者属性与属性之间的关系。关系主要可以分为两类:分类关系(taxonomicrelationship)和关联关系(associativerelationship)。分类关系表示概念与概念之间的父类,子类等上下位的层次关系;关联关系表示除了上下位层次关系以外的其它关系。属性是从不同方面,不同角度对概念的描述。公理用来表示概念或者实例的约束。

3全局知识视图的构造

在P2P网络中,每个节点的资源由它自己的本体来描述语义,即局部本体。通过对底层局部本体的分析后建立一个共享的全局知识视图。局部本体的每一个概念和属性都将映射到全局视图对应的视图元素上。当增加新的资源时,只需要增加新的映射关系,而不需要对原有的映射和全局知识视图进行过多的更改。

全局知识视图从宏观上对P2P网络中的数据源的信息进行了统一的描述;相对于全局知识视图而言,微观上,局部本体除了定义概念、属性等基本部分之外,还可以定义局部数据源的位置,类型等信息,供下一步查询调用时使用。本文构建全局知识视图的步骤如下:

(1)分析P2P网络各局部资源本体中的概念间的相似关系;

(2)基于局部本体之间概念的相似关系生成知识视图元素;

(3)建立局部本体中概念、属性与全局知识视图元素的映射关系。

3.1局部本体间的概念聚类

构建全局知识视图的一个重要内容是发现不同局部本体中存在的语义级的概念关联,通过语义的联系将不同本体内的概念映射到全局知识视图元素上,其中最基本的步骤是分析概念之间的相似关系,随后提取出概念间的共性的部分将其映射到全局知识视图中。假设在一个P2P网络中存在n个节点分别提供自身资源的局部本体描述:,对应第i个局部本体的概念集中所包含的概念数为,那么理想情况下,全局知识视图中对应于概念的视图元素的数量是;实际情况中,由于局部本体间的异构性造成具有等价或者相似的概念在全局视图中有多个知识视图与之对应,这种冗余造成知识视图的体积过于庞大,最差情况下,如果概念集中的每个概念都对应于一个全局视图元素,那么全局概念视图元素的数量将达到,假定相似度计算为基本运算,整个网络中本体的概念相似度计算的复杂度将达到。因此,本文考虑将局部本体中的概念进行聚类,从而降低概念间关系分析的复杂性。

3.2全局视图元素的构造

知识视图元素是对本体中实体的抽象,视图元素的构造过程正是对本体中实体的抽象过程,3.1节中描述的概念聚类算法是进行这一抽象过程的基础。

在本体中,概念间主要包括四类主要关系:等价关系(equivalentClass),继承关系(subClassof),关联关系(associateWith),不相交关系(disjointWith)。在构造视图时,视图元素之间的关系也应当体现概念间的这些主要关系,并且由于不相交关系的普遍性,在知识视图中不考虑元素的不相交关系,在构造视图元素之前,基于由概念聚类算法所得到的类簇,通过本体推理机(如RacerPro)和领域本体得到类簇内各概念之间的等价关系。对于相互等价的概念,在知识视图中用一个视图元素表示,因此,类簇中的每个等价类对应于知识视图中的一个视图元素。基于此,将概念间等价关系简记作,概念所属等价类记作,即若概念满足,记作,对类簇进行等价划分并且对应每个等价类创建相应的视图元素。

3.3全局视图元素间关系构造

视图元素间的关系反映了本体中实体之间的关系,例如,概念间的等价关系使得概念由同一个视图元素表示,概念间的继承关系也应该在相应视图元素之间体现。简记概念对应的视图元素为,构建全局视图元素间的关系规则如下:

(1)对于概念,若其满足,则,即概念在视图中对应的视图元素相同:3.2节中,视图元素的构造已经保证了这一点,概念若满足,则它们属于相同的等价类,因此可以保证。

(2)对于概念,若其满足即若概念是概念的子概念,则构建关系,其中是对应于的二元关系:该规则保证,若概念是概念的子概念,那么它们在知识视图中对应的视图元素也具有联系。

(3)对于概念,若它们的类层次体系中有公共的祖先概念,即若使得,那么有关联关系。

3.4全局知识视图的维护

对于P2P节点资源的更新(包括添加,删除)如果引起了局部本体变化,全局知识视图要做相应的变化如下:

添加规则:如果被添加概念,使得,其中是类簇的等价类,那么知识视图不作变化,否则新增视图元素,根据与其他概念的关系,调整在视图中的位置。

删除规则:如果对于被删除概念,使得,其中是类簇的等价类,仅删除视图元素及其联系,否则将等价类一并删除。

4分析及实验

4.1概念聚类效果分析

如果直接在P2P网络局部本体的概念之间进行相似度计算,假定局部本体中概念总数是N,那么计算相似度的复杂性是。本文采取先对概念进行聚类再进行相似度计算,假定每个类簇概念树相当,那么存在k个类簇的情况下,相似度计算的总次数是:次,平均复杂度是:,但是在实际情况中,局部本体中的概念所属于的领域本体数量并不多,通常只有少数几个,所以实际上并不能达到的复杂度。但是对先对概念进行聚类可以有效的减少相似度的计算次数。

4.1.1相似度计算次数比例随类簇数变化分析

图4.1.1中,横坐标为类簇数量,纵坐标为相似度计算次数比例,其中,表示对概念进行聚类后所进行的相似度计算次数,表示对概念进行聚类后所进行的相似度计算次数。假设,概念数为1000,初始类簇数量少于20个,并且每个类簇中的概念数量服从随机分布,图5.1.1显示了随类簇数量变化,聚类前后实际计算次数的比例变化。随着类簇数量的增多,相似度计算次数有效得到减少,当增加到一定程度之后,r减少的速度减缓。说明增大到一定数量后继续在增大并不能有效使r减小,应当把控制在合理范围内,在实际聚类过程中,的大小取决于网络中的概念所涉及的领域本体数量的大小。

图4.1.1聚类后相似度计算次数比例随类簇数量变化图

4.1.2相似度计算次数比例随类簇数量变化分析

图4.1.2中,横坐标为概念数量,纵坐标为相似度计算次数比例,其中,表示对概念进行聚类后所进行的相似度计算次数,表示对概念进行聚类后所进行的相似度计算次数,图线L1、L2、L3分别对应类簇数为4、8、12。途中显示,当类簇数一定时,相似度计算次数比例r随概念数量没有明显变化,即相似度计算次数比例r与概念数量,无关。同时,相似度计算次数比例r随类簇数量的增大而减少,和图4.1.1的结果相符。

4.1.3视图构造效果分析

构造全局知识视图的作用是代替全局本体对网络中的资源语义进行描述,而构造全局知识视图的目标是:收集从不同节点得到的局部本体后,尽量减少对资源语义的重复描述。具体而言,是尽量减少局部本体之间的等价概念在全局知识视图中所对应的视图元素的冗余。因此,本实验分析文本所提出的全局知识视图构造算法减少视图元素冗余的效果。实验参数如表4.1所示:

表4.1实验参数

由图4.1.3可知,当概念数增多时,视图元素和概念书的比例也相应的增多了。但是这种增多的趋势同时也随概念数的增多而相对变得平缓。并且视图元素和概念数的比例保持在一个比较低的比例,相当于1个视图元素对应3.3个概念。因此,本算法对减少视图元素的冗余是有效的。

5总结与展望

本文提出了一种基于概念相似度聚类的P2P网络资源语义全局知识视图构造的方法。试图通过按照所属领域不同对概念进行划分,降低在全局知识视图元素构造过程中的概念相似度计算量。基于此的全局知识视图元素构造的规则和方法能够有效地用于全局知识视图的构造。并且实验证明,本视图构造算法有效的减少了视图中视图元素的冗余。

在本文的方法中,相似度的计算与概念聚类、视图元素的构造具有一定相对独立性。相似度计算方法也是当前研究的一个重要内容。相似度计算的准确性间接影响到了视图构造的效果,而相似度计算的速度直接影响到了视图构造的速度。因此,适合于P2P网络资源局部本体间的概念相似度计算方法也非常值得进一步的研究。

参考文献:

[1]Pantel,P.,&Lin,D.K.DiscoveringWordSensesfromText.ProceedingofACMSIGKDDConf.onKnowledgeDiscoveryandDataMining,Edmonton,Canada,2002,613-619.

[2]DoHH,RahmE.COMA-Asystemforflexiblecombinationofschemamatchingapproaches[C].PorceedingsofVeryLargeDataBasesConference.Roma,Italy.2001:610-621.

[3]MaedcheA,StaabS.MeasuringSimilaritybetweenOntologies[C].ProceedingsoftheEuropeanConferenceonKnowledgeAcquisitionandManagementEKAW-2002.2002:251-263.

[4]C.Felbaum.(1998)WordNet:AnElectronicLexicalDatabase.MITPress,Cambridge,Massachusetts,1998.

更多范文

热门推荐