您好、欢迎来到现金彩票网!
当前位置:刘伯温四肖中特料 > 推理子句 >

Jena 简介

发布时间:2019-08-25 18:57 来源:未知 编辑:admin

  developerWorks 中国 正在向 IBM Developer 过渡。 我们将为您呈现一个全新的界面和更新的主题领域,并一如既往地提供您希望获得的精彩内容。

  Java 程序员将越来越多地得益于具有使用 RDF 模型的技能。在本文中,我将带您体验惠普实验室的开放源代码 Jena Semantic Web Framework(请参阅参考资料)的一些功能。您将了解如何创建和填充 RDF 模型,如何将它们持久存储到数据库中,以及如何使用 RDQL 查询语言以程序方式查询这些模型。最后,我将说明如何使用 Jena 的推理能力从本体推断模型知识。

  本文假设您已经就图形、三元组和模式等概念方面对 RDF 比较熟悉,并对 Java 编程有基本的了解。

  我们从基本操作开始:从头创建模型并向其添加 RDF 语句。本节,我将说明如何创建描述一组虚构家庭成员之间关系的模型,如图 1 中所示:

  将使用来自“关系”词汇表(请参阅参考资料)的属性siblingOf、spouseOf、parentOf和childOf来描述不同的关系类型。为简单起见,家庭成员用来自虚构名称空间的 URI()进行标识。词汇表 URI 通常以 Jena 代码形式使用,所以将它们声明为 Java 常量会非常有用,减少了错误输入。

  当您通过 Jena 的 API 来使用模型时,为模型词汇表中的每个属性定义常量非常有用。如果有词汇表的 RDF、DAML 或 OWL 表示,Jena 的 Schemagen 工具可以自动生成这些常量,使您的工作更加容易。

  Schemagen 在命令行中运行,使用的参数包括模式或本体文件的位置、要输出的类的名称和 Java 包。然后可以导出生成的 Java 类,其Property常量用于访问模型。

  还可以使用 Ant 将 Schemagen 作为构建处理的一部分来运行,保持 Java 常量类与正在变化的词汇表保持同步。

  Jena 的ModelFactory类是创建不同类型模型的首选方式。在这种情况下,您想要空的、内存模型,所以要调用的方法是ModelFactory.createDefaultModel()。这种方法返回Model实例,您将使用它创建表示家庭中每个成员的Resource。创建了资源后,可以编写关于这些资源的语句并添加到模型中。

  在 Jena 中,语句的主题永远是Resource,谓词由Property表示,对象是另一个Resource或常量值。常量在 Jena 中通过Literal类型表示。所有这些类型共享公共接口RDFNode。将需要四个不同的Property实例表示家庭树中的关系。这些实例使用Model.createProperty()创建。

  将语句添加到模型中的最简单方法是通过调用Resource.addProperty()。此方法以Resource作为主题在模型中创建语句。该方法使用两个参数,表示语句谓词的Property和语句的对象。addProperty()方法被过载:一个过载使用RDFNode作为对象,所以可以使用Resource或Literal。还有有益过载,它们使用由 Java 原语或String表示的常量。在示例中,语句的对象是表示其他家庭成员的Resource。

  通过使用三元组的主题、谓词和对象调用Model.createStatement(),还可以直接在模型上创建语句。注意以此种方式创建Statement不将其添加到模型中。如果想将其添加到模型中,请使用创建的Statement调用Model.add(),如清单 1 所示:

  整个代码示例 FamilyModel.java 还说明了语句批量如何一次添加到模型中,或者作为一个数组或者作为java.util.List。

  构建了家庭模型后,我们看一下如何使用 Jena 的查询 API 从模型中提取信息。

  程序化地查询 Jena 模型主要通过list()方法在Model和Resource接口中执行。可以使用这些方法获得满足特定条件的主题、对象和Statement。它们还返回java.util.Iterator的特殊化,其具有返回特定对象类型的其他方法。

  我们返回清单 1的家庭模型,看一下可以查询它的不同方法,如清单 2 所示:

  不是所有的应用程序都从空模型开始。更常见的是,在开始时从现有数据填充模型。在这种情况下,使用内存模型的缺点是每次启动应用程序时都要从头重新填充模型。另外,每次关闭应用程序时,对内存模型进行的更改都将丢失。

  一种解决方案是使用Model.write()序列化模型到文件系统,然后在开始时使用Model.read()将其取消序列化。不过,Jena 还提供了持久化模型,它们会被持续而透明地持久存储到后备存储器。Jena 可以在文件系统中或在关系数据库中持久化它的模型。当前支持的数据库引擎是 PostgreSQL、Oracle 和 MySQL。

  WordNet 是“英文语言的词汇数据库”。我使用的是 Sergey Melnik 和 Stefan Decker 的 RDF 表示。它具有四个单独的模型,本文示例中将使用其中三个模型。

  WordNet-nouns 模型包含 WordNet 表示的所有“词汇概念”和用于表示每个概念的“单词形式”。例如,它包含由单词形式“domestic dog”、“dog”和“Canis familiaris”表示的词汇概念。

  WordNet-hyponyms 是第三个模型。它定义模型中概念的层次结构。概念“dog”是概念“canine”下位词,而“canine” 本身是概念“carnivore”的下位词。

  为了说明如何导入和持久化模型,我将 WordNet 1.6 数据库的 RDF 表示导入到 MySQL 中。因为我使用的 WordNet 表示采用多个单独 RDF 文档的形式,将这些文档导入到一个 Jena 模型中会合并它们的语句。 图 2 说明了 Nouns 和 Glossary 模型合并后 WordNet 模型的片段的结构:

  创建了模型后,可以从文件系统中读入 WordNet RDF 文档。不同的Model.read()方法可以从Reader、InputStream或URL填充模型。可以通过 Notation3 、N-Triples 或默认情况下通过 RDF/XML 语法解析模型。WordNet 作为 RDF/XML 进行序列化,所以不需要指定语法。读取模型时,可以提供基准 URI。基准 URI 用于将模型中的任何相对 URI 转换成绝对 URI。因为 WordNet 文档不包含任何相对 URI,所以此参数可以指定为null。

  仅使用 Jena 的 API 查询像 WordNet 这样巨大的模型将有一定的限制性,因为要执行的每类查询都将需要专门编写多行的代码。幸运的是,Jena 以 RDQL 形式提供了一种表达通用查询的机制。

  RDQL 是 RDF 的查询语言。虽然 RDQL 还不是正是的标准,但已由 RDF 框架广泛执行。RDQL 允许简明地表达复杂的查询,查询引擎执行访问数据模型的繁重工作。RDQL 的语法表面上类似 SQL 的语法,它的一些概念对已经使用过关系数据库查询的人来说将比较熟悉。在 Jena Web 站点中可以找到极好的 RDQL 指南,但几个简单的示例会对说明基础知识大有帮助。

  使用jena.rdfquery工具可以在命令行上对 Jena 模型执行 RDQL 查询。RDFQuery 从文本文件中获取 RDQL 查询,然后对指定的模型运行该查询。对数据库后台模型运行查询需要相当多的参数。清单 5 中显示了运行下列示例需要的完整命令行:

  正如您看到的,这些参数中的大多数参数都提供了创建与 MySQL 的连接所需的详细信息。其中重要的部分是--query example_query.rdql,它是 RDQL 文件的位置。还要注意运行jena.rdfquery需要 Jena 的 lib 目录中的所有 JAR 文件。

  SELECT部分声明查询要输出的变量 — 在本例中,是名为definition的变量。WHERE子句引入第二个变量concept并定义与图形匹配的三元组。查询在具有WHERE子句中的所有三元组的图形中查找语句。所以,在英语中,WHERE子句的意思为“查找具有 domestic dog 作为单词形式的概念,并查找这些概念的词汇条目”,如图 3 所示。USING子句提供一种便利,用于声明名称空间的前缀。

  所以这种情况仅有一个结果。清单 7 中显示的下个查询的意思为“查找单词 bear 表示的概念,并查找这些概念的词汇条目”。

  此处,查询的意思是“查找单词 panther 和 tiger 所指的概念;查找第三个概念,前两个概念是其下位词;查找第三个概念的可能的单词和词会条目”, 如图 4 所示:

  wordform和definition都在SELECT子句中声明,所以它们都是输出。尽管词查询仅匹配了一个 WordNet 概念,查询的图形可以以两种方式匹配,因为该概念有两个不同的单词形式:

  Jena 的com.hp.hpl.jena.rdql包包含在 Java 代码中使用 RDQL 所需的所有类和接口。要创建 RDQL 查询,将 RDQL 放入String中,并将其传送给Query的构造函数。通常直接设置模型用作查询的源,除非在 RDQL 中使用FROM子句指定了其他的源。一旦创建了Query,可以从它创建QueryEngine,然后执行查询。清单 9 中说明了此过程:

  使用Query的一个非常有用的方法是在执行之前将它的一些变量设置为固定值。这种使用模式与javax.sql.PreparedStatement的相似。变量通过ResultBinding对象与值绑定,执行时该对象会传送给QueryEngine。可以将变量与 JenaResource或与常量值绑定。在将常量与变量绑定之前,通过调用Model.createLiteral将其打包。清单 10 说明了预先绑定方法:

  运行此查询获得的ResultBinding如期望的那样包含常量词汇条目。另外,还可以访问变量concept。变量通过调用ResultBinding.get()凭名称获得。通过此方法返回的所有变量都可以转换成RDFNode,如果您想将这些变量绑定回更进一步的 RDQL 查询,这将非常有用。

  程序源码下载中包含的程序 FindHypernym.java(请参阅参考资料)汇总了您这里研究的区域。它查找命令行上给定单词的上位词,清单 13 中显示了使用的查询:

  命令行上给出的单词与hyponym词语绑定,查询查找该单词表示的概念,查找第二个概念(第一个概念是它的下位词),然后输出第二个概念的单词形式和定义。清单 14 显示了输出:

  您可能想知道为什么“wisteria”的上位词搜索仅返回它的直接上位词“vine”。如果从植物学观点,您可能还希望显示“traceophyte”也显示为上位词,以及“plant”。实际上,WordNet 模型表明“wisteria”是“vine”的下位词,“vine”是“traceophyte”的下位词。直观地,您知道“wisteria”因此是“traceophyte”的下位词,因为您知道“hyponym of”关系是可传递的。所以您需要有一种方法将这种认识合并到 FindHypernym 程序中,从而产生了 OWL。

  关系对于三个元素a、b和c是可传递的,从而a和b之间及b和c之间存在关系意味着a和c之间存在关系。

  可传递关系的一个示例是“大于”关系。如果a大于b,b大于c,因而a肯定大于c。

  Web Ontology Language 或 OWL 是 W3C 推荐标准,设计用来“明确表示词汇表中词语的意义以及那些词语之间的关系”。与 RDF Schema 一起,OWL 提供了一种正式地描述 RDF 模型的机制。除了定义资源可以属于的层次结构类,OWL 还允许表达资源的属性特征。例如,在清单 1中使用的 Relationship 词汇表中,可以使用 OWL 说明childOf属性与parentOf属性相反。另一个示例说明 WordNet 词汇表的hyponymOf属性是可传递的。

  在 Jena 中,本体被看作一种特殊类型的 RDF 模型OntModel。此接口允许程序化地对本地进行操作,使用便利方法创建类、属性限制等等。备选方法将本体看作特殊 RDF 模型,仅添加定义其语义规则的语句。清单 15 中说明了这些技术。注意还可以将本体语句添加到现有数据模型中,或使用Model.union()将本体模型与数据模型合并。

  给定了本体和模型后,Jena 的推理引擎可以派生模型未明确表达的其他语句。Jena 提供了多个Reasoner类型来使用不同类型的本体。因为要将 OWL 本体与 WordNet 模型一起使用,所以需要OWLReasoner。

  下例显示了如何将 OWL WordNet 本体应用到 WordNet 模型自身以创建推理模型。这里我实际将使用 WordNet 模型的子集,仅包含下位词层次结构中“plant life”之下的那些名词。仅使用子集的原因是推理模型需要保存在内存中,WordNet 模型对于内存模型过大而不能实现。我用来从整个 WordNet 模型中提取 plants 模型的代码包含在文章来源中,名为 ExtractPlants.java(请参阅参考资料)。

  从原始数据和 OWL 本体创建了推理模型后,它就可以像任何其他Model实例一样进行处理。因此,如清单 16 所示,通过 FindHypernym.java 与正常 Jena 模型一起使用的 Java 代码和 RDQL 查询可以重新应用到推理模型,而不进行任何更改:

  OWL 本体中包含的信息已经使 Jena 可以推断“wisteria”在模型中有上位词。

  本文说明了 Jena Semantic Web Toolkit 的一些最重要的功能,并用示例说明了如何创建、导入和持久化 RDF 模型。您已经了解了查询模型的不同方法,并看到了如何使用 RDQL 简明地表达任意查询。另外,您还了解了如何使用 Jena 的推理引擎对基于本体的模型进行推理。

  本文中的示例已经说明了将数据表示为 RDF 模型的一些效果,以及 RDQL 从这些模型中提取数据的灵活性。当在您自己的 Java 应用程序中使用 RDF 模型时,这里说明的基本方法将是非常有用的起点。

  Jena 是综合的 RDF 工具集,它的功能远不止您这里了解的这些。Jena 项目的主页是开始学习其功能的好地方。

http://mojdzwonek.com/tuiliziju/547.html
锟斤拷锟斤拷锟斤拷QQ微锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷微锟斤拷
关于我们|联系我们|版权声明|网站地图|
Copyright © 2002-2019 现金彩票 版权所有