本站小編為你精心準(zhǔn)備了網(wǎng)絡(luò)搜索論文:網(wǎng)教資源環(huán)境搜索模板透析參考范文,愿這些范文能點(diǎn)燃您思維的火花,激發(fā)您的寫作靈感。歡迎深入閱讀并收藏。
作者:馬驤飛劉淑麗孫濱單位:鄭州華信學(xué)院信息工程系鄭州華信學(xué)院圖書館
語義檢索體系結(jié)構(gòu)
本文提出的基于Ontology的網(wǎng)絡(luò)教育資源語義檢索模型的體系結(jié)構(gòu)采用B/S模式的MVC架構(gòu):數(shù)據(jù)存儲層、業(yè)務(wù)處理控制層和表示層。體系結(jié)構(gòu)如圖2所示。其中存儲層包括教育資源Ontology、教育資源及元數(shù)據(jù)描述信息,應(yīng)用索引組件索引元數(shù)據(jù)描述信息而生成的索引庫以及利用標(biāo)注技術(shù)生成的語義元數(shù)據(jù)信息;業(yè)務(wù)處理層包含語義標(biāo)注、語義分析、語義推理和語義查詢組件;表示層主要處理的工作是提供用戶多種查詢接口,以及處理查詢結(jié)果集合的結(jié)果呈現(xiàn)接口。
關(guān)鍵技術(shù)研究
1教育資源
Ontology構(gòu)建建立領(lǐng)域Ontology是一個(gè)復(fù)雜的過程,涉及到該領(lǐng)域的相關(guān)概念以及概念與概念之間的關(guān)系。愛丁堡大學(xué)開發(fā)的EnterpriseOntoloyg由一組關(guān)于企業(yè)的術(shù)語和定義組成,主要用于企業(yè)模擬。
2教育資源
Ontology的形式化本文使用OWL形式化描述教育資源Ontology,它主要應(yīng)用OWL定義的表達(dá)式對提取出的概念術(shù)語及其關(guān)系進(jìn)行形式化描述。教育資源Ontology利用Protégé4.0.2工具構(gòu)建完成,完成后的Ontology以O(shè)WL文件格式存儲。下面將介紹使用Protégé4.0.2建設(shè)教育資源Ontology的過程。
2.1概念類的形式化
在Protégé4.0.2中,所有用戶定義的類都是缺省的OWL:Thing的子類,而領(lǐng)域內(nèi)相關(guān)的根類只需要給出簡單的類聲明就可以了。如在教育資源Ontology中“學(xué)科”類和“教育資源類型”類中的定義如下:類的最基本的構(gòu)造器是subClassOf,如在描述案例是教育資源類型的一個(gè)子類時(shí)可以這樣描述:此外,為了對某些重要的概念進(jìn)行說明時(shí),可以使用OWL語言提供的注解標(biāo)簽〈rdfs:label〉來標(biāo)記對應(yīng)概念的內(nèi)容信息,示例代碼可表示如下:現(xiàn)代教育技術(shù)是指在現(xiàn)代教育思想、現(xiàn)代教育理論的指導(dǎo)下對教育資源、教育過程進(jìn)行開發(fā)設(shè)計(jì)、評價(jià)、運(yùn)用、以實(shí)現(xiàn)對教育教學(xué)的優(yōu)化。上述代碼定義了“信息技術(shù)教育”概念類,它是“學(xué)科”概念的子類,此外,使用標(biāo)簽〈rdfs:label〉對“信息技術(shù)教育”進(jìn)行了解釋說明。
2.2類屬性的形式化
OWL語言提供了兩種類型的屬性表達(dá),一種是數(shù)據(jù)類型(DataType)的屬性主要是使用XMLSchemaDataType所定義的簡單類型完成,這些簡單的數(shù)據(jù)類型包括char、string、int、float、datetime、boolean等。如下述代碼對“關(guān)鍵字”、“持續(xù)時(shí)間”及“費(fèi)用”的定義:對象類型的屬性主要用來說明類成員屬性是有復(fù)雜的對象組成。如下面代碼表達(dá)了“數(shù)學(xué)”是適合開設(shè)“微積分”的“適用學(xué)科”。其中“微積分”表示為“代數(shù)”學(xué)科的一個(gè)實(shí)例。
2.3實(shí)例的形式化
實(shí)例的生成是通過聲明它是某個(gè)類的成員來表達(dá),比如“程序設(shè)計(jì)”作為“計(jì)算機(jī)科學(xué)”學(xué)科的重要“課程”的實(shí)例,可以用如下代碼表示:
2.4教育資源Ontology的確認(rèn)和評價(jià)
教育資源Ontology構(gòu)建的正確性取決于基于它開發(fā)的系統(tǒng)的正確性和有效性,目前Ontology的正確性的核查還沒有統(tǒng)一的方法,常用的檢查Ontology正確性的方法是使用推理機(jī)軟件來核查。例如在使用Protégé工具中集成的推理機(jī)Racer來核查教育資源Ontology中定義的兩個(gè)類:“音頻”和“圖像”。這兩個(gè)類在意義上是不相交的,使用OWL語言中的owl:disjointWith關(guān)系來描述概念類的不相交關(guān)系,代碼片段如下:在建設(shè)Ontology時(shí),如果不小心把本屬于“音頻”類的“讓我們蕩起雙槳”(MP3格式)作為實(shí)例添加到“視頻錄像”中,那么在構(gòu)建信息檢索系統(tǒng)時(shí)可能會(huì)查出不符合用戶要求,給系統(tǒng)的推理帶來一定的安全隱患。因此,當(dāng)教育資源Ontology構(gòu)建完成時(shí),利用推理機(jī),可以很容易發(fā)現(xiàn)一些不一致的問題,快速的對構(gòu)建的Ontology進(jìn)行維護(hù)。
3語義標(biāo)注技術(shù)
元數(shù)據(jù)是信息共享交換的基礎(chǔ)和前提,它通過構(gòu)成自身的元素來顯式地表示資源信息或者幫助提供獲取某種信息資源的途徑。元數(shù)據(jù)的主要作用在于識別資源、評判資源,追蹤資源在使用中的變化,從而實(shí)現(xiàn)高效地管理海量的網(wǎng)絡(luò)資源數(shù)據(jù)信息。語義標(biāo)注是指在Ontology的指導(dǎo)下映射教育資源的元數(shù)據(jù)。首先通過解析教育資源Ontology,然后有系統(tǒng)提示標(biāo)注者填寫需要標(biāo)注的內(nèi)容,系統(tǒng)把這些標(biāo)注的元數(shù)據(jù)資源信息映射成Ontology庫中的實(shí)例,最后系統(tǒng)保存帶有標(biāo)注信息的教育資源元數(shù)據(jù)RDF文檔并存儲到數(shù)據(jù)庫中。語義標(biāo)注涉及到的主要技術(shù)包括讀取和解析Ontology技術(shù)Jena及Ontology查詢語言SPARQL。
SPARQL通過調(diào)用QueryExecutionFactory.create(query,model)獲取該實(shí)例。對應(yīng)較為簡單的Select查詢,可以調(diào)用execSelect()方法返回查詢結(jié)果集ResultSet。如下給出了查詢示例代碼:上述示例中,變量path是Ontology文件存儲路徑,變量express是查詢的關(guān)鍵字,而變量queryExpress是構(gòu)造的查詢規(guī)則,F(xiàn)ILTER則是對查詢關(guān)鍵字進(jìn)行過濾,支持模糊查詢。
4語義檢索策略
對于檢索系統(tǒng)來講,一個(gè)好的檢索策略,既使用何種檢索方式準(zhǔn)確把握用戶的檢索需求,對領(lǐng)域知識和事實(shí)數(shù)據(jù)信息進(jìn)行深層次地推理,提高資源檢索“查全率”和“查準(zhǔn)率”具有舉足輕重作用。當(dāng)前資源檢索系統(tǒng)查全率、查準(zhǔn)率差的原因主要包括有兩個(gè):1)用戶需求表達(dá)不充分,機(jī)器不能理解其真正需求;2)檢索系統(tǒng)對檢索條件機(jī)械匹配,不能進(jìn)行語義分析和自動(dòng)擴(kuò)展。因此提高檢索質(zhì)量可以從兩個(gè)方面入手:
1)參照Ontology中的概念關(guān)系對檢索式進(jìn)行優(yōu)化,利用教育資源Ontology中的語義關(guān)系將用戶的檢索條件映射成為Ontology的概念和關(guān)系,從而實(shí)現(xiàn)用戶需求和機(jī)器理解的一致。
2)利用教育資源Ontology中的概念關(guān)系對用戶檢索的概念進(jìn)行擴(kuò)展,當(dāng)系統(tǒng)中沒有滿足檢索條件的結(jié)果時(shí),根據(jù)教育資源Ontology中的概念相關(guān)程度對檢索式中的概念適當(dāng)進(jìn)行擴(kuò)展,形成新的檢索概念集,而后再重新查找。
系統(tǒng)原型實(shí)現(xiàn)
作為試驗(yàn)系統(tǒng),我們以教育資源領(lǐng)域中的教學(xué)資源為研究對象,首先針對教育資源元數(shù)據(jù)信息進(jìn)行組織,建立數(shù)據(jù)模型。其次,基于Ontology對教育資源元數(shù)據(jù)進(jìn)行映射,生成教育資源語義元數(shù)據(jù)庫;第三,設(shè)計(jì)索引組件,對資源元數(shù)據(jù)信息建立索引,生成索引庫;最后,設(shè)計(jì)語義分析和查詢組件,實(shí)現(xiàn)系統(tǒng)的檢索功能。由于教育資源Ontology構(gòu)建和語義標(biāo)注在前面部分作了說明,這里重點(diǎn)介紹索引組件、語義分析組件和語義查詢組件。例如條件檢索將該請求轉(zhuǎn)化成邏輯表達(dá)式。在實(shí)驗(yàn)的原型系統(tǒng)中,用戶的條件檢索表達(dá)式最終由系統(tǒng)轉(zhuǎn)化成對RDF圖的交、并、補(bǔ)的操作,如圖3所示。
結(jié)語
本文研究了Ontology的構(gòu)建,將其應(yīng)用到教育資源建設(shè),通過構(gòu)建教育資源Ontology,可以為網(wǎng)絡(luò)教育資源提供語義表示機(jī)制。在教育資源Ontology驅(qū)動(dòng)之下,提出一個(gè)語義檢索模型,用于支持知識共享、語義匹配的網(wǎng)絡(luò)教育資源檢索系統(tǒng)的開發(fā),以期解決資源檢索中語義匹配問題,提高檢索質(zhì)量和效率。