美章網 精品范文 計算機語言的概念范文

計算機語言的概念范文

前言:我們精心挑選了數篇優質計算機語言的概念文章,供您閱讀參考。期待這些文章能為您帶來啟發,助您在寫作的道路上更上一層樓。

計算機語言的概念

第1篇

關鍵詞:OWL;相似度;本體

中圖分類號:TP301.6文獻標識碼:A文章編號:1007-9599 (2012) 05-0000-02

一、引言

本體可以提供強大的知識表示方法,是信息檢索領域中的重要內容。傳統的本體概念相似度計算方法大多采用特定于描述語言的通用推理服務來進行匹配,這些方法忽略了概念的語義信息。在概念檢索或語義查詢系統的實驗過程中,利用本體對領域知識進行建模,使查詢結果滿足語義方面的匹配,避免了基于關鍵字進行簡單查詢的局限性,在構建基于本體的語義信息檢索系統的過程中,提高了查詢結果的準確率和召回率。

二、本體描述語言OWL

OWL(Web Ontology Language)是語義Web中本體描述語言的標準。OWL在資源描述框架RDF(Resource Description Framework)的基礎上,添加了更多的語義結構的聲明,從而對RDF進行了擴展。OWL語言建立在描述邏輯DL(Description Logic)的基礎上,因此OWL具備良好的知識表示能力和機器推理能力。領域知識本體可以做如下定義:

Onto=(V,C,P,H,R) (1)

其中:V表示概念詞匯集,C表示本體概念,P表示屬性,H表示層次,R表示概念之間的關系。

分析OWL語言中描述元素,對于基于語義特征的概念相似度計算方法非常重要。OWL語言中有四類不同的語義描述元素:

第一類描述元素用于定義本體中實體集合,主要包括類Class和實例Instance。

第二類描述元素用于生成一個本體的特征集合,包括描述本體實體的類層次描述元素和屬性特征描述元素以及其他各種約束的描述元素。

第三類是用于描述實體之間,以及特征之間的異同關系的描述元素。

第四類是本體中的補充性的描述元素,以及現有算法尚不能有效支持的特征。

三、基于本體的概念相似度計算

(一)屬性相似度

在現實世界中,事物可以由各種屬性來進行描述和分類,屬性的相似度可以通過兩個概念屬性集合的相似程度來進行計算。

其中,Ci∩Cj表示概念Ci與概念Cj的相同屬性集合;Ci-Cj表示在概念Ci中存在而概念Cj不存在的屬性集合;Cj-Ci表示在概念Cj中存在而在概念Ci中不存在的屬性集合,α,β,γ為調節權重參數,且α>β=γ。

(二)語義層次距離

本體作為一種知識表示模型,其所包含的概念、屬性和關系可以通過有向圖的形式進行表示,節點表示概念,邊表示關系,概念之間的語義距離可以表示為概念節點之間最短路徑邊的數目,用 表示。語義相似度和語義距離之間存在如下對應關系:

1.兩個概念間的語義距離為0時,其相似度為1;

2.兩個概念間的語義距離為無窮大時,其相似度為0;

3.兩個概念間的語義距離越大,其相似度越小。

在本體中,如果兩個概念的語義距離相同,那么概念的語義相似度由它們所處的層次決定,所處的層次越深,其所對應的語義相似度越高,反之則相反。

其中,h為本體有向圖的最大深度,L為概念Ci和Cj之間有向邊的數量。考慮到層次深度對語義相似性的影響,同時,層次深度也能判斷出兩個概念的上下位關系。綜合考慮語義距離和層次深度,可以使用樹形結構來對本體進行表示.

其中,hi和hj分別表示概念Ci和Cj在本體樹中的深度; 表示本體樹的最大深度; 為調節參數,對系統所需的相似度進行動態調節,表示本體樹中深度和廣度對概念相似度的影響。

(三)基于屬性和語義距離的柔性相似度

本體概念的相似度要綜合考慮概念的屬性以及概念之間的關系,它們對概念的相似度具有重要的影響。綜合考慮概念的屬性和層次關系對概念相似度的影響,對公式進行權重調整,得到領域本體中兩個概念的相似度計算模型.

其中, 是權重系數。由于概念相似度的主觀性較強,因此對于不同的服務請求,可以通過權重系數的調節來決定本體概念的屬性和層次關系對相似度的影響,從而確定系統所需要的相似度閾值。概念相似度的變化趨勢是一種線形關系,參數的取值會影響相似度的大小,但是對概念的相似順序沒有影響。

(四)算法描述

給定相似度算法sim(Ci,Cj),該算法最主要的工作是計算兩個概念的相似度。相似度算法描述如下:

第一步:預處理。構建相似度矩陣A,提供任意兩個概念之間的相似度度量,其中Aij=sim(Ci,Cj)。顯式定義所有的等價概念和反義概念的概念元素集合,賦值為1和0,在相似度矩陣A中,除了能被初始化的元素,其它每個概念的取值都與中參數取值有關的,因此,對同一個概念,可能得出不同的相似度,設定相似度的取值區間為(0,1)。

第二步,解析本體文件,并抽取出本體中的類、實例和屬性,并根據其在本體樹中所處位置設置參數構建特征向量,向量的相似性反映了本體中的類、實例和屬性的相似程度。

第三步,計算概念之間的特征向量的公共屬性和差異屬性,并根據實際需要,設定概念差異的參數。

四、實驗

本體概念相似度,即依賴于概念屬性的相似程度,又依賴于本體概念的層次關系。概念的相似屬性越多,說明兩個概念越相似。而概念的層次關系反映了領域專家對概念的層次關系的定義,如果調整了概念的層次,相似度也會發生很大的變化。

實驗所用本體數據采用Protégé 2000自帶的pizza本體,pizza本體包含97個類命名,采用了OWL語言描述。該本體描述了領域內的概念、屬性以及它們之間的關系,很好的體現了本體的語義特征。根據上述公式的計算方法得到的概念相似度結果。其中各參數取值為:ρ=5,α=0.6,β=γ=0.2,θ=0.2。

對于概念相似性的判斷,通常以領域專家的判定作為標準。對于一般的概念,領域專家給定的概念匹配順序為:同義概念>父子節點>相近屬性的節點>兄弟節點>其它節點。雖然使用了不同的計算方法,但是得到的概念匹配順序基本相同。實驗結果客觀地反映了本文所采用的概念相似度計算方法的有效性。

PizzaTopping與PepperTopping作為較近的屬性結點,相似度要大于作為兄弟結點的PizzaTopping與PizzaBase,同時小于作為父子結點的PizzaTopping和VegetableTopping,同一個父節點VegetableTopping和CheessTopping與VegetableTopping和PepperTopping相比,屬性相似度大的概念綜合相似度大。

TF-IDF(Term Frequency Inverse Document Frequency)方法是文本相似度的計算方法中最為典型的一種方法[12],傳統的TF-IDF方法是一種將文本轉化為向量形式,用于計算文本相似度。該方法沒有考慮到概念的屬性相似性,本文利用領域本體改進傳統的TF-IDF的空間向量模型:

其中, 是傳統TF-IDF方法的計算權重; 是概念在領域本體中計算得到的權重; 是根據TF-IDF值對本體相似度進行加權處理得到的計算結果。

評價信息檢索性能優劣的最通用和最重要的兩個指標是查準率(Precision)和查全率(Recall),因此本文采用查準率P和差全率C對實驗結果進行評估。

相似度的結果不同,會對查準率和查全率產生比較大的影響,一般情況下,查準率和查全率會呈現出相反的趨勢。由于查全率對于大規模海量數據不容易進行統計,因此通常只有在數據規模較小的情況下才能統計出來,因此,查準率比查全率更容易進行統計,在實際應用中也更有意義。

實驗所用測試數據來自Yahoo!網站收集的關于pizza的數據。本文采用支持向量機SVMs(Support Vector Machines)[14]分類方法,使用空間向量模型對測試文本集合進行分類測試。本文對兩種權重表示的測試文本進行分類,對于不同的懲罰系數c進行實驗比較,

利用本體改進的概念相似度計算方法,在不同的懲罰系數下,本文方法比傳統的TF-IDF權重在分類準確率方面有一定的提高。實驗表明本文方法能充分利用OWL的語義特征來計算相關概念之間的相似度,因而可以為基于本體的文本分類和聚類方法提供參考。

五、結論

本文提出了一種基于OWL語言描述的本體概念相似度計算方法,通過結合OWL屬性特征與概念層次關系來計算概念相似度,并通過與傳統的TF-IDF方法進行比較實驗。實驗結果表明,本文的相似度計算方法能夠有效的反映出概念之間的語義相似度,對文本分類的準確率方面有明顯提高。本文的后續研究將在現有探討語義相似度的基礎上,進一步分析本體描述語言所包含的語義特征與概念屬性的權重問題等,這對于基于本體的文本分類和聚類問題研究有著積極的作用。

第2篇

關鍵詞:語義檢索;概念語義樹;語義相似度

中圖分類號:TP391 文獻標識碼:A 文章編號:1009-3044(2011)16-3809-02

Research on Method of Semantic Similarity Based on Concept Semantic Tree

HAN Xin, QIN Fan

(School of Electronics and Computer Science and Technology, North University of China, Taiyuan 030051, China)

Abstract: At present, the application of information retrieval has been widely used, but it is still a difficult thing to be accurate in the specific field of searching. This paper provides a semantic similarity calculation method based on the concept semantic tree, considering the concept of the semantic relations, hierarchies, and inheritance and other factors, as much as possible to improve retrieval efficiency in specific areas of information, and at final, demonstrate the feasibility of the method by experiment.

Key words: semantic retrieval; concept semantic tree; semantic similarity

傳統的信息檢索都是基于關鍵詞查詢的,因此在檢索時可能會出現一堆用戶并不真正需要的信息,導致查詢結果的準確率很低,查全率也不令人滿意,會出現“表達差異”,“詞匯孤島”等問題。語義檢索就是把信息檢索從傳統的基于關鍵詞層面提高到基于語義的層面,從語義方面著手,分析概念之間的內在聯系,利用語義來組織、存儲和獲取信息,信息和語義的結合,使信息變成計算機可識別的知識,從而系統能識別出用戶所需要的信息,提高檢索的查準率和查全率。

1 語義相似度

語義相似度是對語義相似性的定量表示,語義相似度計算是信息檢索、數據挖掘、知識管理等領域的基本問題。在信息檢索中,語義相似度能夠更多的反映文本概念是否符合用戶的查詢要求,相似度越高,說明文本內容與用戶的查詢請求越接近。

劉群、李素建[1]基于實例的機器翻譯,提出語義相似度就是兩個不同上下文本中的本體概念,在不改變文本的句法及語義結構的情況下可以互相替換的程度。如果位于不同上下文本中的兩個概念詞語在不改變文本的句法及語義結構的情況下可以互相替換的可能性越大,則說明二者的相似度就越高,否則相似度就越低。

當兩個語義概念元素x,y相似時,用sim(x, y)表示兩者之間的相似度,形式上,相似度計算滿足[2]:

1)相似度的值為[0,1]區間中的一個實數,即sim(x, y)∈[0,1];

2)如果兩個對象是完全相似的,則相似度為1,即sim(x, y) = 1 當且僅當x = y;

3)如果兩個對象沒有任何共同特征,那么相似度為0 ,即sim(x, y) = 0;

4)相似關系是對稱的,即sim(x, y) = sim(y, x)。

2 概念語義樹

使用層次化的樹狀結構來描述概念之間的邏輯關系,這種語義化的概念樹為檢索算法提供語義基礎,在檢索過程中不同的概念之間也有一定的相似性和相關性,因此需要處理概念樹中祖孫節點、兄弟節點等不同類型的關系,我們考慮用概念間的相似度對其進行描述和量化,以提高檢索的準確率為了計算概念相似度,作如下定義[3-4]:

定義1:在本體概念的樹狀層次結構中,如果概念A和概念B之間存在這樣的關系:A是B的祖先,則稱A和B為同支概念。概念A稱為A和B的最近根概念,記為R(A,B),而A、B之間的距離dist(A,B)=dep(B)-dep(A),其中depth(C)為概念C在層次結構中的深度。如圖1(a)所示。

定義2:在本體概念的樹狀層次結構中,如果概念A和概念B之間存在如下這樣的關系:A不是B的祖先并且B也不是A的祖先,則稱A和B為異支概念。如果概念R是A和B最近的共同祖先,并且是符合此條件的所有節點中距離概念樹的根節點最遠的一個,則稱R為A和B的最近根概念,記為R(A,B),且A、B之間的距離為dist(A,B)=dist(B,R)+dist(A,R),如圖1(b)所示。

定義3:概念C 稱為概念A 和B 的語義相關概念,當且僅當概念C 滿足如下的條件:當A, B 為同支概念時,C 在以A 為根的子樹中且不在以B 為根的子樹中;當A,B 為異支概念時,C 在以R 為根的子樹中且不在以A 或B 為根的子樹中。

在計算語義相似度時,A和B各自的子概念數以及它們的語義相關概念數對相似度計算結果也有影響, 當A,B為同支概念時,A的子概念由B的子概念和A,B的語義相關概念組成,前者所占的比重越大,則概念A,B的語義相似度越大;當A,B為異支概念時,R的子概念由A 的子概念、B 的子概念以及A,B 的語義相關概念三部分組成,前兩部分的比重越大,則A,B 的語義相似度越大。

1)當A,B為同支概念時,A與B之間的語義關系為:

式中,m表示概念B的子概念數,n表示概念A的子概念數。

2)當A,B為異支概念時,A與B之間的語義關系為:

式中,m表示概念B的子概念數,n表示概念A的子概念數,X表示A與B最近根概念的子概念數。

定義4:兩個概念之間的語義距離,是指在語義樹中連接這兩個概念的最短路徑的長度。語言學研究認為,兩個概念的語義距離越大,其相似度越低;反之,兩個概念的語義距離越小,其相似度越大,兩者之間可以建立一種簡單的對應關系。特別地當兩個概念之間語義距離為0 時,其相似度為1;當兩個概念之間的語義距離為無窮大時,其相似度為0。兩個概念之間的語義距離表達式為:

式中,distant(A,B)表示概念A與B之間的語義距離,weighti表示連接A,B的最短路徑上第i 條邊的權值。

定義5:概念的深度是指該概念與語義樹根的最短路徑中所包括的邊數。因為在語義樹中,每一層的概念都是對上一層概念的細化,由此可見,在語義距離相同的前提下,兩個概念的深度和越大,概念之間的相似度越大;兩個節概念的深度差越小;概念之間的相似度越大。概念深度的表達式為:

式中,depth(A)表示概念A的深度,n表示概念A與語義樹根之間的最短路徑中所包括的邊數。

3 語義相似度計算方法

考慮概念語義樹中概念之間的層次關系、繼承關系及語義關系,我們提出下面這個關于語義相似度的就算方法:

其中:Level(A,B)表示概念之間的語義關系對相似度的影響;

Distant(A,B)表示概念之間的語義距離對相似度的影響;

Depth(A,B)表示概念之間的深度對相似度的影響。

但對概念語義樹中層次結構分以下這兩種情況考慮:

1)當A,B為同支概念時,A與B的語義相似度為:

2)當A,B為異支概念時,A與B的語義相似度為:

α,β,γ為調節因子,且α+β+γ=1.

4 實驗結果

選取如圖2一個簡單的實例來計算語義相似度。

選參數α=0.6,β=0.3,γ=0.1,可得到“計算機”與其余各節點之間的語義相似度為:

參考文獻:

[1] 劉群,李素建.基于《知網》的詞匯語義相似度計算[J].Computational Linguistics Chinese Language Processing,2002,7(2):59-76.

[2] 李玲.面向流程診斷的企業知識相似度匹配工具研究與開發[D].哈爾濱:哈爾濱工業大學,2006.

[3] 王進,陳恩紅,施德明,等.一種基于語義相似度的信息檢索方法[J].模式識別與人工智能,2006(6):2-6.

第3篇

一、前言

隨著計算機的普及,我國越來越多的高校已經把計算機?n程作為公共教學內容,所有大學生能熟練地使用計算機,這也為計算機專業教學帶來了巨大的挑戰。如果繼續使用過去傳統的教學模式,計算機專業學生的計算機綜合應用能力跟其他專業的學生相比并沒有明顯的優勢,從而在就業方面受到來自其他專業學生的挑戰。因此,各高校計算機專業的教師應該根據計算機行業的發展前景和發展熱點,對計算機教學進行以就業為導向的改革,使教師教得新穎,使學生計算機應用能力得到全面提高,從而獲得更好的就業機會[1]。基于CDIO理念的教學模式代表了近年來國際工程教育改革的最新成果。CDIO包括構思(Conceive)、設計(Design)、實現(Implement)和運作(Operate)四個階段,它將產品研發到運行的完整生命周期運用到教學過程當中,是一整套工程教育理念和實施體系[2]。CDIO讓學生可以通過實踐的方式學習工程理論知識,積累工程實踐經驗并提升對專業知識的綜合應用能力。本文通過對CDIO工程教學模式的研究,提出以就業為導向基于CDIO理念的大學計算機教學改革新方案,將計算機行業的發展熱點內容加入到基礎理論教學當中,并與實踐能力訓練相結合,使學生把基礎理論運用到實踐中,并且在實踐中加深對基礎理論的理解,真正達到學以致用的目的。從根本上提高學生的計算機綜合應用能力和就業競爭力,滿足社會對計算機工程人才的需求。

二、基于CDIO理念的大學計算機教學改革

CDIO理念下計算機改革的目的是從就業視角出發培養學生的工程實踐能力,進一步提高學生的就業競爭力。因此,在進行教學改革時應當將CDIO理念與具體教學實際相結合,把構思、設計、實現和運作四個過程應用其中,如圖1所示。

該方案中教師應當構思改革目標和方向,突出以就業為視角的大學計算機教學改革前瞻性和必要性,考慮以何種方法和步驟推進改革的順利進行,將計算機工程實際與課程教學建立聯系,為接下來的設計步驟做好準備,然后設計并構建出真實的計算機工程實踐平臺,還需安排相應的綜合課程,為學生創建合適的工程實踐場所,做好理論與實踐學習相結合的前期準備。在實現部分,“填鴨式”教學等傳統的教學模式已不可再套用,教師和學生的關系也亟待改變,教師應在學生主動學習的過程中起到引導作用。在運作部分,為了保證學生的學習效果,驗證CDIO理念的實效,應當衡量每個學生對規定學習效果所完成的進度,要求教師對學生的學習效果進行評估。因而,CDIO理念下的大學計算機改革方式應包含以下四個方面的內容。

1.構思(Conceive)改革目標及方向。工程教育應該注重如何將學科知識轉化為工程能力,這是工程教育的本質和出發點。面對當下計算機行業的巨大就業壓力和殘酷的競爭淘汰率,大學計算機教學改革更應當以此為改革的出發點和落腳點,這要求教師在進行教學改革前深刻構思改革目標和方向方法,思考何為改革、為何改革。顯然,新時期的計算機教學改革對教師提出了更高的要求,教師不再進行單純的課本知識的教授,而是轉型成為兼具計算機工程項目的設計和專業知識的傳授雙重教學能力的“雙師型”教師。

2.設計(Design)綜合課程和工程環境。教師是計算機實踐課程的設計者。由于現在的學生缺乏實際動手能力,計算機教學中應安排豐富的工程實踐項目,盡量讓學生以親自動手的方式進行[3]。教師要基于CDIO理念的預期目標,以實現良好就業為著力點,合理安排教學內容和方法,設計出有助于學生計算機工程水平提高和積極情態建設的一體化課程,計算機類學生就業能力集中體現在實踐項目的方方面面,教師在課程的選擇和設計上也需要花費更多的時間,才能設計出以項目為主導的啟發性知識鏈的教學模式。同時,教師也是工程實踐場所的設計者。教師在設計課程的過程中,必須同時考慮設計與之相匹配的實踐場所,工程實踐場所的構建應以提升學生團隊合作能力和動手能力為目標。

3.實現(Implement)師生角色的雙重改變。傳統教學模式下師生關系的特征表現為“以教師為中心,學生被動接受”。CDIO模式將不再局限于傳統教學方法,學生的主動學習和經驗學習應在CDIO環境下促進其工程實踐能力與就業競爭力。有學者指出,CDIO理念要求教師不斷創新,他們的教學風格要始終以學生為中心,要不遺余力的傳授大綱中規定的軟硬件開發以及系統構建的能力[4]。基于這一要求,在計算機教學過程中學生應進行“一體化學習”,即學生在工程實踐環境中學習計算機學科知識的基礎上,進一步培養其軟硬件開發和系統構建能力。一體化學習是CDIO框架的重要特點之一,學生將完成從被動灌輸到主動探究的轉變,教師應當保證每位學生都能主動參與到團隊項目開發中,使他們的團隊合作能力和工程能力得到充分的培養和鍛煉。CDIO理念下的實現過程,即在具體的計算機實踐課程教學過程中,師生關系從教師管理學生轉型為教師引導學生,教學模式從“填鴨式”知識傳授轉型為互動式探究討論。

4.運作(Operate)良性循環的教學關系。對學生采用考核或評估的目的是為了考察學生的學習情況。傳統的計算機課程評估方法往往采用的是正確率越高越優秀的試卷考核,且學生和教師之間缺乏學術溝通和實踐交流。這樣培養出來的學生多數都存在理論分數高、動手能力差的問題,畢業后在計算機行業也難以立足。與此相反,CDIO教學通過關注學生在學習前、學習中和學習后三個不同時期的學習“證據”,全面了解學生的學習成績和學習情態的轉變。這種評估聚焦在學生學習上,其作用是通過考核學生的計算機理論知識、實踐能力和綜合素質而得到學習效果的反饋信息,從而不斷改進和完善課程設計、教學方法以及學習場所的設計和使用。顯然,新型模式對學生計算機能力的考核由單一注重理論知識的傳統模式向“知識+能力+素質”的綜合考核模式轉變,其中能力是指計算機工程實踐能力,學習效果應反映在計算機工程技術上而非分數上。

友情鏈接
主站蜘蛛池模板: 午夜精品久久久久久久99热| 国内外成人在线视频| 久久精品日日躁夜夜躁欧美| 波多野结衣中文字幕在线视频| 四虎影在线永久免费四虎地址8848aa| 国产精品你懂得| 国产综合第一页| a级毛片高清免费视频| 成人免费草草视频| 久久久午夜精品福利内容| 极品欧美jiizzhd欧美| 亚洲最大黄色网站| 焰灵姬你下面好紧| 免费看欧美成人性色生活片| 羞羞网站在线观看| 国产在线精品一区二区夜色| 67194久久| 国产精品白浆无码流出| aaaaaa级特色特黄的毛片| 忘忧草日本在线播放www| 中文毛片无遮挡高清免费| 日本精品久久久久中文字幕| 亚洲AV日韩AV高潮无码专区| 欧美成人看片黄a免费看| 亚洲第一黄色网址| 狠狠综合久久久久综合网| 公交车后车座的疯狂运| 老熟妇仑乱视频一区二区| 国产午夜无码精品免费看动漫| 欧美色图你懂的| 国产精品亚洲精品青青青| 91精品乱码一区二区三区| 天堂新版8中文在线8| 一本一本久久aa综合精品| 成人性生交大片免费看| 久久97久久97精品免视看秋霞| 日韩avwww| 久久精品国产99国产精品澳门 | 亚洲精品高清国产一久久| 稚嫩娇小哭叫粗大撑破h| 午夜福利一区二区三区在线观看|