美章網 資料文庫 融合關系和內涵屬性的應用范文

融合關系和內涵屬性的應用范文

本站小編為你精心準備了融合關系和內涵屬性的應用參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。

融合關系和內涵屬性的應用

《計算機應用研究雜志》2015年第五期

1融合關系內涵性的概念圖表示

根據漢語概念內涵邏輯理論[10],將整個語義語境分為心理世界和物質世界,其中在人腦中的概念屬于心理世界,而詞語和實體屬于物質世界。整個過程細分為:從實體到詞語的一個分類過程;從概念到詞語是一個命名過程;從詞語到概念再到實體,以及反過來實體到概念再到詞語是一個詞語的理解、表達的過程。也就是理解一個詞語需要經歷上面四個過程。計算機理解自然語言的語義,同樣需要經歷上面四個過程。本文主要根據漢語概念的內涵邏輯模型理論,在傳統的概念圖知識表示方法中加入概念內涵屬性,提出一種新的知識表示方法。

1.1構建本體傳統的概念圖能夠直觀地表達自然語言的語義,在構建概念圖的過程中需要領域專家的參與,從而導致概念關系的引入存在隨意性,概念圖的完整性難以得到保證。整個過程中,領域專家根據概念的內涵和外延特征判斷兩個概念之間的關系,在結果圖中概念只是包含外延,而應用于語義計算的內涵需要觀察者判斷。概念的內涵可以通過屬性名-值(AttributeValueStructure)AVS的列表結構來表示[11]。基于概念內涵屬性的E-A-V結構圖將兩個概念的關聯屬性作為關系,假設概念的屬性名之間相互獨立[12],如圖2。E-A-V結構圖更多的是注重于概念的內涵屬性值,而忽略了概念內涵屬性的整體表達性,也即概念的內涵屬性并不是簡單的賦值組合彰顯概念,而是具有內在聯系性。在這里,AT就是領域概念所有AVS列表結構的集合。TR是根據美國國家標準研究院評測定義的七種類型的有限集:制造關系(ART)、類屬關系(GEN-AFF)、轉喻關系(METONYMY)、組織結構從屬關系(ORG-AFF)、局部整體關系(PART-WHOLE)、人物關系(PER-SOC)以及地理位置關系(PHYS)。雖然關系的類型是有限集合,但是兩個概念間的屬性列表結構的組合有很多種,從而使得概念圖的表現形式多種多樣。

1.2A&R概念圖的形式描述定義2在領域本體構建完成的基礎上,同樣為了便于進行語義計算,包括概念節點和概念關系節點;為概念節點集合,每個概念節點都包含一個AVS列表結構;為概念關系節點結合;為AVS列表節點集合,節點和概念節點一一對應;為映射函數,對于每個概念節點,都可以通過映射:。同樣,對于概念關系節點),存在映射:。為邊的集合。

1.3A&R概念圖的構建整個C-A&R概念圖的構圖過程分為以下步驟:首先,從給定語料庫中抽取出構建領域本體Ontology的概念詞典以及屬性詞典;其次,根據中文上下文語義環境選擇合適的概念;然后,根據選擇的概念,從本體的屬性詞典中抽取出對應的屬性名,結合上下文語義環境賦予對應的值,構建AVS列表結構;再次,依據概念的AVS列表結構,從有限關系集合中選擇適當的關系;最后,根據已經選擇好的概念,關系和AVS列表構建概念圖,人工進行篩選。如圖3所示:

1.4例說明對中文句子“小明是計算機科學與技術專業的學生,選修了操作系統,小華也選修了!”構建C-A&R概念圖,如圖4。提取概念:[Major:計算機科學與技術]、[Student:{小明、小華}]、[選修]和[Course:操作系統]。通過查《現代漢語詞典2010》,構建每個概念對應的AVS列表,如表1所示。本文總結畫圖的具體過程如下:對中文句子進行分析,采用ICTCLAS2014分詞系統進行分詞,抽取出其中的N名詞、NP名詞短語、V動詞、VN動名詞以及表示時間、地點的副詞和表示數量的量詞作為初步概念節點。a)將當前抽取出的詞進行篩選,去冗余和噪聲,也即找出語義上明顯相似的詞。b)確定同類概念間的層次關系,按語義的包含性進行排序。c)確定概念圖中的起始概念節點、中心概念節點和結束概念節點。d)由起始概念節點開始,從左至右依次排列句子中所包含的概念。e)將排列的概念節點中的屬性-值列表標出,從屬性-值列表中得出概念間的關系。f)確定概念間的關系,并依次填入到關系節點中。在畫圖過程中,關鍵是抽取中文句子中的概念節點,判斷起始概念節點,確定中心概念節點以及結束節點。對概念的屬性,采用《現代漢語詞典2010》中對詞的表述,人工抽取以及確定屬性值。從概念集中篩選冗余的概念和根據兩個概念的屬性-值列表確定關系節點,需要領域專家的經驗。

2實驗與結果分析

本文設計了一個自動問答系統來考查C-A&R概念圖表征漢語語義的有效性和可靠性。事先對語料庫進行了甄選,從實驗室開發的科技評審系統所涉的一些用戶常見問題和答案中挑選文本作為實驗文本。實驗的方式采用傳統的手工構建,人工抽取,在此基礎上用計算機進行匹配。問句構建C-A&R概念圖時,首先將其轉換成陳述句,并且保證關系是二元關系。把起始概念作為中心概念。答案文本的內容較多,包含的概念有多有少,并且敘述的層次性、并列性以及分點性等特點給構圖增加了難度。同時答案中包含大量的復合概念,需要大量的概念圖連接、投影、限制和合并等操作。本次實驗構建了103個中文句子(包含嵌套子句)的C-A&R概念圖,包含556個概念節點和35個不同關系節點。實驗從三個方面即準確率、召回率和F值(β=1)來對系統進行評價。

2.1數據存儲本文考慮概念圖的層次結構以及復雜程度的不同,擬采用XML文檔的形式進行存儲。在設計節點時,采用三級節點的形式:概念圖節點<Graph>、概念節點<Concept>和概念關系節點<Relation>。如圖5所示:

2.2的結果與分析本次實驗文本中,總共包含21個問句,21個答案文本以及35個評審相關的中文句子的概念圖和26個子句概念圖。實驗采取兩種方式進行:一、根據用戶輸入的問句直接在問句文本中查找出問句,而實驗問句事先已經和答案文本一一對應;二、根據用戶輸入的問句,提取關鍵字作為概念,直接在答案文本的概念圖庫和評審句子概念圖庫中查找。兩種實驗方法的原理是一樣,第一種通過查找問句間接找到答案,第二種是直接和答案匹配。具體實驗結果如表2、3所示。從實驗結果可以看出,使用C-A&R概念圖來表示中文句子,比傳統的概念圖的效果更好。目前本文的實驗主通過機器抽取,人工判斷抽取結果,假設抽取的結果的正確率都是1,根據實驗結果可以得出,在給概念圖中的概念節點添加內涵屬性后,顯然能夠提高精確值。

3結束語

本文根據Sowa的概念結構理論,結合E-A-V結構表示方法,在傳統的概念圖中加入了概念屬性-值列表集合,從而將概念所包含的內涵和外延顯式的表征在概念圖中。在進行概念圖的匹配操作時,從當前圖中的概念節點、關系節點和屬性-值列表判斷兩張概念圖的相似性。本文對概念圖的知識表示方法進行了研究,并且提出了一種新的知識表示方法,為中文信息語義匹配提出了一種解決思路。根據本文提出的初步設想,在今后的研究中,將重點研究在概念節點確定下,如何根據概念節點識別所包含的有限屬性以及確定兩個概念節點間的關系。

作者:鐘茂生 鄒志兵 單位:華東交通大學 信息工程學院

主站蜘蛛池模板: 免费v片在线观看无遮挡| 国产曰批免费视频播放免费s | 狠狠躁日日躁夜夜躁2022麻豆| 国产伦理一区二区| jizz18高清视频| 国内露脸中年夫妇交换视频| 一级做a爱片在线播放| 熟妇人妻一区二区三区四区 | 激情综合色综合久久综合| 卡一卡二卡三在线入口免费| 顶级欧美色妇xxxxx| 国产精品29页| 三级视频网站在线观看| 日韩在线第二页| 亚洲区精品久久一区二区三区| 老师办公室被吃奶好爽在线观看 | 91麻豆国产福利精品| 好男人社区www在线观看| 亚洲AV无码之日韩精品| 精品无码久久久久久国产| 国产精品久久久久影视青草| 中国猛少妇色XXXXX| 日本影片和韩国影片网站推荐| 亚洲va在线va天堂va手机| 精品久久8X国产免费观看| 国产无套粉嫩白浆在线| 67194熟妇在线观看线路1| 成年美女黄网站色大免费视频| 亚洲成人黄色在线| 特黄aa级毛片免费视频播放| 国产人成精品香港三级古代| 欧美人与牲动交xxxxbbbb| 国产精品国产三级国产潘金莲| 一本大道香蕉高清视频视频| 最新视频-88av| 亚洲人成电影在线观看网| 欧美日韩电影在线播放网| 啊轻点灬大ji巴太粗太长了h| 亚洲av无码片一区二区三区| jazzjazz国产精品| 最后一夜无删减版在线观看|