美章網(wǎng) 資料文庫(kù) 基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)輿情論文范文

基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)輿情論文范文

本站小編為你精心準(zhǔn)備了基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)輿情論文參考范文,愿這些范文能點(diǎn)燃您思維的火花,激發(fā)您的寫(xiě)作靈感。歡迎深入閱讀并收藏。

基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)輿情論文

1網(wǎng)絡(luò)輿情分析模型

網(wǎng)絡(luò)輿情分析模型架構(gòu)如圖1所示,其中網(wǎng)絡(luò)數(shù)據(jù)抽取與預(yù)處理是基礎(chǔ),輿情分析引擎是關(guān)鍵,該引擎主要利用數(shù)據(jù)挖掘技術(shù)來(lái)實(shí)現(xiàn),包括分類、聚類、關(guān)聯(lián)規(guī)則和異常檢測(cè),最終能夠?qū)崿F(xiàn)熱點(diǎn)識(shí)別、話題追蹤和輿情預(yù)警的功能。

1.1網(wǎng)絡(luò)數(shù)據(jù)采集與預(yù)處理網(wǎng)絡(luò)上存在海量的各種異構(gòu)資源,例如文本、圖片、音頻、視頻等。輿情分析的第一步就是將各種數(shù)據(jù)采集來(lái),可以利用開(kāi)源的網(wǎng)絡(luò)數(shù)據(jù)抓取軟件進(jìn)行,例如WebDataExtractor等。采集來(lái)的數(shù)據(jù)不規(guī)范,需要做進(jìn)一步處理,例如聚集、抽樣、特征創(chuàng)建、特征子集選擇和變量變換等。預(yù)處理后的數(shù)據(jù)將會(huì)寫(xiě)入數(shù)據(jù)中心,以便輿情分析引擎調(diào)用。

1.2數(shù)據(jù)挖掘數(shù)據(jù)挖掘可以從收集的大量數(shù)據(jù)集中發(fā)現(xiàn)有價(jià)值的信息,包括:分類、聚類、關(guān)聯(lián)規(guī)則和異常檢測(cè)等。輿情分析引擎的設(shè)計(jì)主要依托數(shù)據(jù)挖掘技術(shù)。分類又稱為監(jiān)督學(xué)習(xí),是指從給定的訓(xùn)練數(shù)據(jù)中學(xué)習(xí)到一個(gè)分類模型。分類法包括:基于規(guī)則的分類法、決策樹(shù)分類法、神經(jīng)網(wǎng)絡(luò)分類法、支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)和樸素貝葉斯分類法等。分類方法的主要目標(biāo)是建立具有很好泛化能力的模型。網(wǎng)絡(luò)上的數(shù)據(jù)是以主題形式進(jìn)行組織,常見(jiàn)主題有:政治、財(cái)經(jīng)、體育、娛樂(lè)、軍事等。根據(jù)已有數(shù)據(jù),利用分類技術(shù),能學(xué)習(xí)生產(chǎn)一個(gè)判別模型,該模型能實(shí)現(xiàn)對(duì)新的網(wǎng)頁(yè)自動(dòng)分類,這在新聞推送方面具有重要應(yīng)用價(jià)值。聚類分析[9](ClusterAnalysis)是一個(gè)無(wú)監(jiān)督的學(xué)習(xí)過(guò)程,在發(fā)現(xiàn)數(shù)據(jù)分析和模式中起著十分重要的作用,其形式化描述為:給定數(shù)據(jù)集合D={x1,x2,…,xn},其中xi為數(shù)據(jù)對(duì)象,根據(jù)數(shù)據(jù)對(duì)象之間的相似度將數(shù)據(jù)集合劃分成k個(gè)不同的子集:C1,C2,…,Ck(k≤n),則對(duì)于坌i,j∈[1,k],且為正整數(shù),使得Ci≠覫,Ui=1kCi=D,且Ci∩Cj=覫成立。物以類聚,人以群分是對(duì)聚類技術(shù)的直觀解釋。各種社交網(wǎng)絡(luò)中,存在著微博“大V”,也稱為“意見(jiàn)領(lǐng)袖”。這些“大V”用戶擁有很多粉絲,他們的言行會(huì)對(duì)網(wǎng)絡(luò)輿論空間產(chǎn)生重大的影響,甚至左右輿論方向。

科學(xué)合理地分析這些“意見(jiàn)領(lǐng)袖”的內(nèi)容,就抓住了社會(huì)網(wǎng)絡(luò)分析的主要方面。而聚類技術(shù)能夠快速識(shí)別出設(shè)計(jì)社會(huì)網(wǎng)絡(luò)中的意見(jiàn)領(lǐng)袖。關(guān)聯(lián)規(guī)則是描述數(shù)據(jù)庫(kù)中屬性之間存在的潛在關(guān)系的規(guī)則,形式為X→Y,其中,X稱為規(guī)則前件(an-tecedent),Y稱為規(guī)則后件(consequent)。項(xiàng)目集間的關(guān)聯(lián)規(guī)則的含義為:如果X出現(xiàn)在一條交易中,那么Y在這條交易中同時(shí)出現(xiàn)的可能性比較高。每條規(guī)則都對(duì)應(yīng)兩個(gè)指標(biāo)最小支持度(minsupport)和最小置信度(minconfidence),用來(lái)衡量它的興趣度。異常檢測(cè)的目標(biāo)是發(fā)現(xiàn)與大部分?jǐn)?shù)據(jù)不同的對(duì)象,也稱為離群點(diǎn)檢測(cè)(outlierdetection)、偏差檢測(cè)(deviationdetection)。異常檢測(cè)的方法主要有基于模型的技術(shù)、基于近鄰度的技術(shù)和基于密度的技術(shù)。論壇中,各網(wǎng)民都是針對(duì)特定主題進(jìn)行發(fā)帖、回復(fù)或轉(zhuǎn)發(fā)的。如何發(fā)現(xiàn)一個(gè)新的帖子,與已有帖子內(nèi)容的相似度極小,則該帖子為異常點(diǎn)。需要對(duì)該帖子格外關(guān)注,做進(jìn)一步的語(yǔ)義分析。

2網(wǎng)絡(luò)輿情展現(xiàn)

網(wǎng)絡(luò)上,用戶經(jīng)常會(huì)針對(duì)某一事件展開(kāi)討論,有大量用戶參與討論的事件和話題稱為熱點(diǎn)話題。根據(jù)數(shù)據(jù)中心的內(nèi)容,例如網(wǎng)頁(yè)的關(guān)鍵詞,回帖的數(shù)目,轉(zhuǎn)發(fā)的數(shù)量等,借用數(shù)據(jù)挖掘技術(shù)可以計(jì)算出各話題的熱度值。網(wǎng)絡(luò)上有海量信息,用戶沒(méi)有精力一一關(guān)注。本網(wǎng)絡(luò)輿情分析模型可以挑選出熱度值較高的話題反饋給用戶。網(wǎng)絡(luò)空間是真實(shí)社會(huì)空間的縮影,輿情分析模型中也引入社會(huì)網(wǎng)絡(luò)分析(SocialNetworkAnalysis)的方法。話題追蹤就是根據(jù)特定主題,利用相關(guān)技術(shù),把該主題相關(guān)后續(xù)信息都搜集起來(lái)的方法。為實(shí)現(xiàn)話題追蹤,應(yīng)先建立話題模型,常用的話題模型是向量空間模型(VectorSpaceModel)。在計(jì)算各話題間的相似度,常用的相似度有歐幾里得距離、閔可夫斯基距離等。

3結(jié)語(yǔ)

國(guó)家需要了解社情民意,這樣才能夠制定出正確的方針、政策。網(wǎng)絡(luò)媒體是廣大網(wǎng)民表達(dá)自身觀點(diǎn)的重要渠道,做好網(wǎng)絡(luò)輿情分析具有重要意義。本文提出了一種基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)輿情分析模型,運(yùn)用分類、聚類、關(guān)聯(lián)規(guī)則和異常檢測(cè)等方法,來(lái)實(shí)現(xiàn)熱點(diǎn)識(shí)別、話題追蹤和情感傾向性分析等功能。網(wǎng)絡(luò)上存在海量的、異構(gòu)的數(shù)據(jù)資源,如何高效地整合這些資源、設(shè)計(jì)針對(duì)大數(shù)據(jù)的計(jì)算、分析和挖掘算法,是設(shè)計(jì)網(wǎng)絡(luò)輿情分析產(chǎn)品的關(guān)鍵,也是進(jìn)一步努力的方向。

作者:趙紀(jì)濤王婷單位:許昌學(xué)院信息工程學(xué)院許昌學(xué)院圖書(shū)館

主站蜘蛛池模板: 免费a级毛片无码av| 国产粗话肉麻对白在线播放| 中文字幕无码乱人伦| 樱花草视频www| 亚洲精品无码少妇30P| 精品日韩在线视频| 国产又色又爽又黄的| 天堂在线最新资源| 在线精品国产一区二区三区| 两性午夜欧美高清做性| 日韩在线视频观看| 亚洲国产成人久久一区www| 狠狠干2018| 再深点灬舒服灬太大了添动视频| 色综合久久伊人| 国产成A人亚洲精V品无码性色| 1024视频在线| 国精无码欧精品亚洲一区| yy6080理论午夜一级毛片| 成人福利免费视频| 久久久久久久97| 日韩人妻精品一区二区三区视频| 亚洲五月激情网| 欧美精品va在线观看| 人人玩人人添人人| 精品午夜福利1000在线观看| 国产一区二区免费在线| 韩日视频在线观看| 国产成人综合精品| 老汉色av影院| 国产精品毛片va一区二区三区| 99久久国产综合精品麻豆| 天天摸日日摸人人看| √最新版天堂资源网在线| 成人免费无码大片a毛片软件| 久久99精品久久久久婷婷| 日本特黄特色aaa大片免费| 久久精品第一页| 最近在线观看视频2019| 亚洲人成网站在线观看青青| 欧美日韩国产精品va|