前言:我們精心挑選了數(shù)篇優(yōu)質(zhì)通信網(wǎng)絡(luò)的分類文章,供您閱讀參考。期待這些文章能為您帶來啟發(fā),助您在寫作的道路上更上一層樓。
[關(guān)鍵詞]運(yùn)營商;通信網(wǎng)絡(luò)建設(shè);分層分類管理
doi:10.3969/j.issn.1673-0194.2015.08.039
[中圖分類號]F626 [文獻(xiàn)標(biāo)識碼]A [文章編號]1673-0194(2015)08-0056-01
近年來通信業(yè)發(fā)展飛速,移動、聯(lián)通等大型電信運(yùn)營商要對通信工程進(jìn)行合理的分層分類管理,這樣可以有效地節(jié)約成本,進(jìn)而提高電信運(yùn)營商的經(jīng)營效益。
1 從管理層進(jìn)行區(qū)分
目前,包含移動、聯(lián)通在內(nèi)的較大的電信運(yùn)營商都已經(jīng)在海外上市,這些運(yùn)營商一般都包含地市、省、集團(tuán)三級結(jié)構(gòu),從公司組織結(jié)構(gòu)上講,移動和電信是母子公司架構(gòu),聯(lián)通等是股份公司、分公司架構(gòu),而這些電信運(yùn)營商的地市公司屬于本地網(wǎng),由分公司對其進(jìn)行管理。不論使用何種架構(gòu),從本質(zhì)上來說,這些大運(yùn)營商的決策中心都是集團(tuán)公司,利潤中心是省級公司。電信運(yùn)營商的地市級公司只是成本中心或營銷中心。所以,具有全局戰(zhàn)略意義的重大通信工程應(yīng)由集團(tuán)公司進(jìn)行統(tǒng)一規(guī)劃,再由地市級、省級公司落實(shí),例如調(diào)整優(yōu)化全網(wǎng)結(jié)構(gòu)等。只有這樣才能使電信運(yùn)營商的經(jīng)營順利進(jìn)行,才能保證通信工程的質(zhì)量。具有局部戰(zhàn)略意義的通信工程則可以由省級公司主導(dǎo),集團(tuán)公司只需要審批并進(jìn)行指導(dǎo)。戰(zhàn)略意義及影響較小的通信工程可以交由地市級公司來主導(dǎo),因?yàn)檫@些項(xiàng)目一般具有總投資大、數(shù)量多的特點(diǎn),由地市級公司對其進(jìn)行立項(xiàng)并負(fù)責(zé)其投資回報(bào)率,可以實(shí)現(xiàn)這些通信工程項(xiàng)目收益最大化,有利于這些電信運(yùn)營商的發(fā)展。
2 從市場角度進(jìn)行區(qū)分
從市場角度講,運(yùn)營商可以分為引導(dǎo)客戶需求和滿足客戶需求兩類,依據(jù)對市場的了解程度,把那些以占領(lǐng)市場、滿足客戶需求為目標(biāo)的通信工程放在比較接近市場與用戶的本地網(wǎng)進(jìn)行立項(xiàng),可以有效地提高運(yùn)營商的市場反應(yīng)速度,進(jìn)而更好地滿足客戶需求。省級集團(tuán)客戶和全國性行業(yè)客戶,應(yīng)依據(jù)決策者與信息所有者相一致的原則,將其交由省級公司或者集團(tuán)公司進(jìn)行統(tǒng)一部署,為用戶提供專業(yè)化、界面統(tǒng)一的服務(wù)。以引導(dǎo)客戶需求為最終目標(biāo)的通信工程項(xiàng)目如新技術(shù)、新業(yè)務(wù)的上線應(yīng)該交由集團(tuán)公司進(jìn)行統(tǒng)一部署、統(tǒng)一牽頭、分步實(shí)施,因?yàn)榻ㄔO(shè)這些通信工程項(xiàng)目需要決策單位對整個通信行業(yè)十分了解,需要決策單位有敏銳的洞察力和長遠(yuǎn)的眼光。
3 從地域和投資額進(jìn)行劃分
依據(jù)責(zé)、權(quán)、利相統(tǒng)一的原則,立項(xiàng)主導(dǎo)單位可以依據(jù)通信工程的投資額大小來劃分,也可以依據(jù)地域不同來劃分,例如:集團(tuán)公司對全國性光纜工程進(jìn)行統(tǒng)一規(guī)劃,省級公司對省級干線進(jìn)行立項(xiàng),地市級公司對本地網(wǎng)內(nèi)的小通信工程以及二級干線進(jìn)行統(tǒng)籌實(shí)施。但是地域和投資額劃分方式存在一定的弊端,這兩種劃分方式都是粗放型的。如果運(yùn)營商要成功獲得競爭優(yōu)勢,不能以這兩種劃分方式為主導(dǎo),其只能在運(yùn)營商總體規(guī)劃中起輔助作用。
4 投資額較大的通信工程的分類方法
電信運(yùn)營是技術(shù)密集、資本密集產(chǎn)業(yè),它具有寡頭壟斷、投資巨大、進(jìn)入門檻高以及政策性強(qiáng)等特點(diǎn)。如今電信運(yùn)營商已在我國形成“5-1”競爭格局,而且各地也存在著許多以接入服務(wù)以及增值服務(wù)為基礎(chǔ)的開放性虛擬運(yùn)營商與地方小型運(yùn)營商。基于這些情況,可以使用麥肯錫―通用電器矩陣對新業(yè)務(wù)通信工程和戰(zhàn)略性工程決策進(jìn)行優(yōu)先排序。麥肯錫―通用電器矩陣是以新業(yè)務(wù)吸引力和企業(yè)競爭力為軸做出的表格,而新業(yè)務(wù)領(lǐng)域吸引力包含的主要因素是風(fēng)險(xiǎn)、收益率、市場規(guī)模和增長空間。公司的競爭地位包含的主要因素是靈活性、競爭優(yōu)勢持續(xù)性、市場份額以及有效的業(yè)務(wù)系統(tǒng)等。麥肯錫―通用電器矩陣主要對外部市場以及企業(yè)自身比較優(yōu)勢進(jìn)行描述,電信運(yùn)營商可以依據(jù)自身能力和資源狀況以及所面對的市場情況,指導(dǎo)電信運(yùn)營商充分利用網(wǎng)絡(luò)外部性、協(xié)同效應(yīng)以及電信運(yùn)營業(yè)的規(guī)模經(jīng)濟(jì)進(jìn)行合理的投資。
5 本地小通信工程的分類方法
本地小通信工程工作量大,單個項(xiàng)目投資額小,投資項(xiàng)目零散。電信運(yùn)營商在管理實(shí)務(wù)中一般會根據(jù)參數(shù)與指標(biāo)的不同對這些本地小通信工程進(jìn)行分類,由本地小通信工程所在地域決定其建設(shè)優(yōu)先級別和投資額度。目前劃分方法有ABC分類法,以及根據(jù)非直接收益投資和直接收益投資分類兩種。ABC分類法是把收入增長率以及投資回報(bào)率作為劃分的維度,這種分類法在進(jìn)行劃分的同時,還考慮了成長性與收益性這兩個具有一定關(guān)聯(lián)性的目標(biāo),這兩個目標(biāo)都是一種前瞻性指標(biāo),它們都要求對未來的發(fā)展趨勢、區(qū)域經(jīng)濟(jì)環(huán)境以及工程服務(wù)對象等有充分了解。在ABC分類方法的實(shí)際使用中,因?yàn)樾畔⒌牟粚ΨQ性,一般使用那些歷史性指標(biāo),對企業(yè)所在行業(yè)的發(fā)展趨勢進(jìn)行預(yù)測。倘若企業(yè)是其服務(wù)對象,還要把握該企業(yè)擁有的能力與資源狀況、該企業(yè)所在行業(yè)的發(fā)展趨勢等。非直接收益投資指的是沒有使企業(yè)的收入明顯增長的投資。在非直接收益投資和直接收益投資分類中,一般要先對直接收益投資項(xiàng)目進(jìn)行立項(xiàng)。
數(shù)據(jù)挖掘 數(shù)據(jù)解析 網(wǎng)絡(luò)業(yè)務(wù)類型劃分 聚類算法
1 引言
21世紀(jì)信息和通信技術(shù)高速發(fā)展,技術(shù)的進(jìn)步給人們的日常生活帶來了諸多便利。通訊是社會交往中的重要紐帶,推動著數(shù)字信息的發(fā)展。通信行業(yè)的大數(shù)據(jù)應(yīng)用,能夠優(yōu)化移動通信網(wǎng)絡(luò),開拓更豐富的服務(wù)業(yè)務(wù),為移動用戶提供更精準(zhǔn)、更便捷的服務(wù)。
Gn數(shù)據(jù)是Gn口原始碼流解析得到的數(shù)據(jù),主要反映用戶使用各類數(shù)據(jù)業(yè)務(wù)的詳細(xì)情況。在傳統(tǒng)的Gn數(shù)據(jù)解析過程中,流量類型里“未識別TCP流量業(yè)務(wù)”、“未識別UDP流量業(yè)務(wù)”和“DNS解析流量業(yè)務(wù)”等類型均被劃為未知服務(wù)。這樣的計(jì)算模型會導(dǎo)致解析結(jié)果里未知服務(wù)的占比很高。
本文針對原始Gn數(shù)據(jù),提出了一種新的網(wǎng)絡(luò)業(yè)務(wù)分類方法:利用大數(shù)據(jù)并行計(jì)算模式解析DNS業(yè)務(wù)里的URL,解析結(jié)果通過挖掘算法(基于密度的聚類算法)模型處理,以確立新的網(wǎng)絡(luò)業(yè)務(wù)類型。
2 技術(shù)介紹
2.1 大數(shù)據(jù)處理步驟
大數(shù)據(jù)的飛速發(fā)展已經(jīng)影響到了各行各業(yè),其中信息、互聯(lián)網(wǎng)和通信行業(yè)受到的影響最大。大數(shù)據(jù)的到來恰逢通信行業(yè)的轉(zhuǎn)型過渡階段,給這個行業(yè)注入了新鮮的血液。
大數(shù)據(jù)處理方法通常為四步,分別是原始數(shù)據(jù)的采集、數(shù)據(jù)導(dǎo)入和預(yù)處理、數(shù)據(jù)的統(tǒng)計(jì)和分析以及數(shù)據(jù)挖掘。下面將按照這四個步驟的順序進(jìn)行闡述。
(1)數(shù)據(jù)采集
數(shù)據(jù)的采集階段是指用數(shù)據(jù)庫來接收以Web、App等形式傳送的數(shù)據(jù),在大數(shù)據(jù)的采集過程中,最主要的問題是處理高并發(fā)數(shù),同一時間c可能會有上萬條申請操作。而采集階段通常采用的優(yōu)化方式是在這些數(shù)據(jù)庫之間進(jìn)行分時分片管理和負(fù)載均衡。
(2)數(shù)據(jù)導(dǎo)入和預(yù)處理
數(shù)據(jù)導(dǎo)入指的是將原始數(shù)據(jù)導(dǎo)入到分布式存儲集群,并且在導(dǎo)入過程中,對數(shù)據(jù)做去除噪聲點(diǎn)、篩選特定條件等清洗工作。導(dǎo)入和預(yù)處理過程中面臨的主要效率瓶頸是網(wǎng)絡(luò)帶寬和磁盤IO。
(3)數(shù)據(jù)統(tǒng)計(jì)和分析
大數(shù)據(jù)場景下的統(tǒng)計(jì)與分析主要通過分布式計(jì)算集群來對數(shù)據(jù)進(jìn)行分析和分類匯總等,在這一階段,最常用的兩個計(jì)算框架是Hadoop和Spark。統(tǒng)計(jì)與分析遇到的主要問題是,分析時所涉及的數(shù)據(jù)量通常很大,其對系統(tǒng)資源會造成極大的占用。
(4)數(shù)據(jù)挖掘
數(shù)據(jù)挖掘階段是一個知識發(fā)現(xiàn)的過程,一般沒有預(yù)先設(shè)定好的主題。比較典型的算法有用于聚類分析的K-means算法、用于統(tǒng)計(jì)學(xué)習(xí)的SVM算法和用于分類的Na?ve-Bayes算法。該過程的特點(diǎn)主要是用于挖掘的算法一般比較復(fù)雜,考慮到系統(tǒng)資源的開銷,需要選擇合適的計(jì)算框架。
2.2 基于聚點(diǎn)密度和距離的高效聚類算法
把一個數(shù)據(jù)集分割成不同的類或簇,使得同簇內(nèi)數(shù)據(jù)對象的相似性盡可能大,不同簇中數(shù)據(jù)對象的差異性也盡可能地大,通常采用聚類算法。從傳統(tǒng)的聚類分析方法來看,在進(jìn)行聚類之前都需要先確定要聚類的類別數(shù)目,然而在現(xiàn)實(shí)運(yùn)營數(shù)據(jù)的分析過程中,聚類的類別結(jié)果通常是未知的,一般要經(jīng)過多次實(shí)驗(yàn)來獲得相對合適的聚類數(shù)目。考慮到本文中要分析的數(shù)據(jù)是多維度的結(jié)構(gòu)化數(shù)據(jù),且聚類結(jié)果不需要人工干預(yù),可以參考Alex Rodriguez和Alessandro Laio提出的新的聚類算法,下面對此聚類算法做簡要介紹。
該算法假設(shè)所確定的類簇中心點(diǎn)是由一些局部密度相對其較低的點(diǎn)所環(huán)繞,并且這些點(diǎn)與其他高局部密度點(diǎn)(其他類簇中心點(diǎn))的距離都比較大。首先定義兩個值:局部密度ρi以及到其他高局部密度點(diǎn)的距離δi。
ρi=Σj X(dij-dc) `(1)
(2)
公式中dc是一個臨界變量值,是一個預(yù)先設(shè)定的參數(shù)。從公式(1)和(2)可以得出,ρi相當(dāng)于和點(diǎn)i的距離差值小于dc的點(diǎn)的個數(shù)。由于該算法只對ρi的相對值敏感,所以面對大數(shù)據(jù)量時,為了算法的健壯性,對dc的選擇最好使得平均每個點(diǎn)的鄰居數(shù)為所有點(diǎn)數(shù)量的1%~2%。
δi=minj:ρj>ρi (dij) (3)
根據(jù)公式(3),δi用來表示點(diǎn)i和點(diǎn)j直接的距離,其中ρj>ρi。對于ρ值最大的點(diǎn),設(shè)置其δi=maxj (dij)。
局部密度ρi和據(jù)其他中心點(diǎn)距離δi的值均很大的點(diǎn)被認(rèn)為是類簇的中心。局部密度較小但是δi較大的點(diǎn)則是異常點(diǎn)。在確定了類簇中心之后,非中心點(diǎn)屬于其距離最近的類簇中心所代表的類簇。
圖1是以ρ為橫坐標(biāo)、以δ為縱坐標(biāo)的決策圖。可以看到,1號和10號兩個點(diǎn)的ρi和δi都比較大,可以作為聚類焦點(diǎn)。11、12、13三個點(diǎn)的δi比較大,但是ρi較小(周圍點(diǎn)密度太小),所以是異常點(diǎn),在聚類過程中將被清洗掉。
3 服務(wù)類型劃分系統(tǒng)模型設(shè)計(jì)
傳統(tǒng)的Gn數(shù)據(jù)解析過程中,在流量類型字段里,將“未識別TCP流量業(yè)務(wù)”、“未識別UDP流量業(yè)務(wù)”和“DNS解析流量業(yè)務(wù)”劃為未知服務(wù)。這樣的計(jì)算模型導(dǎo)致Gn數(shù)據(jù)解析后,業(yè)務(wù)類型里會有很高占比的未知服務(wù)。解決大量的“未知服務(wù)”的分類結(jié)果,既可以最大化地利用原始數(shù)據(jù),又可以在多維度的情況下,細(xì)分用戶的網(wǎng)絡(luò)業(yè)務(wù)。系統(tǒng)采用分布式集群架構(gòu),如圖2所示,分為數(shù)據(jù)獲取、數(shù)據(jù)清洗、數(shù)據(jù)解析、數(shù)據(jù)云存儲、數(shù)據(jù)模型挖掘、挖掘結(jié)果分析幾個步驟。
數(shù)據(jù)獲取階段,將Gn接口數(shù)據(jù)通過FTP的方式將數(shù)據(jù)傳送給數(shù)據(jù)清洗模塊。
數(shù)據(jù)清洗主要是完成無效字段的替換,將RNC解析流量對應(yīng)URL為空的記錄刪除,并完成目標(biāo)數(shù)據(jù)的選取,將Gn原始數(shù)據(jù)類型中流量類型為RNC解析流量的記錄截取出來。
數(shù)據(jù)解析,如圖3所示,所映射的URL包括查詢的域名及查詢類型。解析URL需要解析協(xié)議(如http、https)、域名或IP、端口號(如7001、8080)、Web上下文、URI,請求資源地址等。此處需要解析出域名,并將其存儲為一個新的字段。做一個URL映射表,將訪問域名進(jìn)行歸類映射,例如SINA映射為新聞咨詢?yōu)g覽,tianya映射為討論類論壇,weibo映射為社交網(wǎng)絡(luò)等。
數(shù)據(jù)云存儲階段,將解析后的數(shù)據(jù)以Parquet文件塊的形式存儲在HDFS上,作為數(shù)據(jù)挖掘接入口。
數(shù)據(jù)挖掘模型采用2.2節(jié)介紹的基于聚點(diǎn)密度和距離的高效聚類算法。將解析后的數(shù)據(jù)作為輸入端,通過挖掘模型計(jì)算,自動生成聚類結(jié)果。此處需要注意的是,由于算法中dc變量值(表示測量點(diǎn)臨界間距)需要事先設(shè)定好,所以為了得到合理的結(jié)果,需多次對數(shù)據(jù)進(jìn)行訓(xùn)練,找到一個符合業(yè)務(wù)分析需求的特定值。另外,根據(jù)用戶實(shí)際使用情況,同一種業(yè)務(wù)在不同時間段會產(chǎn)生不同的用戶體驗(yàn)需求,以及每個人會有不同的使用習(xí)慣等,將輸入?yún)?shù)定為業(yè)務(wù)發(fā)生時間、RNC解析URL域名、年齡這三個字段。
4 計(jì)算結(jié)果分析
經(jīng)過多次訓(xùn)練,得到聚類分析結(jié)果,分別為:
(1)深夜(22:00―24:00),年齡
(2)中午(11:00―13:00),26
傳統(tǒng)方式的Gn數(shù)據(jù)解析后,服務(wù)型分為流媒體業(yè)務(wù)、下載業(yè)務(wù)、即時通信、瀏覽業(yè)務(wù)和未知服務(wù)五類。結(jié)合聚類分析的結(jié)果可以初步判斷,在未知服務(wù)內(nèi)會有大部分人喜歡深夜使用社交網(wǎng)絡(luò)服務(wù),以及會有很多青年人會選擇在中午的時候?yàn)g覽新聞咨詢。可以嘗試在服務(wù)類型中將第五類未知服務(wù)新分出一類:社交網(wǎng)絡(luò)服務(wù),其確定的方法可以按照聚類的方式倒推,即匹配其解析后的URL。
5 結(jié)束語
本文對比傳統(tǒng)的Gn數(shù)據(jù)解析方式,提出了一種基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)業(yè)務(wù)類型劃分方法。在實(shí)際應(yīng)用中,該方法在處理大規(guī)模數(shù)據(jù)和高維數(shù)據(jù)時性能有待于提高。針對這種情況,有學(xué)者提出一種在高維空間挖掘映射聚類的方法PCKA,它能從多個維度中篩選出相關(guān)的維度,并根據(jù)相關(guān)維度進(jìn)行聚類。另一方面,如需要對全國范圍的Gn數(shù)據(jù)業(yè)務(wù)分類,應(yīng)使用更全面的數(shù)據(jù)進(jìn)行模型訓(xùn)練。
參考文獻(xiàn):
[1] 陳宇. 京廣高鐵GPRS業(yè)務(wù)Gn接口數(shù)據(jù)監(jiān)測的應(yīng)用[J]. 鄭鐵科技, 2013(1): 23.
[2] 韓宇. 基于數(shù)據(jù)挖掘的聯(lián)通運(yùn)營監(jiān)控模塊的設(shè)計(jì)與實(shí)現(xiàn)[D]. 沈陽: 東北大學(xué), 2011.
[3] 陳平,郭蘭珂,方俊湘. 微信業(yè)務(wù)的識別方法研究[J]. 移動通信, 2013,37(18): 80-83.
[4] 鄭桂鳳. 移動互聯(lián)網(wǎng)的用戶行為分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 北京: 北京郵電大學(xué), 2010.
[5] 閆春榮,牟宏蕾,郝亞飛. 移動通信大數(shù)據(jù)信息在決策分析平臺中的應(yīng)用方案研究[J]. 移動通信, 2016,40(10): 24-28.
[6] 李玲俐. 數(shù)據(jù)挖掘中分類算法綜述[J]. 重慶師范大學(xué)學(xué)報(bào): 自然科學(xué)版, 2011(4): 44-47.
[7] 劉明吉,王秀峰. 數(shù)據(jù)挖掘中的數(shù)據(jù)預(yù)處理[J]. 計(jì)算機(jī)科學(xué), 2000,27(4): 54-57.
[8] 胡志風(fēng). 大數(shù)據(jù)在職務(wù)犯罪偵查模式轉(zhuǎn)型中的應(yīng)用[J]. 國家檢察官學(xué)院學(xué)報(bào), 2016(4): 144-153.
[9] 鄭雅麗. 圖書館應(yīng)用大數(shù)據(jù)的策略研究[J]. 科技視界, 2015(12): 163-164.
關(guān)鍵詞:網(wǎng)絡(luò)分類法;分類法;信息組織
當(dāng)今,網(wǎng)絡(luò)信息迅速發(fā)展,如何提高用戶網(wǎng)絡(luò)信息資源的檢索率需要對網(wǎng)絡(luò)信息加以組織與揭示。分類法是一種按照事先規(guī)定好的學(xué)科或體系范疇,依照一定的屬性將信息分門別類地組織起來以便查檢的方法。傳統(tǒng)分類法是對文獻(xiàn)的一種分類法,包括《中圖法》、《人大法》等。網(wǎng)絡(luò)分類法是對分布在互聯(lián)網(wǎng)上的信息資源進(jìn)行分類的方法。由于網(wǎng)絡(luò)信息分類法尚存在一些問題,如何利用傳統(tǒng)分類法的優(yōu)勢完善網(wǎng)絡(luò)信息分類法成為如今討論的熱點(diǎn)。
1網(wǎng)絡(luò)信息分類法與傳統(tǒng)文獻(xiàn)分類法的比較
1.1分類對象不同傳統(tǒng)分類法以物理或?qū)嶓w的文獻(xiàn)為對象,如印刷文獻(xiàn)、磁帶、光盤等[1],對其的內(nèi)容進(jìn)行標(biāo)引和整序。網(wǎng)絡(luò)信息分類法則以分布在各個服務(wù)器上紛繁復(fù)雜的網(wǎng)絡(luò)資源為處理對象,對它們進(jìn)行組織與加工。因?yàn)樘幚韺ο蟮牟煌纬闪藘煞N不同的分類法。1.2對象半衰期不同傳統(tǒng)分類法對象是實(shí)體文獻(xiàn),半衰期長,更新速度慢。所以傳統(tǒng)分類法對文獻(xiàn)的標(biāo)引與整序需要規(guī)范的受控詞匯。而網(wǎng)絡(luò)信息分類法對象是網(wǎng)絡(luò)化信息,半衰期短,更新速度快,穩(wěn)定性差。所以網(wǎng)絡(luò)信息組織與整序需要靈活的自然語言。1.3類目的排列方式不同傳統(tǒng)分類法的類目嚴(yán)格按照邏輯層次劃分,具有科學(xué)性和嚴(yán)密性,偏向于專業(yè)性,對普通用戶適用性差。網(wǎng)絡(luò)分類法由于適用于普通用戶,專業(yè)性不強(qiáng)又同位類數(shù)量大,因此不局限于使用邏輯排列法,廣泛采用按重要性、字順排列的方法。
2傳統(tǒng)分類法在網(wǎng)絡(luò)信息組織中的應(yīng)用
2.1傳統(tǒng)分類法在網(wǎng)絡(luò)信息組織中應(yīng)用的現(xiàn)狀在國外,一些著名分類法被網(wǎng)站或搜索引擎用來組織網(wǎng)絡(luò)信息。在中國,傳統(tǒng)分類法應(yīng)用于網(wǎng)站目前包括兩種情況:①各大搜索引擎的類目設(shè)計(jì)上,運(yùn)用傳統(tǒng)分類法主題分類的思想,為縮小搜素范圍,在搜索框上方設(shè)計(jì)幾個主題模塊。比如,百度搜索引擎的搜索框上方已經(jīng)將內(nèi)容分為“新聞、地圖、貼吧”。②網(wǎng)址導(dǎo)航系統(tǒng),在整體上或者局部參考一個或幾個文獻(xiàn)分類法的類目體系。但是,分類法應(yīng)用于網(wǎng)絡(luò)信息資源的組織僅局限于局部分類體系或主題法,并沒有形成體系。2.2網(wǎng)絡(luò)信息組織的缺陷2.2.1分類體系混淆。網(wǎng)絡(luò)分類法在設(shè)置大類時,對知識的系統(tǒng)性考慮不足,更多的是以信息量和信息內(nèi)容的重要性及其使用頻率為標(biāo)準(zhǔn)[2],大多數(shù)網(wǎng)站只選取些熱門事物作為主題類目,忽略通用性的因素不科學(xué)的設(shè)置類目。2.2.2類目概念劃分邏輯混亂。類目概念劃分邏輯不清,比如搜狐網(wǎng)站將“財(cái)經(jīng)”、“理財(cái)”、“股票”、“基金”原本屬于上下位類關(guān)系的主題詞列為同位類。各別網(wǎng)站為吸引眼球在類目下設(shè)置非此類的信息,如搜狐網(wǎng)站在“游戲”類目下設(shè)置“大學(xué)”、“情感”等主題。這種概念歸屬不清,給用戶查找相應(yīng)信息造成了困難。2.3傳統(tǒng)分類法用于網(wǎng)絡(luò)信息組織的優(yōu)勢由于網(wǎng)絡(luò)信息急劇膨脹,如何在復(fù)雜的信息中準(zhǔn)確地查找信息,需要對信息進(jìn)行科學(xué)的組織標(biāo)引。目前網(wǎng)絡(luò)信息分類法并不完善,需要借鑒傳統(tǒng)分類法科學(xué)的分類優(yōu)勢。①文獻(xiàn)分類法是綜合性分類法,覆蓋面廣,具有很高的通用性,科學(xué)性。②文獻(xiàn)分類法類目劃分邏輯層次分明,有利于網(wǎng)絡(luò)信息瀏覽檢索和對主題分類的控制。
3借鑒傳統(tǒng)分類法完善網(wǎng)絡(luò)信息組織
鑒于網(wǎng)絡(luò)信息分類法存在的問題,需要學(xué)習(xí)傳統(tǒng)分類法科學(xué)清晰、邏輯嚴(yán)密的類目體系,并結(jié)合自己身的特點(diǎn),改進(jìn)不足。可從以下幾點(diǎn)進(jìn)行改進(jìn)。3.1使類目體系設(shè)置依據(jù)科學(xué)嚴(yán)密的邏輯體系創(chuàng)建由于網(wǎng)絡(luò)信息類目設(shè)置隨意,給用戶檢索信息帶來了困難。因此,類目設(shè)置科學(xué)嚴(yán)密的邏輯體系,并且統(tǒng)一標(biāo)準(zhǔn),可以使用戶在不同網(wǎng)站中快速精確的定位信息。3.2滿足檢索專業(yè)性信息的需要網(wǎng)絡(luò)信息中也不乏一些專業(yè)性的信息資源,由于隨意的類目加大了檢索難度,因此,規(guī)范類目名稱,或者應(yīng)用數(shù)據(jù)庫式分類檢索方式,使用戶準(zhǔn)確地查找到有價值的學(xué)術(shù)資料。目前,互聯(lián)網(wǎng)上的信息豐富冗雜,分類法成了網(wǎng)站信息組織的主要方法。我國的網(wǎng)絡(luò)信息分類法只注重信息的查全率,下一步就應(yīng)該重視發(fā)展信息的查準(zhǔn)率,這就需要借鑒傳統(tǒng)分類法的優(yōu)勢,結(jié)合自身的特點(diǎn),不斷完善網(wǎng)絡(luò)信息分類法,實(shí)現(xiàn)網(wǎng)絡(luò)信息資源效用最大化。
[參考文獻(xiàn)]
[1]俞君立.文獻(xiàn)分類法[M].武漢:武漢大學(xué)出版社,2001:78~84.