美章網 資料文庫 機器學習在數據挖掘中的應用范文

機器學習在數據挖掘中的應用范文

本站小編為你精心準備了機器學習在數據挖掘中的應用參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。

機器學習在數據挖掘中的應用

摘要:在社會生產規模不斷擴大的背景下,數據挖掘對升級轉型產業結構發揮了重要作用,一般會利用機器學習方法達到操作目標。這種學習方法有效提升了操作水平,確保獲得更加穩定的數據。但傳統機器學習無法滿足需求,應不斷進行改進,才能達到發展需要。本文基于大數據、機器學習方法和數據挖掘內容,對機器學習的科學應用進行整體分析,希望可以獲得更加精準的數據。

關鍵詞:大數據;機器學習;數據挖掘

1引言

大數據具有種類繁多、容量巨大、處理速度飛快和價值密度低等特點。從搜索、存儲與處理數據等角度看,機器學習算法改進了數據集合,但傳統算法已無法挖掘大規模異構數據。因此,大數據時代全面研究數據挖掘中機器學習的應用,推動了我國信息社會的可持續發展。

2大數據、機器學習方法和數據挖掘

2.1大數據分析與管理數據是提升有效性的主要方法,但隨著數據類型與數量的不斷增加,一般的數據處理軟件無法滿足目前數據的特點。上述所說的數據集合就是大數據,其明顯超越了傳統存儲數據MB、GB的形式。為了決策過程中充分發揮數據保障作用,建立更加科學的決策系統,需要在計算數據過程中不斷優化處理數據方式。大數據具備豐富的數據類型與內容,通過微秒與毫秒的形式傳輸,體現了其快速的特性。另外,分類大數據的操作過程難度較大,需要有效排除影響因素,保證獲得真實、可靠的信息。

2.2機器學習方法機器學習包括多種方法。第一,回歸算法。它是產生其他算法的重要前提,包括線性與邏輯回歸兩種,前者主要解決數值問題,后者主要有效預測數字,這種方法還屬于分類算法,因此往往獲得離散分類的結果。第二,神經網絡。它的主要原理是全面研究與模擬大腦工作過程,通過多個處理單元形成若干個層次結構,共同組成邏輯架構,其操作原理是接收層獲取信號,隱藏層分解、處置數據,輸出層是合理整合最終的結果。此外,每一個存在于網絡的處理單元都可以認為是一個模型,存在于隱藏層的若干個神經網絡稱之為深度神經網絡,在這一基礎上開展的研究則是深度學習。第三,支持向量機。與神經網絡形成的生物背景相比,支持向量機擁有十分濃厚的數學成分。雖然方法自身僅是不斷增強邏輯回歸算法,但其可以和高斯函數有效融合,從高維空間成功映射低維空間,順利轉化線性分類技術。第四,聚類算法。它主要通過科學計算種群形成的距離,結合遠近程度,將其劃分為若干個族群。第五,降維算法。它的核心特點是將高維降至低維,研究證明這個方法能夠充分保存數據,有效壓縮數據,提高算法的操作水平,能夠可視化處理相關數據。第六,推薦算法。它是目前最流行的算法之一,大規模應用于電子商務,可結合有關購買情況自行推薦給人們最喜歡的東西。機器學習界存在大量算法,其中至關重要的是支持向量機和神經網絡算法。結合學習內容可將算法劃分為三種類型。第一,全方位的監督學習,指計算機通過環境得到信息知識,提示錯誤的判斷,并提供正確答案。監督學習主要是為了在整體學習中利用計算機積累經驗、提升技能,正確解答尚未學習的問題,如回歸、神經網絡和支持向量機等。第二,不會合理監督學習,即計算機在網絡中自行搜集、整理、篩選有價值的信息,但缺乏準確目標,主要包括聚類和降維。第三,不斷加強學習,在無任何環境指示的前提下,計算機可以正確評價預測的答案。

2.3數據挖掘數據挖掘可以更加全面地分析數據,科學總結發展規律,其中關鍵操作步驟是準備數據、搜尋規律和揭示規律。社會發展過程中,數據挖掘是最關鍵的內容,廣泛應用于電力、醫學和農業領域。當前,不斷強化數據挖掘需要基于大數據背景科學應用機器學習,不斷提升操作能力,推動數據挖掘操作的可持續發展[1]。

3利用機械學習的優勢

傳統機器學習算法中內容是關鍵,但保存數據過程中,TB和PB級數據已不能順利存儲于計算機。大數據處理時代背景下,大多數算法已無法達到數據挖掘的操作要求,因此只有通過不斷改進,才可以與當今發展要求高度契合[2]。機器學習算法中,人工神經網絡方法可以通過建立不同模型,體現魯棒性與描述功能,嚴格控制精度。大數據時代提高了機器學習的困難度,一方面由于持續發展的數據規模,另一方面由于多樣化的數據分布,傳統學習要求數據差生獨立分布,導致其不能全面發揮作用。因此,應積極優化算法,更好地開展數據挖掘操作。將機器學習應用于大數據處理,提升了分類性能,經過設計樣本密集區域的分類器,有效發揮作用。大數據時代,機器學習已成功打破概念學習的理念,緊跟時展的腳步,成為挖掘改善數據的關鍵渠道。

4科學分類任務

4.1分類利用訓練數據集開展機器學習,進一步獲得完善的分類模型,科學劃分與歸類帶有各種標簽類別的數據內容,從而順利達到劃分數據的目標。當前,神經網絡、KNN分類算法等已初步完成了分類算法。比如,科學分類訓練集過程中,科學預處置文本,利用傳統特征選擇或結合同義詞特點獲取向量特征空間,標識為文本向量,進而借助分類模型科學預測其結構[3]。

4.2回歸分析回歸分析具體指認真分析數據后,通過統計學方法整體詮釋變量與變量之間的關系,利用內部發展規律準確預測發展趨勢,采用神經網絡、線性回歸等科學建立數據模型。

4.3關聯通常具有事務型特點的數據之間有較強的關聯標準。全面挖掘這部分數據關系可獲得頻繁項集,科學預測一部分事務的概率。比如,apriori算法,已大規模應用于商業網絡領域。

4.4聚類借助于挖掘算法,在彼此不同的簇中科學聚集類型不同的數據對象,保證數據對象的高度相似,同時確保簇間若干數據對象的差異性,如k-means算法和神經網絡。

5實際應用人工神經網絡方法

擁有廣泛的應用范圍,可以高速處理數據并安排自主學習,通過實精準的識別進一步處理、分類數據。此外,可通過建模開展工作,擁有多樣的模型,以滿足不同需求。基于整體角度分析,這一方法的角度模型精致,魯棒性能極佳,描述能力較強。

5.1針對定位問題的建模建模具體是通過給予向量機定位最大支持,柵格化處置定位區域,且相對面積偏小的柵格可獨立作為一類區域。定位范圍內,整理測量擁有龐大規模的終端數據,通過計算機分析、處理測量報告,認真測量柵格距離度與準確度,預判移動終端柵格,最終實施求解操作[4]。

5.2收集與預處理數據以某城市周邊長為10km的正方形區域作為研究對象,其內部四個時間段短路檢測的四部分數據作為仿真數據,通過線測得的三部分數據為訓練數據,最后定位處理數據集。同時,為了確保定位方法的有效性,可有效篩選第四部分數據集定位,刪除10m以內的集中路測數據。另外,可對此正方形區域內部的全部基站編號,預處理有關數據后,成功轉化數據集內部的全部數據,并儲存于計算機內部[5]。

5.3初步實施定位復雜的移動終端定位計算與應用程度、區域定位面積之間的關系為正相關,逐步增大區域面積,將會產生更加復雜的回歸模型。科學定位移動終端需為計算函數提供大量參考建議,利用學習算法過程中,適當擴大區域定位范圍,有效提高定位與訓練過程中所需的復雜程度。圍繞基站的經緯度開展初步定位,相關操作如下。科學劃分邊長為10km的正方形,使其成為邊長為1km的小柵格。因為規定區域中,移動終端與服務區域內部基站之間的距離不會超出500m,所以1km邊長的柵格便是定位參考的核心區域,即定位學習算法過程中的定位范圍[6]。

5.4二次進行定位上述操作結束后,由于定位第一級支持向量機是400m范圍,第二級是輸出待定的100m柵格數據,因此需選取一個邊長為2km的正方形區域。與一級向量機的定位相比較,二級在計算定位的過程中不會產生較大的復雜度,如果獲得的分類和所有向量機都存在n個數據,就需要統一采取成對分類方法,科學處置大量分類問題。柵格的改變提高了定位精度,加大了分類總量,提高了定位復雜程度,計算總量時保證了定位于最小階段。

5.5三次開展定位首先需要明確定位區域的具體面積,其次結合數據有效確定邊長,最后利用K-近鄰法開展三次定位。此外,需具備整體訓練數據,科學選擇數據,以降低計算的復雜程度。但是,隨著選擇面積的逐步增大,定位準確性將逐漸降低。

6結語

隨著科學技術的飛速發展,數據挖掘技術逐步占據主導地位,其中機器學習的應用至關重要。作為一門涉及多個領域的知識學科,通過積極優化算法,可以不斷提高定位的準確性和速度。因此,有關人員必須給予有效關注,持續改進,全方位發揮應用優勢,爭取在大數據時代利用數據挖掘功能,幫助用戶成功解決定位終端問題。

參考文獻

[1]李成錄.大數據背景下機器學習算法的綜述[J].信息記錄材料,2018(5):4-5.

[2]楊尚林.基于機器學習的多源異構大數據清洗技術研究[D].南寧:廣西大學,2017:12.

[3]莫雪峰.機器學習算法在數據挖掘中的應用[J].科教文匯,2016(7):175-178.

[4]張棟,柯長青,余瞰.機器學習算法在ALOS影像分類中的應用研究[J].遙感信息,2016(3):26-29.

[5]陳曉燕.遺傳算法在數據挖掘中的應用[J].瓊州學院學報,2015(2):15-17.

[6]谷珊.大數據環境下機器學習算法趨勢研究[J].海峽科技與產業,2017(8):127-128.

作者:王旸 單位:陜西中醫藥大學

主站蜘蛛池模板: 国产成人精品综合久久久| 我被丝袜长腿美女夹得好爽| 人人妻人人澡人人爽曰本 | 亚洲视频在线观看一区| 老师好长好大坐不下去| 99精品视频在线观看免费播放 | 国产欧美第一页| 亚洲欧美日韩成人一区在线| 美女奶口隐私免费视频网站| 国产成人亚洲精品91专区手机| 777奇米四色| 天天插天天狠天天透| 中文字幕在线观看一区二区三区| 曰批免费视频观看40分钟| 全黄性性激高免费视频| 97久久精品午夜一区二区| 日韩乱码在线观看| 亚洲大香伊人蕉在人依线| 男人桶爽女人30分钟视频动态图| 啊灬啊灬别停啊灬用力啊免费看 | 日本a级作爱片金瓶双艳| 九九精品99久久久香蕉| 欧美又大又粗又爽视频| 亚洲熟妇丰满xxxxx| 猫扑两性色午夜视频免费| 国产大陆亚洲精品国产| 思思99re热| 国产美女主播一级成人毛片| 丰满妇女做a级毛片免费观看| 日韩高清第一页| 亚洲乱码国产乱码精品精| 欧美日韩国产一区二区 | 久久狠狠爱亚洲综合影院| 男孩子和男孩子做到哭泰国| 嗯~啊~哦~别~别停~啊老师| 要灬要灬再深点受不了好舒服| 国产成人vr精品a视频| 欧美成人看片一区二区三区 | 九九精品国产99精品| 杨晨晨白丝mm131| 免费无毒A网站在线观看|