本站小編為你精心準備了軟件開發中信息庫的數據挖掘參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
摘要:
隨著社會的發展與進步,計算機在社會生活中的各個方面得到了廣泛的應用,這樣在一定的程度上也就使得了軟件技術的發展也會有著很大的發展。在當前社會中,軟件技術中的數據挖掘技術就已經成為了軟件開發中的一個重要的環節,這樣在一定的程度上能夠更好提高軟件的整體的性能,在實際生活中來滿足人們的生活需要,軟件技術在開發過程中,就會使其最終構成軟件開發信息庫,這樣在一定的程度上也就是能夠實現資源上的共享,有利于對相關技術的傳播,進而能夠推動軟件開發技術的提高。因此,本文主要就是筆者結合自身的工作經驗對軟件開發信息庫的數據挖掘來進行分析,提高相關的建議,僅供參考。
關鍵詞:
面向軟件;開發信息庫;數據挖掘
在當前社會中,為了能夠更加的適應時代的發展與科學技術的頸部,軟件開發在信息領域中逐漸的建立起來,同時也取得了一定的成就,在我國的發展上已經是初具規模了。但是在當前的軟件開發總通常都是對軟件項目的維護與跟蹤,這樣在一定的程度上是沒有真正的發揮出信息庫的真正的意義與優勢。隨著時代進步,越來越多的軟件開發的工作人員充分的意識到這一點,進而在開發中也就開始利用數據挖掘該種方式來進行軟件的開發。
1軟件開發信息與數據挖掘軟件
開發信息庫主要就是軟件開發過程中相關數據的總和,其中充分的體現出信息的數據化,通常情況下主要是包括以下幾種信息:①項目信息數據,其中主要是對開發的過程、其中的重要數據、任務細節等。收集項目的信息數據對于后期的開發在一定的程度上是有著重要的作,主要是關系到了軟件的最終性能。②源代碼,軟件開發項目中其中關鍵的部分就是源代碼,這其中在一定的程度上直接的就關系到其執行的能力。源代碼包括了軟件開發系統的設計代碼,升級代碼、以及修改代碼。③軟件開發系統中的相關軟件數據等。數據挖掘又被稱作是數據中的知識發現,這其中主要包含有四個方面:①數據抽取,通過在數據源來抽取所需要的數據進行研究。②數據預處理,這主要是實際的抽取數據與在開發中所需要的數據是不相符合的,這樣必須要對數據中的信息來進行清洗、歸納等。③知識發現。這是數據挖掘中的關鍵環節,在這個環節中就應該要對數據挖掘中的一些有用的信息中來發現有用的數據,并且需要在實際開發中得到一定的應用。④知識表示,是在軟件開發中的表現,對于前三個步驟要進行整理與歸納。在發現實體之間的關系中來進行總結與分析,這樣在在一定的程度上也就能夠將其中的關鍵規則進行關聯性的應用。
2面向軟件開發信息庫的數據挖掘
2.1軟件開發信息庫獲取數據方式
2.1.1數據來源
數據來源主要是對數據來源進行獲取,若是想要提高有效的數據就首先必須要有數據,這樣才能夠進行挖掘。軟件開發信息中是有著很多的信息能夠挖掘的。一般是可以在網絡上的開源軟件中來獲取相關的源代碼信息。也就是說,軟件開發公司中所開發出的數據信息其若是合理的話就能夠建立起相關的信息數據庫。
2.1.2數據抽取
在對數據進行抽取之前,首先是需要對我們研究的目標進行一定的確定,這樣在一定的程度上就能夠保證我們所抽取的數據具有一定的針對性。比如說,想要對軟件的源代碼進行修改,這樣是需要對管理系統領域內的相關代碼修改過程進行明確。而軟件開發信息庫本身就具有一定的復雜性、數量極多特點,這樣在一定的程度上必然就會提高數據抽取的難度。所以,在對數據進行抽取的時候是一定要對于數據源的訪問權限進行獲取,這樣才能夠充分的了解數據的相關信息。
2.1.3數據預處理
數據預處理主要是有三個步驟:①在對配置系統進行科學的管理,并且還要對沒有效的數據進行清除。將重要的信息與軟件開發項目導出,這樣就能夠將分析的結果存儲起來。②缺陷系統數據處理,主要是對缺失的屬性來處理,在處理過程中是需要對數據之間進行分析之后再進行處理。③對于噪聲數據的處理,軟件開發的時間與地點的不同,這樣也就是會導致任務前后之間的關系也是不同的,這樣就會導致系統中會出現噪音,這樣就是需要對噪音的數據進行處理,這樣也就會為后續的工作奠定了基礎。
2.2軟件開發信息庫的關聯修改
在較大的軟件系統中,這其中的有一部分的記錄在缺失中有著一定的依賴關系,這樣在關系就在一定的程度上就會帶的軟件系統在修復的時候會更加的復雜。因此在,在對關聯修改進行數據挖掘的時候是當前多名學者研究的方向。
2.2.1分類研究
當前學術中很多的學者都是將關聯修復看作是分類的角度,這樣在一定的程度上也就是表示,若是運用已經確定的文件來進行修改,這樣就需要對其他文件進行修改或是不修改。有的一部分人員在選擇決策數據的時候,都是在已經選定的文件來選擇1~2個設定的文件,這樣其中的一個為既定的文件組,將其文件的數量、名稱等作為依托。這樣也就可以很輕松的來判定文件是否與另外的文件相符合。
2.2.2聚類研究
還有一部分的相關研究人員會使用聚類的方式來對數據挖掘進行研究。相關的額研究人員會把修改屬性來設定其是否對模塊產生影響,同時還是應該要對修改的信息來聚類。
2.2.3規則研究
很多的研究人員會采用關聯的規則來進行研究,這種方法通常都是根據軟件的記錄來記錄相關的數據,這樣就能夠對軟件進行修改。在當前中比較常用的關聯修改工工具是“玫瑰”,高中軟件在使用的時候主要是通過軟件代碼的方法來進行關聯的。在對關聯規則修改中,都會對對改動分來進行增加或是減少等,隨后還應該要設置支持數來進行依托的。
2.3分析軟件演進
軟件演進的分析說的就是數據的轉換。對于缺陷系統、管理系統中的數據進行轉換。①需要的是對這些系統中的信息能夠有著科學有效的分析,這樣對于系統的有效的數據要分析到位。②要軟件開發的整體結構進行全盤的考慮。
2.4缺陷分析
在這個步驟中,主要是根據實際情況來對軟件開發的缺陷進行研究與分析。神經網絡等分析方法是一個十分有效的方法,在一定的程度上也是對源代碼的提取有著很大的幫助性的作用。
2.5軟件開發信息庫系統的發展
軟件系統的發展與應用都是處于長期不斷的變化發展中,這樣軟件的發展也會使得軟件系統在不斷的改進,這樣在一定的程度上也就能夠保證軟件開發信息庫的的質量,軟件系統在開發的時候是能夠從以下幾個角度中來進行分析。①軟件代碼,解析樹法是軟件代碼中比較常用的分析方法,該種方法在使用中沒有給語義上的重視。②軟件系統,軟件系統。③軟件產品。
3總結
在當前的軟件開發總通常都是對軟件項目的維護與跟蹤,這樣在一定的程度上是沒有真正的發揮出信息庫的真正的意義與優勢。而隨著時代的發展,軟件技術中的數據挖掘技術就已經成為了軟件開發中的一個重要的環節,這樣在一定的程度上能夠更好提高軟件的整體的性能,在實際生活中來滿足人們的生活需要,軟件技術在開發過程中,就會使其最終構成軟件開發信息庫,這樣在一定的程度上也就是能夠實現資源上的共享,有利于對相關技術的傳播,進而能夠推動軟件開發技術的提高。
參考文獻:
[1]張惟慎.面向軟件開發信息庫的數據挖掘綜述.科技創新與應用,2016,03.
[2]高強,賈志淳.面向軟件開發信息庫的數據挖掘綜述.電子制作,2014,10.
[3]周麗英.面向軟件開發信息庫的數據挖掘綜述.中國管理信息化,2016,06.
[4]黃勝.面向軟件工程數據挖掘的開發測試技術.復旦大學,2015,05.
[5]白潔,李春平.面向軟件開發信息庫的數據挖掘綜述.計算機應用研究,2008,01.
作者:邢蕾 單位:遼寧公安司法管理干部學院