本站小編為你精心準備了城市軌道交通客流量預測探究參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
摘要:通過分析城市軌道交通日均客流及相關影響因素的變化特征,以多種因素作為數據集特征,采用梯度提升法和隨機森林的混合模型對日均客流量進行預測。以北京地鐵客流數據作為研究對象,對模型進行了試驗。試驗結果表明,基于梯度提升和隨機森林的混合模型相較于常規ARI-MA模型和隨機森林模型具有更好的適應性,在常態和特殊情況下均能取得可接受的預測效果。
關鍵詞:城市軌道交通;客流量預測;梯度提升
客流量的預測和分析是城市軌道交通規劃和建設的重要依據。城市軌道交通客流與群眾出行規律密切相關,通常具有較強的時間序列特征。過去已有相關領域的研究人員基于ARIMA模型實現了客流量的預測,通過對模型進行各方面優化,提升了預測效果[1-2]。近年來機器學習技術得到廣泛應用,有的采用特殊結構神經網絡[3-4]、支持向量機[5]等方法實現客流量預測,并通過分析客流特征研究居民出行規律和交通規律。本文在參考已有算法的基礎上[6-8],使用梯度提升決策樹混合模型預測城市軌道交通客流量,并分析相關影響因素特征。
1梯度提升決策樹基本原理
梯度提升決策樹是一種通過構建多個弱學習器、并將之組合形成強學習器的集成模型。通常使用分類回歸決策樹作為弱學習器。分類回歸決策樹是一種應用較為廣泛的決策樹實現方法,其每一次訓練盡可能遍歷所有可能的屬性取值,依據最佳分割點將樣本數據分為2個部分,以遞歸分割的方式,不斷循環直至終止條件。梯度提升屬于提升算法體系的一種,由斯坦福教授J.H.Friedman提出[6-7]。其基本思想是利用損失函數的負梯度在當前模型下的值作為模型本次訓練結果殘差的近似,并以該值作為下一次訓練的目標。模型的輸出結果將向著損失函數減小的方向移動。
2客流預測模型機理及數據集特征處理
2.1模型預測機理地鐵日均客流量具有明顯的周期性和季度性。其時序性決定了日客流量與日期、歷史客流量直接相關。天氣、氣溫及節假日等則是引起客流量波動的重要因素。使用樹模型的實質,即通過樣本數據探究以上相關因素的差異性對流量大小的影響。根據樹模型的原理,在理想狀態下,對于任意1組特征組合,都應存在1個客流量集合與之對應,同1集合內客流量的均值將作為符合該特征組合的客流量預測值。模型每一次迭代都將根據以上特征對樣本進行若干次劃分,特征與預測目標較高的相關性保證了分類效果。根據梯度提升算法,模型第一次訓練以實際客流進行擬合,此后以上一次預測結果與實際值的殘差來訓練子樹,從而逐步縮小預測殘差,降低擬合偏差。數據樣本及其特征的選擇將極大影響模型的預測結果,只有合理的樣本特征才能實現模型的最大作用。因此,需選定樣本的輸入與輸出,并對樣本數據進行特征工程處理,以保證樣本屬性與特征的有效性。
2.2數據集特征處理根據預測機理及相關研究,在分析影響城市軌道交通日客流量的若干因素后,搜集相關數據進行特征處理形成合適的訓練樣本。本試驗采用的數據來源為北京地鐵2015年1月1日至2017年7月17日15條運營線路的日客運量及對應時間的相關特征數據,共929個樣本。特征數據包含離散值和連續值。離散值應按等級分類、合并或進行one-hot編碼。為保證決策樹分類效果,應根據特征與客流間的相關性作為評價標準,應將不相關數據或具有較多噪音數據進行剔除、替換和合并處理,以實現降維,最終形成適用于模型的數據集。根據以上分析對相關屬性特征進行處理,得到訓練特征。工作日與周末使用同一個狀態進行分類;天氣數據按照類別進行合并處理,分為7個等級;節假日對客流量有較大的影響,春節、國慶與其他節假日的差異性通過4個類別劃分。通過Python模塊Seaborn和Pandas可進行編程,以實現數據圖表的可視化輸出。
3試驗與仿真
使用Python機器學習模塊Scikit-learn[9]實現模型的建模與仿真。取前850個樣本作為訓練集,后79個樣本作為測試集,模型輸出為對應測試集下的日客流量。對模型參數進行多次調整,每種參數組合進行2000次訓練。令T為樣本的特征總數,選取部分參數組合下的預測結果如表2所示。由表2可知,回歸子樹的深度N與訓練子集使用的特征數t越大,訓練時間越長。
4結語
本文分析了梯度提升法的概念和基本原理,將梯度提升法和隨機森林的混合模型應用于城市軌道交通客流預測。通過分析北京地鐵客流特征及多種影響因素,制定了適用于模型的訓練集。試驗分析了梯度提升混合模型及其他兩種基本模型的預測結果,基于梯度提升的混合模型能實現更高精度。綜上所述,梯度提升混合模型能夠適用于城市軌道交通客流量的預測與分析,且能取得較好效果。未來研究需進一步完善數據集,擴大樣本規模,并結合智慧交通及大數據技術,深入分析城市人口出行規律,為城市軌道交通規劃及管理提供新的研究思路及參考。
參考文獻
[1]蔡昌俊,姚恩建,王梅英,等.基于乘積ARIMA模型的城市軌道交通進出站客流量預測[J].北京交通大學學報(自然科學版),2014,38(2):135.
[2]白麗.城市軌道交通常態與非常態短期客流預測方法研究[J].交通運輸系統工程與信息,2017,17(1):127.
[3]李少偉,陳永生.城市軌道交通客流預測算法設計與仿真[J].計算機科學,2014,41(2):276.
[4]鄒東,劉瓊,黃梓榮.城市軌道交通線網時空相關性客流預測研究[J].城市軌道交通研究,2016(3):32.
[5]趙鈺棠,楊信豐,楊珂.基于支持向量機的地鐵客流量預測[J].都市快軌交通,2014,27(3):35.
[8]BOWLESM.Python機器學習預測分析核心算法[M].沙嬴,李鵬,譯.北京:人民郵電出版社,2016.
作者:丁聰1;倪少權2;呂紅霞2 單位:1.西南交通大學信息科學與技術學院,2.西南交通大學交通運輸與物流學院