本站小編為你精心準備了網絡信息搜索的旅游需求預測參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
《系統管理學報雜志》2014年第三期
1文獻綜述
1.1旅游需求預測對于從事旅游業的各部門和機構而言,準確預測旅游需求至關重要。由于旅游產品從本質上講是“易逝”的(例如未賣出的航班座位、旅館房間等不能像其他產品一樣儲存),因此預測的準確性尤為關鍵,精確的短期預報能夠有助于更好地制定日程計劃、人員安排以及應急預案等。因此,旅游需求預測模型得到了學界和實務界共同關注。根據文獻中的評述,圍繞這一領域國外旅游期刊上共發表了數百篇論文,利用各種定性和定量方法,對不同目的地的旅游業進行預測。定量預測研究大體上可以分為兩大類:時間序列模型和經濟計量模型,時間序列模型用旅游需求的歷史量以及隨機擾動項進行預測,重點在于研究歷史變動趨勢和模式,而經濟計量模型則研究各種經濟指標對旅游需求的影響。對于經濟計量模型,游客接待量是反映旅游需求最為通用的指標,而解釋變量則千差萬別,其中,游客收入、目的地旅游價格與來源國價格之比、其他目的地旅游價格以及匯率是影響旅游需求最重要的指標。從分析的粒度來看,大部分研究以國家和地區為研究對象,時間頻率多為年度、季度和月度,以長期預測為主,很少有研究以天為時間單位預測短期旅游需求。近年來,國內對旅游需求的研究發展很快,但多是對國外理論的引介,實證研究較少,特別是以景區為對象的微觀研究則更少。例外的是,文獻中分別以海南省天涯海角景區、四川九寨溝景區和重慶武隆景區為對象對旅游流量進行了預測。然而,該類研究大都以單一景區為研究樣本,從而在一定程度上影響了研究結論的外部效度。總體而言,現有旅游需求預測研究對影響旅游需求的因素、旅游需求預測方法等領域有著較為扎實的基礎。然而,從實證研究的具體應用角度而言,數據的時間分辨率和空間分辨率較低(時間尺度多為月或年,空間分辨率多為國家或省市)。因此,盡管這些研究能夠為宏觀政策制定提供參考,但是在短期(例如以周/天為時間單位)、特定景區的游客需求預測方面現有研究仍顯不足;同時,由于依賴于統計部門或市場調研機構的數據,現有研究一般都有時間滯后,無法做到實時預測。而在黃金周這類旅游需求集中釋放時期,及時的預測往往又是最為需要的。由于網絡信息搜索數據具有精度高、實時性強的特點,因此能夠對傳統時間序列模型和經濟計量模型進行有效補充。
1.2網絡信息搜索在各種消費者行為模型當中,信息處理理論都占有重要地位[,這一理論認為消費者決策過程包含5大過程:問題認知、信息搜索、評價、選擇、購買后過程。旅游服務的特點決定了旅行決策通常伴有較高的風險,因此游客會采取各種策略降低風險,其中就包括進行廣泛的信息搜索。在旅游目的地選擇過程中,游客會形成并逐漸縮小備選集并最終做出選擇,這一過程同時受到社會心理和非社會心理因素的影響,這些因素分為4類:內部變量(態度、價值觀、生活方式、動機、意愿、人格特征等)、外部變量(預算限制、目的地的吸引力、營銷組合、家庭成員或熟人的影響、文化和亞文化等)、旅行本身的特點(規模、距離、時間等)以及旅行體驗(旅行中的情緒和感受、購買后評價等),而最終目的地的選擇取決于這些變量之間的相互作用。文獻中針對游客信息搜索行為提出了一個整合了心理、經濟和信息處理視角的綜合理論模型,提出盡管有多種因素影響搜索行為,但是這些因素大都經由對目的地的熟悉程度和經驗2個中介變量產生影響。文獻[中利用實驗室環境下開展的現場研究方法,對網絡用戶的旅行信息搜索行為進行了研究,結果發現,搜索引擎在搜索過程當中發揮了重要作用。傳統上,游客常用的信息來源包括旅行社、旅游傳單/畫冊、廣告、游客中心等。與此不同的是,互聯網是一個由相互鏈接的網頁節點組成的大型超鏈接系統,其優點是有助于用戶快速獲取大量信息并進行自由組合,但是由于缺乏傳統信息的結構化特點,因此,用戶要找到想要的信息需要花費更大的認知努力。而搜索引擎可以被看成是“互聯網上的哈勃望遠鏡”,能夠幫助游客從數以億計的網頁中定位所需要的旅游信息。有研究顯示,關鍵詞搜索是游客在線信息搜索時最常用的策略,平均八成以上游客在利用互聯網搜索信息時會使用搜索引擎的關鍵詞搜索功能。因此,以搜索引擎關鍵詞搜索為指標的網絡信息搜索有可能反映游客的旅游意愿并用于旅游需求預測。遺憾的是,目前有關網絡信息搜索、特別是搜索引擎的研究大多集中于計算機科學和信息科學領域,盡管已經開始出現少量研究探討了網絡信息搜索與經濟行為的相關性[18-22],但這些研究大多以宏觀綜合經濟指標為對象(例如失業率、CPI等),網絡信息搜索是否能夠對微觀主體的市場表現產生預測作用仍不清楚。本研究將網絡搜索作為衡量游客信息搜索的直接指標,基于景區層次的面板數據,利用搜索引擎數據的實時性特點,以天為時間尺度探討網絡信息搜索對旅游需求的影響。
2實證研究
2.1數據本研究使用的景區樣本為納入四川省假日旅游統計系統的九寨溝、黃龍等21個景區1)。旅游數據來自于四川省旅游局(具體數據可從四川省旅游局網站直接獲得2)),分別采集2010~2011年2個“十一”黃金周期間各景區的日游客接待量作為反映旅游需求的指標。游客搜索行為是通過關鍵詞搜索反映的,搜索數據來自于百度指數。百度是全球最大的中文搜索引擎,截至2012年第三季度,百度在國內的市場份額達到80.3%,遠遠超過其后的谷歌中國(14.6%)、搜狗(2.3%)和搜搜(1.5%)[23]。百度指數是以百度網頁搜索為基礎的免費海量數據分析服務,用以反映不同關鍵詞在過去一段時間里的“用戶關注度”。用戶關注度是以數千萬網民在百度的搜索量為數據基礎,以關鍵詞為統計對象,表示各個關鍵詞在百度網頁搜索中搜索頻次。百度指數每天更新1次,并且提供自2006年6月至今任意時間段的用戶關注度數據。圖1為百度指數的一個應用示例,顯示的是2012年2個景點峨眉山和青城山的用戶關注度變化趨勢。由圖1可以看出,在2012年的大部分時間里,峨眉山受關注程度要高于青城山,其中在4~9月份旅游旺季期間兩景區的用戶關注度的差距較大(前者約為后者的3倍),而在1~3月以及10~12月旅游淡季期間兩景區的差距較小(前者約為后者的2倍)。由于百度指數僅以圖形形式提供關鍵詞的用戶關注度變化情況,并無提供源數據導出的功能。因此,本研究采用了一種數據抓取軟件獲取數據。一般而言,本研究所使用的關鍵詞來自于景區的正式名稱,同時對其全稱取其簡稱作為搜索關鍵個原因:①大部分景區的全稱對應的網絡搜索量不夠,無法獲取其百度指數;②假定游客在出行前搜索景區相關信息時會選擇能夠代表景區(無歧義)的最簡關鍵詞(即簡稱)進行搜索。從百度提供的相關詞功能看,游客在搜索景區相關信息時,除了會直接關注景區信息,還會對其他相關信息進行搜索。排在前面幾位的關鍵詞為:××天氣、××門票、××地圖、××旅游攻略、××住宿等(××表示景區名稱),這也驗證了文獻[24]中的觀點,即搜索請求反映出用戶的目標并且信息目標占主導地位。需要說明的是,由于假定搜索關鍵詞反映的是游客的旅游意愿,因此最終的數據中刪除了有歧義的景點信息(僅包括黃龍景區,原因在于對關鍵詞“黃龍”的搜索可能指代游戲“黃龍騎士團”或“黃龍溪古鎮”)。此外,有2個景區由于搜索量不足無法獲取其搜索數據(華鎣山石林和梓潼七曲山)而被排除掉。因此,最終的面板數據包括了2010~2011年2個“十一”黃金周期間18個景區的日游客流量及相應的景區搜索量(具體景區為碧峰峽、都江堰、峨眉山、海螺溝、九寨溝、恐龍博物館、樂山大佛、青城山、三星堆、石象湖、蜀南竹海、四姑娘山、瓦屋山、西嶺雪山、小平故居、興文石海、中國死海以及閬中古城)。與現有旅游需求經濟計量模型研究一致,本研究還收集了各景區的門票價格。表1列出了數據的統計描述情況。由表1可以看出,各景區的游客量和搜索量逐年增加,游客量的偏度和峰度逐年減小,逐步趨向于正態分布,而搜索量在該指標上變化的方向相反。相關分析表明,搜索量和游客量之間的相關系數為0.35(P<0.01)。圖2反映了搜索量和游客量之間的相關性3)。可以看到,大部分景區位于了線性擬合95%置信度區間以內。就單個景區而言,小平故居和閬中古城在置信區間以上且偏移較遠,可能的原因是小平故居屬于紅色旅游景點,游客大多來自單位組織,而閬中古城屬于古鎮類旅游景點(區別于其他自然風光類景點),因此搜索量較少而游客量較多。在置信區間以下且偏移較遠的是四姑娘山和西嶺雪山,游客量與搜索量之比低于平均水平,說明部分旅游需求尚未滿足,景區有待進一步開發。
2.2模型估計首先采用自回歸時間序列模型作為基準模型,然后在基準模型的基礎上加入搜索指標作為搜索模型,分別估計模型參數并進行比較。本研究所有的分析通過Stata11.0完成,盡管不同的計量軟件可能導致參數估計出現細微差別,但這不應在統計義上影響本研究的總體結論。利用廣義最小二乘法(GLS)對上述模型進行估計,結果顯示,基準模型可以解釋游客流量92.9%的方差,而搜索模型能夠解釋游客流量95.1%的方差,提高了2.2%。增量F檢驗顯示,這一差異在統計上是顯著的(WaldChi-Square(1)=440.08,P<0.001),這表明,網絡搜索指標能夠顯著提高模型的解釋能力。Rho值(不可觀測的景區異質性導致的方差所占比例)從基準模型的36.8%下降到搜索模型的10.7%,說明所增加的搜索增量指標能夠反映部分景區異質性信息。就單個解釋變量而言,搜索增量與景區游客流量之間存在顯著的正相關關系(β=3.33,P<0.001),驗證了網絡信息搜索能夠反映旅游需求的假設。結果還顯示,上一年游客流量與當年游客流量顯著正相關(β=1.06,P<0.001),這與自回歸模型的假設是一致的。此外,景區價格對游客流量的影響在5%的水平下不顯著(β=-1.47,P=0.76),這表明,對于在黃金周集中出游期間,景區門票價格對游客旅游目的地決策不存在顯著影響。表2列出了基準模型和搜索模型的估計結果比較。2.3模型驗證下面采用模型估計———樣本外預測的程序評估預測模型的外部效度。由于數據量限制,很難將據集隨機分為估計樣本和預測樣本,因此本研究采用如下輪轉方法進行處理:輪流將18個景區中的1個景區作為預測對象,利用其他17個景區的數據估計模型參數并進行樣本外預測,分別計算出基于基準模型和搜索模型的預測值,然后評估基準模型和搜索模型預測值與實際值之間的誤差。根據文獻[25]中提出的準則,本研究選擇平均絕對誤差(MAE)和均方根誤差(RMSE)作為反映預測準確性的指標:表3列出了旅游需求預測驗證結果。可以看出,對于大部分景點而言,基于搜索模型的預測值誤差小于基于基準模型的預測值誤差。平均而言,在MAE和RMSE這2個指標上,基于搜索模型的預測誤差分別比基于基準模型的預測誤差小約808(人次)和1179(人次),使預測精度分別提高了約41%和43%。盡管網絡搜索指標對預測誤差的改進取決于具體的預測模型和數據樣本,但是從以上的對比中還是能夠看出網絡搜索指標的價值。圖3以箱線圖的形式驗證了搜索數據的預測效度。由圖3可看出,不論是MAE指標還是RMSE指標,基于搜索模型的預測的誤差都低于基準模型的誤差。為了進一步驗證這一差異是否具有統計意義,首先計算出每組數據基于不同模型的預測值絕對誤差,然后進行配對T檢驗。結果顯示,在0.1%的顯著性水平上,基于搜索模型的預測誤差顯著低于基于基準模型的預測誤差(t=4.35,P<0.001)。由此可見,基于網絡信息搜索的模型能夠顯著提高旅游需求預測的準確性。
3結語
本文從旅游需求預測和信息搜索理論出發,重點討論了網絡信息搜索在旅游需求預測中的作用,并通過模型估計和驗證對所提出的搜索模型的預測準確性進行了評價。結果顯示,以搜索引擎關鍵詞搜索為基礎的旅游網絡信息搜索是反映游客出游意愿的有效指標,結合了網絡信息搜索的旅游需求預測模型能夠對短期、景區層次的旅游需求進行及時、準確的預測,在MAE和RMSE這2個指標上相對于基準模型預測精度分別提高約41%和43%。從研究方法論層次看,本文的研究結果提出了一個新的、基于網絡信息搜索的預測指標,驗證了網絡搜索對需求預測的增量解釋能力,從而表明,基于網絡信息搜索的預測是對傳統旅游需求預測方法的有效補充。從現實意義來看,隨著互聯網發展成為游客獲取信息并購買相關產品的途徑之一,各旅游部門、機構和旅游從業者將能夠及時、便捷地通過搜索引擎等工具提前了解游客出游意愿,并且將網絡搜索信息整合到現有需求預測模型當中,提高旅游需求預測的準確性。特別是在黃金周這類旅游需求集中釋放時期,對各景區游客流量進行及時、準確的預測將為旅游有關部門和機構提供可靠的決策依據,例如提前流量預報、制定限流方案等,幫助實現從“被動應急”轉變為“主動調控”,促進旅游業實現可持續、生態友好型發展。由于數據可獲得性等原因,本研究只對“十一”黃金周的旅游需求進行了驗證,模型是否適用于非假日旅游需求的預測還有待驗證。例如,本研究模型估計結果顯示,旅游目的地價格對旅游需求影響不顯著,這可能是我國特有的黃金周休假制度帶來的旅游需求集中釋放引起的,非假日情況下這種情況可能有所不同。由于旅游決策受到出行地和目的地之間的距離和交通等因素影響,在本研究模型基礎上,如果能區分本地和外地旅游需求并結合相應的網絡搜索數據,將可能進一步提高模型的解釋和預測能力。
作者:王煉賈建民單位:西南交通大學經濟管理學院香港中文大學工商管理學院