美章網(wǎng) 資料文庫(kù) 簽到行為的可預(yù)測(cè)性范文

簽到行為的可預(yù)測(cè)性范文

本站小編為你精心準(zhǔn)備了簽到行為的可預(yù)測(cè)性參考范文,愿這些范文能點(diǎn)燃您思維的火花,激發(fā)您的寫(xiě)作靈感。歡迎深入閱讀并收藏。

《電子科技大學(xué)學(xué)報(bào)》2015年第二期

1數(shù)據(jù)描述

本文研究所采用的數(shù)據(jù)集來(lái)源于兩組由手機(jī)收集到的經(jīng)過(guò)匿名化處理的地點(diǎn)簽到信息:數(shù)據(jù)集D1來(lái)自LBS社交網(wǎng)站Gowalla,全球范圍內(nèi)的用戶(hù)可通過(guò)移動(dòng)端的應(yīng)用程序或者瀏覽器進(jìn)行主動(dòng)簽到,從而與好友分享新的地點(diǎn)、活動(dòng)和旅行線路;數(shù)據(jù)集D2來(lái)自國(guó)內(nèi)某沿海城市的手機(jī)QQ用戶(hù)使用涉及地圖服務(wù)的應(yīng)用時(shí)被動(dòng)記錄下的地點(diǎn)信息。因此,兩組數(shù)據(jù)都是用戶(hù)發(fā)生空間移動(dòng)行為時(shí)記錄的位置信息,包括了用戶(hù)ID、地點(diǎn)經(jīng)緯度、時(shí)間等屬性,且相比于D2,D1由于是用戶(hù)主動(dòng)上傳分享的,故其主動(dòng)性更強(qiáng)一些。為了保證用戶(hù)軌跡信息量具有統(tǒng)計(jì)意義,本文在計(jì)算可預(yù)測(cè)性時(shí)去掉了地點(diǎn)簽到量不足100條的用戶(hù),在去掉不活躍的用戶(hù)之后,D1、D2的用戶(hù)數(shù)量分別為全部用戶(hù)的8.35%和28.92%,但軌跡量卻能分別達(dá)到65.59%和79.33%,地點(diǎn)數(shù)目分別達(dá)到全量數(shù)據(jù)的76.56%和81.00%。兩組數(shù)據(jù)的概述如表1所示。這兩組數(shù)據(jù)都源于手機(jī)用戶(hù)上網(wǎng)、簽到或查詢(xún)地圖等行為,文中將用戶(hù)在某個(gè)地點(diǎn)產(chǎn)生一條軌跡信息記錄的行為統(tǒng)稱(chēng)為“簽到”,若相鄰兩次簽到的地點(diǎn)發(fā)生變化,則稱(chēng)為一次“跳轉(zhuǎn)”,若地點(diǎn)沒(méi)有發(fā)生變化,則稱(chēng)之為“停留”。由于數(shù)據(jù)集中存在短時(shí)間內(nèi)產(chǎn)生多條簽到記錄的現(xiàn)象,使得數(shù)據(jù)在時(shí)間上會(huì)顯得非常頻繁,但在空間地點(diǎn)信息上又顯得不夠豐富。為了更好地分析用戶(hù)的空間移動(dòng)行為特征,將極短時(shí)間內(nèi)在同一地點(diǎn)的多條簽到記錄合并為一條。

2簽到行為的基本特征

2.1用戶(hù)和地點(diǎn)的活躍度分布統(tǒng)計(jì)結(jié)果顯示,本文所研究的簽到行為的時(shí)間間隔分布和跳轉(zhuǎn)距離分布都表現(xiàn)出冪律特征,與文獻(xiàn)[13-15]的結(jié)果類(lèi)似。那么,在人們的日常生活中,每個(gè)人會(huì)訪問(wèn)多少個(gè)不同的地點(diǎn)?每個(gè)地點(diǎn)又會(huì)有多少不同的人來(lái)訪問(wèn)呢?為了回答這兩個(gè)問(wèn)題,定義用戶(hù)的活躍度為用戶(hù)去過(guò)的地點(diǎn)集的大小N,定義地點(diǎn)的活躍度為去過(guò)該地點(diǎn)的用戶(hù)集的大小U。統(tǒng)計(jì)兩個(gè)數(shù)據(jù)集中全部用戶(hù)和地點(diǎn)的活躍度分布,結(jié)果如圖1所示。用戶(hù)活躍度N的累積分布如圖1a所示,兩個(gè)數(shù)據(jù)集中用戶(hù)比例均在大約30個(gè)地點(diǎn)處開(kāi)始明顯下降,這說(shuō)明在人們的日常生活中,大多數(shù)人經(jīng)常訪問(wèn)的地點(diǎn)數(shù)是有限的,對(duì)這些有限數(shù)量地點(diǎn)的訪問(wèn)是較為均勻的。如圖1a插圖所示,曲線在雙對(duì)數(shù)坐標(biāo)下近似為直線,即−ln(P(≥N))~N,故兩個(gè)數(shù)據(jù)集中用戶(hù)的活躍度分布的累積形式表現(xiàn)為廣延指數(shù)分布形式[30-31]:0()exp[(/)]ccP=x−xx,其中0x為特征標(biāo)度,指數(shù)c即為圖1a插圖中近似直線的斜率。而由圖1b知地點(diǎn)的活躍度分布則為冪律分布。這說(shuō)明在特定地點(diǎn)簽到的人數(shù)具有較強(qiáng)的異質(zhì)性,即日常生活中大部分地點(diǎn)的訪問(wèn)人數(shù)較少,同時(shí)存在少數(shù)熱門(mén)地點(diǎn)具有大量的訪問(wèn)人數(shù)。這樣的現(xiàn)象與購(gòu)物、點(diǎn)評(píng)等典型二部圖網(wǎng)絡(luò)的度分布研究結(jié)果類(lèi)似[32],說(shuō)明在真實(shí)系統(tǒng)中,行為的主動(dòng)發(fā)出者所覆蓋的受眾是有限而較為均勻的,而行為的被動(dòng)接收者卻可以接受大量而異質(zhì)的訪問(wèn)。由于Gowalla數(shù)據(jù)的地點(diǎn)精確度非常高,故大部分地點(diǎn)的訪問(wèn)量非常少,因而其U曲線的衰減速度比QQ的U曲線要快得多,后者的異質(zhì)性更強(qiáng)。

2.2簽到行為的統(tǒng)計(jì)特征根據(jù)簽到記錄中的經(jīng)緯度信息,計(jì)算用戶(hù)i在簽到過(guò)程中的跳轉(zhuǎn)距離,并進(jìn)一步得到每個(gè)用戶(hù)的平均跳轉(zhuǎn)距離為。式中,im表示該用戶(hù)全部軌跡點(diǎn)的質(zhì)心。計(jì)算每個(gè)用戶(hù)的回轉(zhuǎn)半徑,其概率分布如圖2b所示,該分布同樣表現(xiàn)為冪律形式,說(shuō)明大多數(shù)人在日常生活中的活動(dòng)半徑是有限的,只有少數(shù)人的活動(dòng)半徑能達(dá)到數(shù)百、甚至數(shù)千公里。進(jìn)一步計(jì)算每個(gè)用戶(hù)的平均跳轉(zhuǎn)距離和回轉(zhuǎn)半徑之間的Pearson相關(guān)系數(shù),結(jié)果在D1和D2中分別為0.630和0.556,即二者表現(xiàn)為較強(qiáng)的正相關(guān)關(guān)系。

2.3跳轉(zhuǎn)距離相關(guān)性用戶(hù)相鄰的兩次跳轉(zhuǎn)之間是否存在內(nèi)在聯(lián)系,是否一次長(zhǎng)距離的跳轉(zhuǎn)也預(yù)示著下一步也是長(zhǎng)距離的跳轉(zhuǎn)?為了研究這個(gè)問(wèn)題,本文采用文獻(xiàn)[33]中定義的記憶性指標(biāo),研究所有個(gè)體用戶(hù)跳轉(zhuǎn)距離的相關(guān)性。若某用戶(hù)i的跳轉(zhuǎn)距離序列共有(||)iinLτ=個(gè)元素(即有1inτ+次簽到),則將原序列分為2個(gè)子序列,分別包含前1inτ−個(gè)元素和后1inτ−個(gè)元素。用M′表示用戶(hù)i的記憶性指標(biāo),則該用戶(hù)的記憶性可以用上述兩個(gè)子序列的Pearson相關(guān)系數(shù)衡量。本文計(jì)算每一個(gè)用戶(hù)的跳轉(zhuǎn)距離序列的M′值。結(jié)果顯示,所有用戶(hù)M′值的平均值M′在Gowalla和QQ中分別為0.134±0.163和0.249±0.186。從該結(jié)果可以看出,對(duì)于大多數(shù)用戶(hù)來(lái)說(shuō),長(zhǎng)距離的跳轉(zhuǎn)之后仍然傾向于長(zhǎng)距離的跳轉(zhuǎn),反之亦然,即跳轉(zhuǎn)距離具有一定的弱記憶性和正相關(guān)性。考慮在日常生活中,人們大部分的出行是在以家和公司為焦點(diǎn)的橢圓范圍之內(nèi)活動(dòng)[34],連續(xù)出行距離都比較短;但一旦有出差、旅行或探親活動(dòng),則很容易伴隨一系列的長(zhǎng)短距離交替的跳轉(zhuǎn)活動(dòng)。相比于數(shù)據(jù)集D1,D2更多是日常生活中城內(nèi)和城際范圍內(nèi)的活動(dòng),因而后者的簽到行為更集中,M′更大,即日常生活中簽到行為的記憶性更強(qiáng)。

3簽到行為可預(yù)測(cè)性分析

3.1簽到行為的可預(yù)測(cè)性度量本文采用文獻(xiàn)[21]中的方法定義簽到行為的熵和可預(yù)測(cè)性,包括三種熵的度量指標(biāo)。隨機(jī)熵:rand2logiiS=N,其中iN表示用戶(hù)i去過(guò)的地點(diǎn)集的大小。該指標(biāo)只考慮用戶(hù)訪問(wèn)過(guò)的唯一地點(diǎn)數(shù),默認(rèn)用戶(hù)以相同概率訪問(wèn)這些地點(diǎn)圖3c揭示了用戶(hù)的地點(diǎn)訪問(wèn)的規(guī)律性分布,在用戶(hù)的簽到行為中,約28.9%的時(shí)間里都是位于該時(shí)段最常簽到的地點(diǎn)。故對(duì)于某個(gè)特定時(shí)段,只要猜測(cè)用戶(hù)位于在其最常訪問(wèn)的地點(diǎn),就至少能夠獲得28.9%左右的準(zhǔn)確度。對(duì)于數(shù)據(jù)集D2,熵、可預(yù)測(cè)性和規(guī)律性等指標(biāo)表現(xiàn)為與D1類(lèi)似的情況。二者的差別表現(xiàn)在:D2的3種類(lèi)別的熵值都比D1低,可預(yù)測(cè)性則要高。這是由于D2數(shù)據(jù)中地點(diǎn)的經(jīng)緯度精度要低于D1,且D2的數(shù)據(jù)中地點(diǎn)的范圍相對(duì)較小(D1中的簽到地點(diǎn)遍布全世界,而D2大部分局限在該城市及周邊),使得D2中的地點(diǎn)重合度高達(dá)97.6%,而D1中只有80.5%。對(duì)于數(shù)據(jù)集D1,在每個(gè)用戶(hù)的簽到序列中新地點(diǎn)的比例更大,總地點(diǎn)個(gè)數(shù)更多,每個(gè)地點(diǎn)訪問(wèn)的概率更小,因此熵值也必然更大。如圖3a所示,D2的真實(shí)熵值real<S>≈2.11,即用戶(hù)跳轉(zhuǎn)的不確定性約為2.112≈4,與文獻(xiàn)[20]一致。說(shuō)明在日常生活中,用戶(hù)的被動(dòng)簽到行為在下一時(shí)刻可能訪問(wèn)的地點(diǎn)數(shù)是非常有限,而主動(dòng)簽到行為可能訪問(wèn)的地點(diǎn)數(shù)要大得多,即用戶(hù)行為的主動(dòng)性會(huì)大大提高熵值,同時(shí)降低可預(yù)測(cè)性。

3.2影響可預(yù)測(cè)性和規(guī)律性的因素分析從前文的統(tǒng)計(jì)結(jié)果可以看出,人類(lèi)的日常簽到行為具有復(fù)雜性和規(guī)律性交織的特征。那么,規(guī)律性越強(qiáng)的用戶(hù)是否更容易預(yù)測(cè)?訪問(wèn)過(guò)更多地點(diǎn)的用戶(hù)、活動(dòng)半徑更大的用戶(hù)是否更難預(yù)測(cè)?計(jì)算每個(gè)用戶(hù)的可預(yù)測(cè)性maxi∏和規(guī)律性realiR之間的Pearson系數(shù),結(jié)果顯示該值在D1和D2中分別為0.057和0.027,即規(guī)律性與可預(yù)測(cè)性之間并無(wú)明顯的相關(guān)關(guān)系,并不是行為越規(guī)律的用戶(hù)越容易預(yù)測(cè)。此外,計(jì)算可預(yù)測(cè)性maxi∏和跳轉(zhuǎn)距離記憶性M′之間的Pearson系數(shù),結(jié)果在D1和D2中分別為0.111和0.096,說(shuō)明可預(yù)測(cè)與跳轉(zhuǎn)距離也沒(méi)有顯著關(guān)聯(lián)。下面本文分析影響用戶(hù)簽到行為可預(yù)測(cè)性和規(guī)律性的因素。

3.2.1可預(yù)測(cè)性的影響因素分析統(tǒng)計(jì)用戶(hù)去過(guò)的地點(diǎn)數(shù)和去過(guò)該地點(diǎn)數(shù)的全部用戶(hù)的平均可預(yù)測(cè)性值,考察二者之間的關(guān)系,結(jié)果如圖4a所示。訪問(wèn)地點(diǎn)數(shù)與可預(yù)測(cè)性的關(guān)系在兩個(gè)數(shù)據(jù)集中表現(xiàn)出了相同的規(guī)律,即先在一段小范圍內(nèi)減小,然后迅速變得平緩,在波動(dòng)中緩慢下降。由于Gowalla數(shù)據(jù)的觀測(cè)期更長(zhǎng),故其用戶(hù)訪問(wèn)的地點(diǎn)數(shù)也更多。這說(shuō)明在一定范圍內(nèi),確實(shí)存在用戶(hù)訪問(wèn)過(guò)的地點(diǎn)數(shù)越多,其行為就更難預(yù)測(cè)的現(xiàn)象。但是隨著地點(diǎn)數(shù)持續(xù)增多其真實(shí)可預(yù)測(cè)性開(kāi)始趨于平緩,即地點(diǎn)數(shù)的影響作用變小。總體上看,用戶(hù)去過(guò)的地點(diǎn)數(shù)與用戶(hù)的可預(yù)測(cè)性存在一定的負(fù)相關(guān)性。根據(jù)2.2節(jié)得到的每個(gè)用戶(hù)的平均跳轉(zhuǎn)距離和回轉(zhuǎn)半徑分析二者和可預(yù)測(cè)性的關(guān)系,如圖4b和4c所示,不論是回轉(zhuǎn)半徑還是平均跳轉(zhuǎn)距離對(duì)于可預(yù)測(cè)性的影響都表現(xiàn)出了相似的規(guī)律,即隨著用戶(hù)活動(dòng)范圍和出行距離的增大,max<∏>和unc<∏>會(huì)在一定的范圍內(nèi)迅速降低,隨后保持比較平穩(wěn)的波動(dòng)過(guò)程,而rand<∏>由于其計(jì)算方式導(dǎo)致其損失了過(guò)多的信息故數(shù)值接近于零,因此沒(méi)有明顯變化。相對(duì)于回轉(zhuǎn)半徑,平均跳轉(zhuǎn)距離對(duì)可預(yù)測(cè)性的影響作用更小。

3.2.2規(guī)律性的影響因素分析規(guī)律性反映了用戶(hù)在特定時(shí)段出現(xiàn)在最常訪問(wèn)地點(diǎn)的概率,那么上述三個(gè)統(tǒng)計(jì)量對(duì)用戶(hù)簽到行為的規(guī)律性是否有影響呢?計(jì)算結(jié)果顯示,隨著用戶(hù)訪問(wèn)地點(diǎn)數(shù)的增大,rand<R>快速衰減并趨近于零,而real<R>在很大范圍內(nèi)保持緩慢的下降,說(shuō)明僅僅是地點(diǎn)數(shù)的增大并不會(huì)對(duì)用戶(hù)簽到的規(guī)律性產(chǎn)生太大影響。而回轉(zhuǎn)半徑和平均跳轉(zhuǎn)距離對(duì)規(guī)律性幾乎沒(méi)有影響。

3.2.3最常訪問(wèn)地點(diǎn)的影響在人們的日常生活中,不論是個(gè)體還是群體用戶(hù)對(duì)某個(gè)特定地點(diǎn)的訪問(wèn)量都具有顯著的異質(zhì)性,少數(shù)地點(diǎn)具有極高的訪問(wèn)量,而大多數(shù)地點(diǎn)極少被光顧。那么這些訪問(wèn)量大的地點(diǎn)是否對(duì)可預(yù)測(cè)性產(chǎn)生影響呢?為了回答這個(gè)問(wèn)題,逐步刪除用戶(hù)移動(dòng)軌跡中訪問(wèn)量最大的K個(gè)地點(diǎn),查看用戶(hù)最大真實(shí)熵和可預(yù)測(cè)性的變化情況。在實(shí)驗(yàn)前首先挑選訪問(wèn)過(guò)的唯一地點(diǎn)數(shù)大于最大刪除量(在數(shù)據(jù)集D1和D2中分別是50和20)的用戶(hù),以保證在刪除訪問(wèn)量大的地點(diǎn)時(shí)用戶(hù)仍然訪問(wèn)過(guò)多于1個(gè)不同的地點(diǎn)。實(shí)驗(yàn)結(jié)果如圖6所示,平均最大真實(shí)可預(yù)測(cè)性max<∏>曲線的變化規(guī)律大致可以分為兩個(gè)階段。當(dāng)刪除的地點(diǎn)數(shù)N不超過(guò)某一閾值時(shí),整體可預(yù)測(cè)性呈下降趨勢(shì);當(dāng)N繼續(xù)增長(zhǎng)超過(guò)該閾值后,整體可預(yù)測(cè)性反而呈上升趨勢(shì)。而real<S>的變化趨勢(shì)則正好相反,在小于閾值范圍區(qū)間內(nèi)隨著K的增大而變大,在大于閾值范圍內(nèi)則慢慢變小。并且,在刪除前面幾個(gè)訪問(wèn)量特別大的地點(diǎn)時(shí),曲線的斜率都比較大,且熵曲線變化的閾值要小于最大可預(yù)測(cè)性曲線變化的閾值。可以從以下方面理解這種非平凡現(xiàn)象:一般情況下,對(duì)地點(diǎn)訪問(wèn)信息豐富的用戶(hù)來(lái)說(shuō),隨著最常訪問(wèn)地點(diǎn)的刪除,用戶(hù)的地點(diǎn)簽到序列會(huì)慢慢變得隨機(jī)化,此時(shí)熵值將慢慢增大,最大可預(yù)測(cè)性也隨之降低。但當(dāng)軌跡點(diǎn)被刪除到一定程度時(shí),用戶(hù)訪問(wèn)序列中的軌跡點(diǎn)都逐漸趨近于被訪問(wèn)極少的次數(shù),幾乎成為一個(gè)完全隨機(jī)的地點(diǎn)訪問(wèn)序列,可預(yù)測(cè)性下降趨勢(shì)逐漸變緩。當(dāng)全部的軌跡點(diǎn)的訪問(wèn)次數(shù)都為1的時(shí)候,熵值達(dá)到最大,此時(shí)可預(yù)測(cè)性曲線也慢慢趨向最小值。當(dāng)繼續(xù)刪除軌跡點(diǎn)時(shí),熵值隨著N的增大而逐漸變小,此時(shí)最大可預(yù)測(cè)性則因?yàn)殡S機(jī)序列中地點(diǎn)數(shù)的減少而緩慢增長(zhǎng)。由此說(shuō)明,用戶(hù)經(jīng)常訪問(wèn)的地點(diǎn)是帶來(lái)簽到行為高可預(yù)測(cè)性的一個(gè)重要因素。而可預(yù)測(cè)性曲線的最值點(diǎn)比熵曲線滯后則是Fano不等式中二者的非線性關(guān)系造成的。

4結(jié)語(yǔ)和討論

本文通過(guò)兩組手機(jī)用戶(hù)的簽到數(shù)據(jù)研究人類(lèi)日常的出行行為,總結(jié)了簽到行為的一般規(guī)律,用熵的方法分析了簽到行為的可預(yù)測(cè)性,并重點(diǎn)分析了影響可預(yù)測(cè)性的幾個(gè)因素。發(fā)現(xiàn)人們的簽到行為具有一定的記憶效應(yīng),對(duì)地點(diǎn)的訪問(wèn)具有明顯的異質(zhì)性。總體來(lái)看,用戶(hù)訪問(wèn)的地點(diǎn)數(shù)和對(duì)最常訪問(wèn)地點(diǎn)的訪問(wèn)規(guī)律對(duì)可預(yù)測(cè)性和規(guī)律性有明顯影響。具體而言,用戶(hù)訪問(wèn)過(guò)的地點(diǎn)的數(shù)量與可預(yù)測(cè)性和規(guī)律性都具有一定的反相關(guān)關(guān)系,而回轉(zhuǎn)半徑和平均跳轉(zhuǎn)距離對(duì)二者的影響則微弱的多。用戶(hù)經(jīng)常訪問(wèn)的地點(diǎn)對(duì)可預(yù)測(cè)性具有顯著影響,隨著這些地點(diǎn)被逐個(gè)刪除,可預(yù)測(cè)性表現(xiàn)為先下降再略微上升的形態(tài)。進(jìn)一步研究還發(fā)現(xiàn),可預(yù)測(cè)性和規(guī)律性是人們?nèi)粘I畹钠毡橐?guī)律,與性別、年齡等屬性無(wú)關(guān)[21],因而該性質(zhì)是人類(lèi)空間運(yùn)動(dòng)的普遍規(guī)律,在人口統(tǒng)計(jì)學(xué)屬性上無(wú)個(gè)體差異。研究表明,當(dāng)用戶(hù)訪問(wèn)的地點(diǎn)數(shù)逐步增大時(shí),以及當(dāng)用戶(hù)最常訪問(wèn)的地點(diǎn)被逐步刪除時(shí),其可預(yù)測(cè)性都會(huì)下降,說(shuō)明用戶(hù)對(duì)地點(diǎn)的訪問(wèn)次數(shù)和訪問(wèn)模式對(duì)可預(yù)測(cè)性有重要影響。一方面,當(dāng)用戶(hù)訪問(wèn)的地點(diǎn)逐漸增多時(shí),其訪問(wèn)序列會(huì)變得混亂,因而熵值增大,可預(yù)測(cè)性下降;另一方面,當(dāng)用戶(hù)經(jīng)常訪問(wèn)的地點(diǎn)被刪掉時(shí),可預(yù)測(cè)性曲線的非線性的下降速率說(shuō)明不同地點(diǎn)對(duì)可預(yù)測(cè)性的影響程度是不同的,訪問(wèn)量大的地點(diǎn)的影響程度也更大。這些結(jié)果都說(shuō)明用戶(hù)對(duì)不同地點(diǎn)的訪問(wèn)量是非均勻的。因此,用戶(hù)對(duì)地點(diǎn)訪問(wèn)的異質(zhì)性是影響其可預(yù)測(cè)性的重要因素。

從研究結(jié)果可以看到,數(shù)據(jù)集D2得到的可預(yù)測(cè)性數(shù)值要高于D1,這樣的差別反應(yīng)了兩組數(shù)據(jù)集的不同。如前文介紹所說(shuō),Gowalla是一個(gè)鼓勵(lì)用戶(hù)主動(dòng)上報(bào)地理位置的LBS網(wǎng)站,其行為更多源自旅游、美食、娛樂(lè)等活動(dòng)的分享;而QQ數(shù)據(jù)是在用戶(hù)日常生活中使用地圖服務(wù)時(shí)記錄的位置信息,日常生活中出行的記憶性和規(guī)律性更強(qiáng),地點(diǎn)重合度也更高,因而其可整體可預(yù)測(cè)性也更高。人類(lèi)行為動(dòng)力學(xué)研究的是人類(lèi)行為的宏觀統(tǒng)計(jì)規(guī)律,而熵的方法分析可預(yù)測(cè)性得到的則是預(yù)測(cè)準(zhǔn)確度的理論上限,并不是真正意義上的預(yù)測(cè)算法。由于人類(lèi)行為的高度復(fù)雜性,對(duì)于個(gè)體出行行為的精確預(yù)測(cè)并不是一件容易的事情,預(yù)測(cè)的準(zhǔn)確度也受到多種客觀條件和數(shù)據(jù)本身的質(zhì)量等因素制約。社會(huì)學(xué)、物理學(xué)、計(jì)算機(jī)科學(xué)等領(lǐng)域的學(xué)者都在從多方面關(guān)注影響人們出行的因素并探索提高預(yù)測(cè)算法的準(zhǔn)確度的方式。本文有助于理解人類(lèi)的出行規(guī)律,為尋找制約預(yù)測(cè)準(zhǔn)確度的因素、改進(jìn)利用熵和Fano不等式計(jì)算可預(yù)測(cè)性的方法提供一定的參考和借鑒。

作者:盧揚(yáng)樊超韓筱璞榮智海單位:電子科技大學(xué)互聯(lián)網(wǎng)科學(xué)中心CompleX實(shí)驗(yàn)室山西農(nóng)業(yè)大學(xué)文理學(xué)院杭州師范大學(xué)信息經(jīng)濟(jì)研究所和阿里巴巴商學(xué)院

主站蜘蛛池模板: 日韩av片无码一区二区不卡电影| 美女扒开尿口让男人操| 在线观看一级毛片免费| 中文字幕人妻三级中文无码视频| 欧洲一区二区三区在线观看| 亚洲高清资源在线观看| 老子影院dy888午夜| 国产妇乱子伦视频免费| 69式啪啪动图| 天天影院良辰美景好时光电视剧| 中文字幕人妻偷伦在线视频| 日本高清二区视频久二区| 亚洲丰满熟女一区二区v | 精品综合久久久久久99| 国产亚洲视频在线| 很黄很污的视频在线观看| 国产精品视频你懂的| GOGOGO高清免费看韩国| 小爱同学下载二三三乐园| 丰满肥臀风间由美系列| 视频一区二区中文字幕| 国产福利一区二区三区| 69pao精品视频在线观看| 天使萌一区二区在线观看| 久旷成熟的岳的| 欧美与黑人午夜性猛交久久久| 亚洲欧美校园春色| 狠狠色婷婷久久一区二区三区| 再深点灬舒服了灬太大| 美国美女一级毛片免费全| 国产一级特黄高清免费下载| 高清中文字幕视频在线播| 国产男人女人做性全过程视频| 综合网激情五月| 国产精品日本一区二区在线播放| 91色综合综合热五月激情| 在线日本妇人成熟| aaaa级少妇高潮大片在线观看| 天海翼电影在线观看| 一本大道香蕉中文在线高清| 成人免费视频网站|