69老司机亚洲精品一区,米奇色777狠狠欧美一区,免费国产小视频

本站小編為你精心準備了結合時間權重與信任關系的協同參考范文，愿這些范文能點燃您思維的火花，激發您的寫作靈感。歡迎深入閱讀并收藏。

結合時間權重與信任關系的協同

《計算機應用研究雜志》2015年第五期

1本文算法

1.1問題建模社會化標注和社會化網絡服務（SNS，如Facebook,Twitter等）體現了Web2.0的分享特點，這種開放、共享的模式為個性化搜索和推薦提供了一個高效的獲取用戶模型的原始數據來源。本文主要利用社會化標注和社會化網絡服務中的好友信息來進行個性化的推薦，所以，我們首先對這兩大類數據源進行形式化的描述。對于m個用戶的集合可以表示為U={u1,u2,…,um}，n個資源的集合可表示為R={r1,r2,…,rn}、p個標簽的集合可表示為S={s1,s2,…,sp}。圖1給出了當前已達成共識的對于社會化標注的數據模型。由于用戶在不同時間對資源的標注，體現出了用戶興趣的變化。因此，考慮到時間維度，則社會化標注的數據模型可形式化為F=(U,S,R,T).定義在F上的關系F{u,r,s:uU,rR,sS,tT}為標注關系集合，表示用戶u在t時刻使用標簽s標注資源r。對于好友信息，則可形式化描述為G=(U,U).定義在G上的關系{,:,}1212GuuuUuU為好友關系集合，表示用戶u1和u2是好友關系。由于用戶關注好友的時間的先后并不體現用戶對于好友的關注程度。所以，在此，我們不對用戶關注好友的時間信息進行建模。利用這些數據源，我們通過一系列的挖掘算法，可得出用戶的興趣相似度和用戶的熟悉相似度，并利用這兩個相似度綜合為用戶產生推薦。其中，兩個相似度都可形式化描述為關系圖G(V,E)，其中V為用戶節點構成的集合，即V=U；E為用戶關系構成的邊集合。

1.2基于時間權重的用戶興趣相似度由于用戶對資源的偏好可以通過標簽刻畫，那么用戶ui對資源rj的偏好可以通過用戶ui對標注在資源rj上的標簽集T(ui,rj)的偏好表示。基于此，本節首先構建用戶對資源的偏好矩陣，然后在此基礎上計算基于時間權重的用戶相似度。

1.2.1用戶對資源的興趣剖面一般來說，一個標簽被某一用戶標注的次數越多，越能說明該標簽對于該用戶的重要程度越高。因此定義用戶ui對標簽tk的偏好如下。

1.2.2基于時間權重的用戶興趣相似度計算傳統的協同過濾推薦算法忽略了時間對用戶興趣變化的影響，從而在一定程度上影響預測的準確性。本節利用2.2節得到的用戶-資源矩陣，綜合考慮從用戶標注資源的時間方面計算用戶之間的相似度。其基本思想是，用戶對最近標注的資源應該有較大的興趣權重，而對過去標注的應該有較小的時間權重。因此，定義用戶ui對用戶uj的相似度為：

1.3基于信任關系的用戶熟悉相似度在2.1節構建用戶信任關系圖后，我們首先定義一級好友與二級好友：定義1.(一級好友)用戶信任關系網絡中直接相連的兩個用戶互稱為一級好友。定義2.(二級好友)用戶信任關系網絡中擁有共同的一級好友的用戶互稱為二級好友。那么用戶ui與一級好友uj的熟悉相似度定義為兩個用戶之間邊的權重，即：如圖2所有為用戶信任關系網絡的一個子圖，可以看出用戶A的一級好友為{B,D,E,F,G},二級好友為{C,H,I}。此外，由于用戶A的二級好友C同時與用戶A的一級好友B和D連接，因此用戶A與用戶C的熟悉相似度時需進行兩次計算，首先通過用戶B計算的得到的用戶A與用戶C的相似度為simtrust(A,C)=0.65×0.35=0.2275，而通過用戶D計算得到的用戶A與C的相似度為simtrust(A,C)=0.6×0.8=0.48，取二者較大值作為用戶A與用戶C的相似度，即simtrust(A,C)=0.48。

1.4加權的用戶相似度在得到用戶基于時間權重的興趣相似度和基于信任關系的熟悉相似度后，我們通過設定權重α對兩種相似度進行線性組合，得到最終的用戶相似度公式。

1.5產生推薦在為目標用戶進行預測時，我們仍然考慮時間信息對預測值的影響，因為一般來說，用戶現在的行為應該和用戶最近的行為關系更大。

2實驗和分析

2.1數據集及預處理我們的實驗數據為Last.fm上的數據集。在初始實驗數據中，共計2690個用戶、4460個藝術家、8482個標簽，其中每個用戶至少對20個藝術家進行了標注，每個藝術家至少被20個用戶標注。在實驗中，藝術家被當做資源建模。由于數據集中用戶使用標簽標注藝術家都有時間戳標識，因此我們將數據集中每個用戶的記錄按時間由高到低排序，取前20%的記錄作為測試數據，后80%的記錄作為訓練數據。本文實驗的對比算法有：(1)傳統的基于用戶的協同過濾推薦算法(rCF)；(2)基于標簽的協同過濾推薦算法(Tag-basedCF)，該算法與本文算法的唯一不同之處在于不考慮用戶的信任關系，即在計算用戶相似度時，α=1的情況;(3)文獻[18]基于信任網絡的推薦算法ITRAS。試驗度量方法本文使用平均絕對誤差MAE作為評判度量，用來評估推薦算法預測的資源評分與用戶實際對資源的評分的偏差程度。其計算公式如下：Rec(u,i)為推薦系統為用戶u預測的資源i的偏好值。ru,i為用戶u對資源i的實際偏好值，這里我們將ru,i取為1。testsetu為測試集中為用戶u預測的資源數。MAE越低，表示推薦系統的預測精度越高。覆蓋率(Coverage)可以描述一個推薦系統對物品長尾的發掘能力。本文使用指標基尼系數(GiniIndex)統計資源在推薦列表中出現次數的分布來描述推薦算法挖掘長尾的能力。如果這個分布比較平，那么說明推薦系統的覆蓋率較高，而如果這個分布較陡峭，說明推薦系統的覆蓋率較低。公式如下。由于用戶的興趣是廣泛的，推薦列表需要能夠覆蓋用戶不同的興趣領域，因此我們使用多樣性指標(Diversity)描述推薦列表中資源的多樣性。其中，s(i,j)表示資源i與資源j的相似度，R(u)為用戶u的推薦列表，Diversity的值越高，說明推薦的資源具有更高的多樣性。

2.2實驗結果和分析

2.2.1時間衰減因子λ對MAE的影響λ作為時間衰減因子在公式(5)中起著非常重要的地位，如果λ取值不當，會造成時間權重ftime出現過大或者過小的值，影響推薦的精度。如圖3所示為不同取值的λ計算得到的MAE值，可以看出，λ在取值較小時，MAE下降速度很快，但當λ取值較大后，MAE呈現緩慢增長的趨勢，因此λ取較小值可以使推薦精度更高，在本文中λ=0.3時MAE取到最優值。

2.2.2α對MAE的影響由公式(9)可知，α=1為只結合時間得到的用戶相似度；而α=0為只結合社交信任關系得到的用戶相似度，而0,1則綜合考慮了結合時間和信任關系信息加權得到的用戶相似度，以α為變量，計算出相應的MAE值，實驗結果如圖4所示。從圖中可以看出，當α=0.6時，推薦效果最佳，MAE值最小，也說明綜合時間權重與信任關系的推薦效果比只考慮時間權重和信任關系的推薦效果都要好。

2.2.3β對MAE的影響圖5顯示的是在為目標用戶進行預測時，時間衰減因子β對MAE的影響，可以看出，β=0時為不考慮時間對預測結果的影響的情況，此時MAE取值較大；β=0.2時，MAE達到最小。

2.2.4幾種算法的推薦效果本文以鄰居個數為變量，幾種算法的推薦效果如圖6所示，圖6(a)為四種推薦算法的MAE值對比，可以看出，在鄰居取值較小時，ITRAS算法具有最好的推薦效果，其MAE值為0.652；但隨著鄰居個數的增加，ITRAS算法的推薦效果越來越差，而其它三種推薦算法的MAE值均呈現先下降后上升的趨勢，其中本文算法TTCF在鄰居個數大于30后與其它算法相比，推薦效果一直處于較高的優勢，且在鄰居個數為60時MAE值達到最優，為0.635。圖6(b)所示為四種推薦算法在覆蓋率指標上的對比，而覆蓋率反應的是推薦算法挖掘長尾的能力。可以看出，幾種推薦算法隨著鄰居個數的增加，其覆蓋率都呈現上升的趨勢，其中傳統協同過濾推薦算法CF的覆蓋率變化較大，而其它三種推薦算法變化較均勻，本文算法TTCF一直處于較高的覆蓋率，也說明本文算法具有較強的挖掘長尾的能力。圖6(c)所示為四種推薦算法在多樣性指標上的對比，可以看出，隨著鄰居個數增加，傳統協同過濾推薦算法CF變化較為明顯，成逐漸上升的趨勢，而其它三種推薦算法基本趨于穩定狀態，只在很小的范圍內變化，且可以看出，本文推薦算法具有較高的多樣性。

3結束語

時間作為一種動態信息，可以體現用戶的興趣變化；而社交行為可以反映用戶之間的信任和興趣信息，本文將二者結合起來，并融入到基于標簽的推薦算法中，提出一種結合時間和信任關系的協同過濾推薦算法。考慮利用標簽的流行度刻畫用戶對資源的偏好，在計算用戶相似度時，同時考慮用戶行為的時間因素與好友信任關系信息，且在信任關系中，同時考慮一級好友與二級好友，最后結合用戶相似度與時間衰減項實現推薦，并通過實驗驗證了本文算法的有效性，可以較好的提高推薦精度。

作者：趙海燕侯景德陳慶奎單位：上海理工大學光電信息與計算機工程學院上海現代光學系統重點實驗室

結合時間權重與信任關系的協同范文

擴展閱讀

推薦期刊

現代中西醫結合

中西醫結合研究

中西醫結合

深圳中西醫結合