美章網 資料文庫 數據集市推進銀行業務數據分析范文

數據集市推進銀行業務數據分析范文

本站小編為你精心準備了數據集市推進銀行業務數據分析參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。

數據集市推進銀行業務數據分析

摘要:闡述了郵儲銀行業務部門數據分析工作的現狀,分析了業務部門數據分析存在困難的原因,提出了業務部門加快數據分析工作的建議。

關鍵詞:數據集市;監管報送;內部決策;客戶營銷

數據分析難、分析慢、分析不準確是中國郵政儲蓄銀行(以下簡稱“郵儲銀行”)各級業務部門數據分析工作面臨的三大問題。而在《中華人民共和國網絡安全法》《中華人民共和國電子商務法》付諸實施、“業務協同、客戶共享”等郵銀協同發展的背景下,如何滿足監管要求、保障消費者權益,并平衡好大數據精準營銷、敏捷型業務合作伙伴關系的建設,是銀行、速遞、保險等集團各下屬單位面臨的共同問題。本文從數據分析的應用場景出發,嘗試分析、解答郵儲銀行業務部門數據分析工作合規拓展、郵銀協同的可能框架,為建立郵儲銀行敏捷型數據分析工作機制、郵銀互通的數據分析路徑提供可行性方案。

1郵儲銀行業務部門數據分析的開展情況

數據分析是指從既有的數據信息中提煉出有價值的數據結果。基于郵儲銀行總行某業務部門2016年1月至2018年6月末的數據分析,整理得到了該條線數據分析工作的主要應用場景,見表1。從統計結果看,該業務部門數據分析需求共計75份,其中監管報送類數據分析4份、內部決策類19份、客戶營銷類37份,不便分類的需求有15份,業務部門客戶營銷類數據分析需求呈絕對優勢,符合業務部門的職能定位。從數據分析的時長看:監管報送類數據分析需求以監管截止日期為準,一般每例數據分析的準備時間不超過1周;內部決策類數據分析需求,基本在部門領導提出后48小時內提交,如果數據結果可用,需求會固化成按月提取的報表繼續推進;客戶營銷類數據分析需求,在沒有數據集市或大數據平臺數據實驗室的情況下,從業務部門提出需求到獲取數據結果,單例需求的平均完成周期最少是2周。

2業務部門數據分析工作存在困難的原因

2.1監管報送類數據分析困難原因

監管報送類數據分析,一般都是口徑相對固定的長期數據報送需求,重點和難點都在報送口徑的一致性。盡管是長期性報送,但此類數據在缺乏全行型數據集市的情況下,更難保證數據的準確性、時序數據的可比性。數據分析難、慢和不準確的原因大致包括兩個方面。一是報送數據往往因前臺業務系統的變動而調整。在完整的“數據倉庫-數據集市-監管報送系統”體系下,業務源系統在新增、變更或者關閉相關產品或服務后,后線系統通過數據抽取、清洗和加載等數據生產的完整過程,能夠記錄、傳遞業務變更對應的數據調整內容。但是由于缺乏數據集市這一中間環節,后臺報送部門無法知悉以上產品或服務的變動事實,同時中臺數據提取部門也無法掌握數據調整的具體邏輯,這樣就不得不“按件”重復數據抽取、清洗和入庫。據此邏輯,在全行性數據集市缺失的情況下,越是交易創建早、業務發展快的部門,報送數據的準確性就越差、可比性就越低。二是發生數據錯誤后補救成本太高。根據經驗,業務調整后兩個季度內的報送數據誤差不大,但在業務系統正式運營半年后,年度同比數據的偏差就會凸顯。而此時,限于向監管重新報送、替換數據的可能性基本不存在,相關部門不得不“調整”數據,再根據業務發展趨勢擇機解決數據報送不準確的問題。然而,在數據集市基礎上建立的監管報送系統,往往能及時捕捉、修正源系統變更造成的指標變動,最終提供準確、可比較的基礎數據指標,滿足監管報送需求。

2.2內部決策型數據分析困難原因

內部決策型數據分析,往往是部門領導關注的方向性、探索性的數據分析需求。特點是需求不明確、數據要求頻次不固定,難點是分析相近部門關聯指標的可比性高低。從業務部門看,數據分析的難、慢和不準確問題主要集中在內部決策型的數據分析需求工作上。一是現有的內部決策型數據分析模式不具備可持續性。一方面,內部決策型數據分析自身要求敏捷開發的分析模式。相較于監管報送、客戶營銷類的數據分析需求可以通過報表系統、系統對接得以固化的特點,部門領導內部決策型數據提取需求不僅單次數據分析耗時較長,還會隨業務發展而長期存在。另一方面,全行業務部門普遍缺乏數據分析專崗,業務部門與軟件研發中心設想的“業務需求—數據提取”前后線合作模式并不流暢。在行方技術人員缺乏的情況下,前后線兩方合作往往演變成“行方業務人員—業務系統廠商—軟件研發行方技術人員—軟件研發中心外包技術人員”的四方邀約會談機制。其中,業務系統廠商、軟件研發中心外包技術人員更換頻繁,降低了四方會談的穩定性。總體來看,業務部門必須自設數據分析專員,掌握系統間的數據映射關系,支撐部門內部決策數據分析工作。二是數據集市的缺失延長了數據分析時長,降低了數據準確性和可比性。一方面,郵儲銀行目前各業務部門普遍缺乏一個數據加工分析的中間層——數據集市,在源系統更新后的大數據平臺及后線系統缺乏實時動態更新的連鎖機制。在缺乏中間層的情況下,一次生產系統升級等同于一次數據“傷害”。而在數據管理部門缺位的情況下,要想實現源系統變更后的大數據平臺和后線系統的數據同步,基本不具備可行性。另一方面,從數據分析人員的操作來看,在缺乏數據集市作為數據調整中間層的情況下,為了盡可能保證數據的準確性,每一次數據分析都被迫拉長為“數據采集—數據清洗—數據分析—數據監測”的全業務流程。盡管完整的數據分析工作在數據集市完備時同樣如上執行,但是不存在跨業務部門數據集市的情況,每一次數據分析意味著和關聯系統的運維或廠商重復一遍,浪費了前后線系統過多的精力和時間。最后,考慮到銀行類金融機構科技轉型的大背景,業務發展轉型階段的更新上線頻次將不斷增多,在缺乏數據集市的情況下,歷史數據的絕對可比較基本不存在。這在一定程度上挫傷了部門領導對內部決策型數據分析的信心,增加了數據核校的工作量。

2.3客戶營銷類數據分析困難原因

客戶營銷類數據分析,多服務于條線業務拓展、客戶關系維系,特點是周期性強,難點是數據實時性高,底線是不引起投訴。當前郵儲銀行此類數據分析困難的原因主要包括以下兩個方面。一是交易信息的不記錄導致客戶行為分析困難。相較于邏輯集中等核心系統對客戶動賬類交易信息的記錄,手機銀行、個人網銀等電子渠道對賬務類交易的記錄是不完整的,而嵌入在以上電子渠道的業務源系統,往往對非動賬類交易數據的記錄缺失,線上營銷客戶的行為分析只能從各個源系統追蹤客戶交易渠道的偏好、產品持有結果的時序變化,然后歸納出客戶持有產品的行為偏好,而無法探究客戶交易結果的產生邏輯。而后者,才是營銷活動場景建設的源泉。此外,一旦嵌入在電子渠道的源系統不記錄交易發生時的所屬渠道,客戶的線上交易行為就會漏記,客戶交易偏好的度量就有偏差,最終在線上資源的配置上就會遺漏目標客群數量,增加客戶流失的可能性。二是缺乏綜合性客戶營銷類數據集市,導致精準營銷數據不準確。目前,郵儲銀行線下網點普遍配備了綜合客戶各渠道聯系方式的個人營銷系統,基本保證了客戶聯系方式的準確性。而線上渠道尚未投產以客戶為中心的全行性綜合營銷數據集市,相關業務部門如果不能通過全渠道整合營銷數據,往往只能提取到客戶首次和郵儲銀行某個部門建立合作關系時的預留信息,一旦客戶變更了聯系方式,客戶失聯的可能性較大。而在手機號碼自然流轉的背景下,一次“脫靶”的營銷往往會帶來一筆投訴。這在《中華人民共和國網絡安全法》執行的背景下,又可能會引發公司治理有效性的監管處罰。

3業務部門加快數據分析建議

3.1建立事業部型的數據集市

建成大數據平臺后,為何還要建設數據集市,數據集市的建設是否為重復性建設,數據倉庫、數據集市的邏輯關系有助于解答這兩個問題。數據倉庫和數據集市都普遍采用ETL技術,并且綜合考慮了數據來源、交易時間和存儲性能的數據集合。二者最大的不同在于建設目的的差異,數據集市是以迅速響應業務需求為目的,而數據倉庫的目的是盡可能完整、正確地存儲業務數據。具體到郵儲銀行,從系統架構看,數據集市是連接生產源系統和業務系統的中間層系統,數據倉庫是接收生產源系統的終端系統。從支撐業務發展看,數據集市可以直連監管報送、統計報表和業務營銷系統,為業務發展提供準確、實時的清洗后數據,而數據倉庫則可以直連內容管理平臺、運維系統,為還原客戶交易場景、解答客戶查詢需求提供在線支持。從部門職責看,數據集市的管理單位是軟件研發中心,而數據倉庫的管理單位則是數據中心。未來數據集市的建設建議考慮跨部門的事業部型數據集市,即包含業務源系統、間接系統(大數據平臺)的復雜來源型數據集市。只有更多業務系統的高頻數據實時同步,事業部型數據集市才能獲取最新、更高頻的客戶聯系方式和交易偏好,才能有利于精準營銷數據的產生,服務于以客戶為中心的零售銀行建設。

3.2在業務部門設立數據分析專崗

根據數據分析需求分類,監管報送類以最近一次報送口徑為準,客戶營銷類以目標客戶的即時聯絡為主,這兩項數據分析需求需要固化成報表系統或實時調用的系統間接口文檔。從數據分析的供給側看,提高數據分析人員穩定性和業務經驗,是解決此類數據分析需求的重要抓手。在總行層面設置具有績效考核標準的數據治理管理一級部,加強數據分析、數據治理工作的管理;增加各級機構技術人員的職務層級,降低數據分析人員的流失率;在各級機構各業務部門增設數據分析專崗,提高數據分析專崗人員的絕對數和相對比例;在現有軟件研發中心業務對接處室實行“業務—科技部門”人員雙向流動機制或業務條線特派員機制,盤活存量數據分析人力資本,提高業務科技雙方的數據分析能力。

3.3保證業務部門數據分析人員的數據可達性

只有觸達數據、了解數據和使用數據,才能掌握數據、運用數據和管理數據。目前,軟件研發中心在總行、部分分行試點了大數據平臺數據實驗室,盡管存在相關系統的數據沒有接入、部分數據分析軟件配置尚不到位等問題,但在數據可達性方面,大數據平臺數據實驗室減少了近八成的數據導入工作量,為各級機構業務部門數據分析的開展提供了入口,為數據分析工作提供了便利。建議總行、一級分行相關業務部門盡快申請數據分析權限,從統計報表、績效考核等部門核心指標的計算開始,掌握數據分析的基礎知識。

3.4構建數據全生命周期的管理模式

如果各級機構業務部門數據分析專員熟悉數據、開展數據分析,是自上而下拆解任務指標,那么,通過系統對接下發營銷數據、跟蹤數據營銷結果,則是打造數據分析閉環、支撐分行發展的又一項重要內容。具體到總行、一級分行的業務部門,可以項目建設為驅動,搭建“大數據平臺數據實驗室—大數據平臺—數據集市—業務系統—大數據平臺”的數據采集、數據模型訓練、模型布設、數據整合、數據/標簽輸出、營銷結果回傳的“前店后場+營銷全流程”合作模式,即數據實驗室抽取關聯系統基礎數據、訓練基礎模型,在大數據平臺布設成熟模型,通過接口文件輸出給相關數據集市或直連業務系統,最后從業務系統同步營銷結果至大數據平臺,進而更新數據實驗室的樣本集,為下一輪數據營銷、數據治理提供基礎數據。

3.5數據脫敏、隨機抽樣保證內部決策型數據分析的安全

轉化成數據分析的要點就是,盡可能減少可追蹤的個人真實數據的暴露。盡管內外部數據分析人員簽署保密協議、盡職承諾,但是數據分析人員使用原始生產數據分析數據,難免有數據泄漏、丟失的可能,加上金融科技的發展,行內業務人員掌握數據分析、業務經驗之后,內外勾結等合規風險就會增加。打破惡性循環的一個切入點就是建立大數據平臺數據脫敏入庫+隨機抽樣代表性樣本庫。具體而言,一是監管報送、客戶營銷類數據分析需求和內部決策型數據分析分割,內部決策型數據分析使用的基礎數據是脫敏后的源系統數據,避免數據分析人員在數據分析過程中從事非法獲利行為,監管報送、客戶營銷類數據分析直接使用未脫敏的源表數據。二是內部決策類數據分析不能使用全庫數據,只能使用隨機抽取的代表性樣本數據。在提供全樣本的情況下,數據分析人員仍可通過異常值檢驗等數據分析手段反向推定或獲取脫敏前的數據樣本真實信息。而隨機抽樣可以保證對整體數據(客群)的代表性,并且避免了脫敏失效的隱患。

3.6總分行共用數據實驗室,加強數據共享工作

數據分析不能缺少總行的戰略引導,但也不能忽略區域性客戶的結構性差異。在有限人力的基礎上,數據分析工作大致可以分為總行、一級分行、二級分行及以下三個層級。其中,數據分析的智力供給重點是總行和一級分行兩級機構,二級分行及以下機構則以數據采集、數據反饋和客戶聯系為主。根據線上客戶交易習慣,總分行機構數據分析工作的開展應以全渠道交易行為分析為主,二者職責邊界只是客戶歸屬的區域差別,在數據使用、模型優化方面應共用共享。

參考文獻

1葉劍陶.農村商業銀行績效數據集市的構建及挖掘應用.華南理工大學,2017

2曹培,馬瑞全.“數據集市”助郵政大數據應用能力升級.中國郵政,2017,8

作者:劉萬里 單位:中國郵政儲蓄銀行

主站蜘蛛池模板: 香蕉视频免费在线| 三级中文有码中文字幕| 欧美极品少妇无套实战| 免费能直接在线观看黄的视频免费欧洲毛片**老妇女 | 四虎影院永久网址| 亚洲尹人九九大色香蕉网站| 紧窄极品名器美妇灌| 国产女主播喷水视频在线观看| 91精品免费久久久久久久久| 好爽好紧好大的免费视频国产| 久久久久亚洲精品无码网址| 机机对机机的30分钟免费软件| 亚洲欧美国产五月天综合| 第一福利官方航导航| 国产一卡二卡二卡三卡乱码| 99re最新这里只有精品| 国产精品亲子乱子伦xxxx裸| 99久久精品这里只有精品| 巴西大白屁股bbbbxxxx| 丰满少妇弄高潮了www| 日韩精品有码在线三上悠亚| 亚洲国产精品久久久久秋霞小| 热99精品视频| 免费久久一级欧美特大黄| 美女被狂揉下部羞羞动漫| 国产传媒在线观看视频免费观看 | 成年美女黄网站色大片免费看 | 精品国产第一国产综合精品| 国产av午夜精品一区二区入口 | 肉色无边(高h)| 国产午夜无码精品免费看动漫| 欧美色图在线播放| 国产精品无码aⅴ嫩草| 中文国产日韩欧美视频| 日本娇小videos精品| 久草福利资源站| 欧美乱人伦人妻中文字幕| 亚洲欧美国产精品久久久| 用我的手指搅乱我吧第五集| 国产99er66在线视频| 青青青免费网站在线观看|