數據孤島 不利豐富度
國內不少金融業者大約從四、五年前開始導入分析式AI,面對新一波生成式AI大浪,他們是期待又怕受傷害。
六年多前的中信銀,AI團隊由原本負責風控的數據暨科技研發長王俊權一人成軍,如今人數已達三位數,幾乎等同一家中型科技公司規模。雖然金融機構掌控客戶金流,可從客戶資金流向,判斷出客戶有沒有小孩,有沒有養寵物,喜歡買什麼消費品,投資偏好跟旅遊習性是什麼,但實際上,金融機構跟客戶,還是不夠熟。
「我們大致算過,消費者一天內與金融業的往來不會超過15分鐘。」王俊權表示,這意味一天當中的其他時間,客戶都在與其他社群平台、電商平台等產生連結,這些平台將資訊合縱連橫,要精準掌握客戶需求,不是難事。
由於金融業屬於高數據壁壘行業,儘管掌有客戶敏感個資,卻不能隨意分析、應用,形成業者痛點。
一位金控主管也說,現階段金融機構有如各自坐擁一座座資料孤島,「我們出不去,別人也進不來」,但相較其他產業如電商業者,金融業在資料的豐富度上,就會落後。
由此點出,金融資料在重重防護下,雖確保了安全性滴水不漏,但是整體產業的長期競爭力也有隱憂,形同雙面刃。
為改善此情況,金管會2021年公布了「金融機構間資料共享指引」,去年11月調查顯示近100家金融機構已辦理、或正規劃辦理新增資料共享,然而,由於跨機構間有許多責任歸屬要釐清,廣泛落實仍需時間。
玉山金控(2884)科技長張智星也提及,在金融機構廣泛導入AI前,必須要有完善的資訊基礎建設,「資料治理」將是金融業者在面對AI時代,一切的根本。
張智星回憶,玉山銀在1992年成立,當時可謂數位資料的「蠻荒時代」,尚未有電子化的資料庫,當年能以「txt」文字檔來記錄客戶資訊,就已經不錯了。此後,隨文書處理及各種資料庫軟體普及,玉山銀才開始陸續建置數位化資料庫。
他提到,單有資料庫並不夠,在資料運用上,資料品質尤其重要,一方面原因是資料可能有缺漏,二方面是資料可能不夠「乾淨」,摻雜無關資訊,這時就需要人費心「清資料」了。
資料治理要耐得住「繁」與「煩」,舉凡從收集資料的業務單位、儲存資料的數據中台,再到分析單位之間,資料各項欄位格式都須一致。
此外,在橫跨數十年的龐雜資料中,若源頭的數據有變更,所有連動的相關資料也須隨之調整,以便後續可分析建模應用。
張智星表示,跨部門之間的資料使用管理,也是一門學問。以玉山金為例,資料分為「基礎公用」、「協定公用」、「機敏管制」三種類型分級治理。
基礎公用資料,允許所有單位可自由取用;協定公用資料,因涉及法規及合約,如與外部單位簽約購置的資料,欲使用者須徵得資料擁有者同意才得使用;最高級別的機敏管制資料,則與客戶資產及營運機密相關,制定了更嚴格的取用規範。