時間:2020-02-25
03
應用智能算法,向數據驅動轉型
是否可疑,以及是哪種涉罪類型的可疑,是一個典型的分類問題。智能算法,是指應用機器學習等技術,以已知歷史數據為樣本或不依賴歷史標簽,通過構建特征工程,模型(算法)訓練,以不同于規則體系的監測方法,達到識別可疑交易的目的,具體又可分為多種場景。其過程是基于訓練數據集,根據學習策略,從假設空間中選擇最優模型,然后考慮用什么樣的計算方法求解最優模型。以數據為驅動建立的監測模型,會更適合金融機構自身特點,彌補原有規則驅動體系的部分缺欠。
在遵循機器學習一般理論的基礎上,還應當充分理解反洗錢本身的特點和場景需求。在不同細分場景下,具體的思路,應用的方法和過程也有所不同,需加以靈活運用。例如在確保對已知風險盡量召回,同時提高監測準確率的場景下,對訓練樣本充足的,通過有監督學習,尋找最優(組合)模型;而試圖發現新的可疑場景時,則可通過各類統計分析、無監督聚類算法,側重于數據的分類、分組、分層,以識別異常。
通過工程實踐我們還關注到,在數據準備,構建特征工程中,須充分認知和發揮已有規則特征的價值;模型訓練時,相對于單一模型(算法),多種策略的多模型(算法)的融合效果更佳,更高的準確率,更強的穩定性。
04
利用圖計算,加強團伙風險的識別
當前已知的洗錢涉罪類型中,如電信詐騙、地下錢莊等,往往存在多個賬戶協同操作的情況。依托知識圖譜的相關知識,基于圖數據庫技術,應用圖計算的方法,其目的一是構建有關聯的群組(團伙),二是通過對關聯關系的分析,識別群組涉嫌洗錢的風險。
群組構建的基礎是各類實體-關系數據,實踐中客戶之間的聯系存在多樣性,比如交易關系,相同的聯系方式、企業法人和企業的關系等等。哪些是有效的關系,哪些是需要剔除的噪聲,尤其是紛繁復雜的交易關系中,需要大量的業務和數據分析工作來厘清。
形成群組網絡后,開展社交網絡分析,例如通過PageRank分析重要的個體節點,通過介數中心度識別關鍵中介節點,通過入度、出度判斷節點的交易活躍度,通過子圖挖掘分析重點子網絡等。同時,應當綜合運用圖譜計算與機器學習,相輔相成地開展大數據分析,針對群組,進行算法訓練和分析。最終通過對點、邊、子圖的信息度量,發現業務上的規律和異常。
05
利分析之器,善甄別之事
可疑交易甄別模塊的定位是,對系統篩選出的可疑線索予以呈現,對人工甄別提供輔助和支持。一個完善的甄別模塊,應當以“三個有效”為目標,即甄別工作量的有效降低,甄別效率的有效提升,甄別質量的有效保障,一降低,一提升,一保障。包括流程、機制、工具、視角、數據等多個方面。甄別工具作為其中的核心,應支持對客戶的甄別,交易的分析。
對主體客群的甄別,應構建反洗錢視角的客戶畫像,全面展現客戶的基本信息、賬戶信息、交易信息、盡職調查信息、評級信息,以及深度的衍生信息,如主要關聯關系,交易習慣和特征,交易時段分布,交易渠道偏好,資金規模區間,交易對手分布等等。而對于包含多個客戶的線索,從“風險為本”的角度,應提示重點關注客戶。
對交易的甄別,應對常用分析手段進行功能化設定。例如日期、時段、交易渠道,結算方式等多個維度的資金的流入、流出金額和筆數的事情情況;IP地址、交易設備信息、地域等關鍵要素的特點分析;交易對手的排名、地域分布;交易摘要、資金用途等文本信息的統計、歸納等。除了固化的功能,還可提供甄別人員自主的分析能力,既對上述多個維度的組合分析,例如不同交易渠道,在時間維上的交易分布情況。
而分析的結果,以多樣的可視化手段進行展現,如可地圖、柱狀圖、折線圖、餅狀圖、雷達圖、散點圖、詞云圖等,以高效反映信息的不同要點和價值。
06
自動化分析,智能研判輔助人工甄別
通過系統標準篩選出的可疑案例,人工甄別后,有的認定為可疑,有的被排除,因為不同案例在監測標準中未涉及的要素、定性的信息、背景信息等存在差異,例如客戶身份信息的完整性不同、職業不同、長期的交易頻率和習慣不同、交易的目的不同、歷史可疑交易報告的情況不同、交易對手的特征不同等。
因此智能輔助分析,從人工甄別的經驗和方法著手學習,并在此基礎上從更廣的數據范圍、更長的時間周期開展大數據分析,提高甄別的深度。
實體風險,客戶固有的風險,如受益所有人是否識別、行業風險性、洗錢風險等級等
關聯性風險,與之關聯的自然人、非自然人客戶是否有高風險,是否存在可疑,經常性交易對手的風險程度如何;
歷史模式,客戶之前是否發生過可疑,可疑線索被認定的記錄,觸發的規則/模型的準確率,當前案例與歷史認定可疑報告的相似性;
行為風險,除了定量的交易頻率、金額、結構性異常外,盡職調查中發現的異常行為。
經過多方面的綜合診斷,系統對產生的可疑線索的風險程度,通過上述量化標準予以區分?;谠u分,對可疑線索的風險程度進行排序,從而對甄別工作安排予以提示,分配不同的資源、精力,體現“風險為本”;或者對風險程度極低的,做自動排查(在容忍一定風險的前提下)。
07
再評估,對風險查遺補漏
再評估是對人工甄別后排除的可疑交易進行重新評估,評估其中是否存在可能應當報告的情況。其目的是發現由于人工經驗、認知的差異,產生的誤判導致的漏報。對于管理的意義,則在于輔助建立一套后督機制,在強化工作質量管理的同時,對可疑交易報告的生命周期管理更為完整。
其主要思路是基于機器學習方法,以歷史報送數據為樣本進行訓練學習,歸納總結特征,將排除的與之進行對比分析,對特征高度相似、相近的標記為需要重新進行人工甄別。
PART
5
總結
本文論述的方向和思路,有的是在現有體系之上,通過更精細化的管理,對某些環節的改進、補充,完善,有的則是嘗試新技術、新方法,貫穿可疑交易監測的“事前”設計,“事中”執行,“事后”檢驗的全生命周期。
??[事前]?可疑監測標準的優化、區域化監測標準設定,是對現有監測標準的進一步完善,是管理進一步精細化的;
??[事中]智能算法/圖計算,是通過引入新技術、新方法,提升監測能力和監測效果,但于現有的監測標準,并不矛盾和沖突;
??[事中]智能分析、風險評分,是對系統現有產生的可疑線索,進行風險高低的劃分,對人工甄別予以引導;
??[事中]甄別工具則是作用于人工甄別階段,提供高效的輔助支持;
??[事后]再評估,則是以后督的角度,再一次識別風險,降低遺漏的概率。
其中的每個點,都是一項獨立的專業性工作,需要仔細、深入的研判,而機構在實施中,可根據自身面臨的主要問題、風險狀況、風險偏好,有策略、有選擇地逐步實施。
?
當然,本文所論的技術和方法,都是對數據處理的手段,其背后的要義還是對數據處理的思路,即要分析什么,怎么分析,要達到什么目標,而運用什么樣的技術,是工具選擇和工具運用的問題,因此關鍵還是人的因素,對可疑交易監測報告工作的理解和認識。
?
提升可疑交易報告有效性,是當前反洗錢工作形勢,和機構洗錢風險防范的必然要求。本文旨在通過對相關問題的思考,結合實際工作實踐,提出若干建議,不盡全面,筆者和團隊也在持續研討,如有不當之處,還請多加指正。