中小企業是我國最具創新活力的群體,貢獻全國50%的稅收,60%的國內生產總值,70%的發明專利,80%的城鎮就業崗位,占企業總數的99%,在促進經濟增長等方面具有不可替代的地位。然而盡管我國歷年來針對中小企業融資推出多種專項政策與措施,由于財務與稅務不規范等原因,中小企業融資難融資貴的問題痼疾難愈。
現金流數據:被忽視的中小企業風控抓手
如果說財務報表是企業記錄經濟活動的方式,那么銀行流水就是銀行為企業記錄交易的語言。
作為不需財務人員“處理”的外部憑證,銀行流水數據更具有真實性,交易產生便會生成不可逆的記錄,還會記錄交易時間,對手方名稱及賬號,交易金額及余額等信息,具有極高的信息含量和全面性。
此外,對比以月為單位,需要財務人員人工出具的財務報表,銀行流水可以及時通過網銀下載,具有更強的實時性和便捷性,便于掌握企業最新情況。可以說,銀行流水是了解企業真實經營情況的最好抓手和“數據金礦”。
處理分析銀行流水的幾大難點
如此高效的銀行流水數據,在以往的風控審核過程中卻沒有發揮出其應有的價值。因為銀行流水的處理分析有以下幾大難點:
1、多銀行數據格式不統一
我國共有 4000多家銀行,每家的數據格式都不統一。靠人工方式手動匯總,不僅耗費大量時間,更重要的是容易產生數據貼錯,貼重,貼漏等錯誤,導致流水數據本身的質量降低。
2、數據真實性與完整性
客戶經理很難判斷其他銀行數據的真實性與完整性。據融資租賃行業數據,10-15%的公司存在刪改銀行流水的情況,還有更多的企業存在交易賬戶未提交和賬戶數據不全的情況。
3、關聯方與可疑交易鑒別
關聯交易層出不窮,更有大量隱藏起來的可疑交易需要鑒別發現,過去人工方式只能挑選出大額交易,或采取“抽憑”的方式分析,關鍵交易有所遺漏在所難免。
4、數據量大難分析
如果忙季短時間內有多個項目,或碰到了交易頻繁,賬戶量大的公司,大量的流水數據的全面處理分析難以在有限時間內完成。
系統化分析銀行流水數據
針對以上幾大難點,見知數據作為專注于通過系統化方式匯總處理分析多銀行流水數據的金融科技企業,淺談幾點銀行流水分析的框架及方法論:
1、多銀行流水數據匯總
銀行流水作為一種半結構化數據,未經過清洗難以進行分析。因而分析銀行流水的第一步便是要通過系統化方式識別,匯總并結構化數據。這個步驟并沒有太多的捷徑可走,需要日拱一卒,通過對各銀行各時間點對公對私模板的積累及數據結構化梳理,逐漸形成自動化銀行流水處理的流程,實現一鍵輸入各銀行原始流水數據,輸出標準化結構化數據的效果。
部分銀行存在比如利息發放交易的交易時間上下不連續,或存在沖正等特殊交易標記錯誤的情況。這些情況雖然少見,但都需要在建設系統的時候進行對該模板的調整適配。
2、鑒別數據真假完整性
通過對銀行流水模板的積累與字段機構化的工作經營,首先可以通過模板判斷輸入數據是否存在關鍵信息缺失,及其是否屬于目標銀行模板。
中國銀行對公字段;各銀行字段均不相同
此后可以通過流水數據的交易后余額連續性,利息校驗檢查等方式判斷該流水數據是否存在邏輯問題,更可以通過流水字段內的信息抓取缺失同名賬戶及賬號等信息做統計展示。
如果數據本身存在缺失或遺漏,后續的分析也就失去了基礎。最常見到的缺失情況是缺失賬戶(有賬戶未提交)和賬戶數據缺失(未提交足夠數據,連續數據中存在缺失)。缺失的賬戶可以通過交易中的對手方名稱與賬號信息進行發現,還可以進一步統計缺失賬戶相關的交易流水金額與筆數,通過缺失賬戶的重要性指導進一步征提。賬戶內數據缺失可以通過連續的余額信息進行判斷。
部分缺失和錯誤的原因是由于獲取或分析數據的業務和分析人員手動貼表造成的。據融資租賃行業數據,約15-20%的項目存在至少一處手動造成的錯誤。
更進一步,可以運用統計分析的方式,通過對交易各字段屬性的分析輔助判斷該流水是否存在疑點,值得進一步關注。
流水數據下載時可選擇不導出關鍵交易內容,比如摘要,交易類型和對手方名稱,導致分析時因缺失核心信息而無法判斷資金去向或交易經營實質。通過系統方式,可以在數據識別清洗后統計各字段缺失程度,并與過去統計結果比對并提示用戶。此外,一些人工“刷單”造出的流水交易雖然本身的確是真實發生的,但在交易的分布上會與同類流水分布存在差異,或者在一些統計分析指標上存在異常(比如Benford系數),這些指標可以提示用戶該賬戶交易分布異常,需要進一步關注。
3、多維度發現關聯方與可疑交易
流水交易必然包含本方與對手方的完整名稱信息,因而可以通過接入工商數據的方式進行關聯方的自動發現,并結合流水展示關聯方的交易情況。
通過系統化方式接入工商數據,查詢每條流水交易的本方與對手方進行比對,可以發現關聯方并打標簽,統計關聯方的交易情況。比如法人,股東,董監高和兄弟公司的資金往來,都可以結合關聯情況統一展示,替代手工查詢工商信息的步驟。
針對可疑交易,不同機構的關注點,尺度與指標各不相同,可以通過比如大額個人交易發現,收支重合判斷,關鍵字段信息創建符合機構風控規則,并通過實際項目分析結果進一步調優及對規則進行增補調整。
可疑交易根據不同機構的尺度和關注點各不相同,需要根據實際情況進行定義和動態調整。比如2020年著名的連鎖咖啡數據造假案就爆出存在通過多家注冊不久便發生大額交易的企業客戶刷單的情況。這些企業的股東雖然與公司并無關聯,但可以通過注冊時間與交易時間,頻率及金額結合進行快速篩選,發現值得關注的交易和客戶/供應商。
4、全面分析資金波動,收支結構與上下游交易
在導入了流水,確認了真假,判斷了關聯交易之后,信貸機構最需要快速了解清楚的就是目標企業究竟“有多少錢,掙多少花多少,從哪里掙錢花去哪里”。而這些可以通過對匯總后余額波動的分析,收支盈虧的金額與結構,以及上下游客戶供應商的交易情況的方式展示出來。
企業有多少錢和資金余額的變化是重要的關注點。通過匯總各賬戶流水余額,可以自動統計出期末與日均余額并按時間進行可視化呈現。另外,除了現金外,還可以納入類現金部分比如保證金,貸款與理財等金額,展示企業相對完整的資金情況與變化。
5、文本語義理解與智能標簽分類
在積累了大量銀行流水交易數據之后,可以更進一步,通過分詞和語義理解及機器學習的方式根據流水字段對每條流水進行打標簽做分類,可以據此實現剔除非經營性交易,快速生成針對特定行業的分析指標,抓取關鍵交易的效果。
比如制造業的幾個關鍵的分析指標包含水電能源,人力成本和稅費繳納等,均與業務開展情況相關(開工就會有人力和水電等支出);而醫藥連鎖行業的醫保類回款,也應該與其總經營收入規模相匹配。這些指標都可以從另一個維度判斷企業的實際經營情況。
財務數據分析師CFDA(China Financial Data Analyst)
由中國商業會計學會頒發,通過全國統一考試的學員將同時獲得商業數據分析證書,該證書是由國家人力資源和社會保障部監制,省級職業技能鑒定指導中心簽章頒發《人力資源和社會保障部專項職業能力證書》。
通過CFDA課程的學習,企事業單位的財務人員和管理人員能夠通過科學的指標體系和分析方法,結合企業財務數據,構建數據模型,對公司整體經營狀況進行評估,向管理層和業務部門提供財務建議和決策支持,從而優化資源配置和提升企業核心競爭力。