当前位置:朝夕网 » 生财有道 » 现在很多机构都说是智能风控、大数据风控,能否通俗的解释下?

现在很多机构都说是智能风控、大数据风控,能否通俗的解释下?

近年来,金融机构都很喜欢提智能风控这一概念,但市场上对智能风控并未有准确的定义。智能风控改变了过去以合规、满足监管检查为导向的风险管理模式,强调用金融科技降低风险管理成本、提升客户体验、数据驱动风控能效,实质上代表了一种精益风险管理思维。图

首先我们来讲讲只能风控。

智能风控——金融科技领域最主要的应用场景之一,借助大数据与人工智能技术提升风险管理能力,在银行、证券、保险、互联网金融等领域的应用愈加广泛。

近年来车贷风险管控流程图,金融机构都很喜欢提智能风控这一概念,但市场上对智能风控并未有准确的定义。事实上,在AI潮到来之前,也没有人将风险管理与“智能”联系起来。大数据热逐渐降温后,随着人工智能的兴起,计量金融领域又迎来新一波热点:AI in Financial Risk Management。

我很讨厌“智能”这个流行词,因为其不过是将机器学习进行了有目的的包装,而机器学习也远没有发展到一个可靠的工程原则,很多不确定性、规模化、推理性的问题都没有解决。随着大数据、AI技术运用于风险管理已经越来越不鲜见,金融机构对于智能风控系统的建设需求迫切车贷风险管控流程图,市场成熟度和集中度也逐渐提升。我想聚焦于其内涵、应用模式和应用架构,谈一谈什么是智能风控。

1、智能风控的定义

智能风控有很多种“别名”,我见过的像大数据风控、决策引擎、风险计量引擎、风险模型实验室…其实都可以纳入到这一概念范畴。其基本逻辑都是运用大数据平台的计算分析能力、机器学习或深度学习模型,运用于信贷风控、反欺诈、反洗钱、交易监控、保险理赔等场景。所以,本质上是以数据驱动的风险管控与运营优化。

对于金融机构而言,智能风控并没有改变底层业务逻辑,也和传统金融的风控模式、建模方法和原理没有本质区别。只是由于大数据的引入,能够获取到更多维度的外部数据,像客户行为、电商消费、运营商数据、地理位置、购物习惯等等。与传统金融数据相比(如央行征信、交易流水、资产状况、财务报表等),虽然这些数据与客户违约本质上没有必然关系,但增加了更多风险因子和变量,可以从更多层面刻画客户风险视图,可以提升风险定价、违约计算的效果。

智能风控改变了过去以合规、满足监管检查为导向的风险管理模式,强调用金融科技降低风险管理成本、提升客户体验、数据驱动风控能效,实质上代表了一种精益风险管理思维。如果说巴塞尔新资本协议的全面风险管理(资本计量、监督检查、市场纪律作为三大支柱)是传统风控的体现,那么智能风控则是互联网、大数据时代风险管理实务的变革与创新。

从前些年的大数据风控到如今的智能风控,并没有改变数据+模型+规则的处理逻辑,而是突出了机器学习模型的应用,如线性回归、Logistic回归、支持向量机、神经网络、深度学习、集成学习等。对于金融机构的风险管理人员来说,随着外部数据获取途径的增加,对于过去无法获取有效风险特征的人员或中小企业,风险数据得到了有效的补充,从而能够为更多的场景、人群设计不同的金融产品,从而起到了金融科技赋能普惠金融的作用。

2、智能风控的应用模式

智能风控在金融领域的应用模式应站在不同行业的视角来看。虽然本质上都是数据驱动的风险控制与管理决策,但由于银行、证券、保险的行业属性、业务场景差异较大,智能风控的应用模式也不同。

银行业:信贷、反欺诈、关联分析

虽然没有考证过,但我相信智能风控的称谓最初应来源于银行业在信贷风险管理、交易反欺诈、风险定价和关联关系监控中的大数据应用。像FICO、Experian(益百利)、Equifax(艾可菲)等公司早已通过各类风控模型来实现反欺诈或征信。随着技术手段的丰富,数据获取的逐渐便利,商业银行可以通过外部数据合作的方式获取、存储、加工不同维度的数据。通过大数据基础平台的强大算力,计算用户之间的相关性,例如电话号、邮箱、地址、设备号等。

以消费信贷风控为例,按照贷前、贷中、贷后作为风控的时间维度,以信用品质、偿债能力、押品价值、财务状况、还款条件作为评估维度,时间和评估形成不同的信贷风险关注要点。商业银行结合不同信贷风险的关注要点,进行相关数据的获取。

图:信贷风险管理控制体系

除大数据外,智能风控的“智能”主要体现在机器学习算法构建模型。在授信申请、违约损失计算、逾期预测、反欺诈等业务目标确定后,通过内外部数据的整合、预处理(如采样、PCA、缺失值填充、归一化)、特征统计等方法,再选择合适的算法进行分析。而在基础工具的运用上,由于运用到大数据技术,多离不开Hadoop/Spark这样的基础计算平台,R/Python这些数据分析工具。当前一些专注于机器学习厂商如第四范式、阿里云也研发了可拖拽的建模工具,部分降低了机器学习的学习成本和门槛。

图:智能风控的分析流程

无论是对个人或是企业的银行贷款、抵质押或担保贷款,亦或是供应链贷款、评分卡、巴塞尔协议中的贷款,还是当前热门的智能风控,根本原理都是衡量客户还款能力和意愿。智能风控只是通过更多的数据维度来刻画客户特征,从而更准确的量化客户违约成本,实现对客户的合理授信。可以看出,其原理和方法论和传统金融风控没有区别,但可以通过自动化审批来替代人工审核,降低人力成本。

证券业:异常交易行为、违规账户侦测

与银行业的智能风控专注于信贷风控、反欺诈等不同的是,证券公司、交易所更关注于“实时”、“事中”交易违规行为的侦测。从监管要求方面,沪深交易所近期也发布了《关于加强重点监控账户管理工作的通知》,要求强化交易一线监管、突出事中监管,明确了严重异常交易行为的重点监控账户监控;从技术方面,由于每日盘中连续交易阶段的数据量大、并发性高,对于低延迟实时计算、机器学习和复杂事件处理是证券智能交易风控的设计要点。

异常交易行为特征描述本质上是一个用户画像项目,对高频交易客户进行群体划分,建立用户画像体系,基于客户交易行为中的各种指标提取特征,使用这些特征作为模型的输入,输出为该用户所属的类别。特征指标如交易活跃度(下单次数,下单频率等),每单报价,持有标的、总资产、资金与持仓信息等。在证券业务层面,则需要覆盖经纪业务、自营、资管等业务。

保险业:风险定价、反欺诈与智能理赔

保险风控的主要应用领域在防骗保和反欺诈。近年来险企运用大数据技术的越来越多,基本思路是借助内外部数据在财产险的查勘、定损、核算等环节识别风险特征。以众安保险为例,其对接了央行征信、公安、前海征信、芝麻信用等外部大数据,其中公安数据包含所有已识别到的风险电话数据、短信数据等。此外,智能风控也逐渐加入生物特征识别、人脸与图像识别等AI技术,提高欺诈识别率、降低理赔成本。

3、智能风控的应用架构

前文说到智能风控是数据+模型+规则的应用模式,其实仍是一种决策信息系统,其技术和应用架构离不开数据采集、数据加工处理、数据挖掘与分析、算法模型上线等关键环节。只是相比于传统的管理信息系统,其架构多引入基于分布式架构的计算引擎(处理离线大数据)、实时流计算引擎(处理线上实时数据)、策略模型平台(算法和建模)。

在商业银行中,智能风控组件多集成于电子银行、互联网金融等业务部门的后端平台中,作为线上秒贷平台、反欺诈、反洗钱等系统的独立的规则或决策单元。

图:基于大数据技术的秒贷平台

还有一些商业银行基于大数据构建了新一代风险管理体系,其本质也是依托于大数据平台的计算能力以及大数据金融风险计量模型,为智能化、自动化风控决策提供支持。这类风险管理体系从全行角度接入包括客户信息、对公信贷、个贷、信用卡、外部数据(工商、税务、司法等)。基于大数据平台建设风险数据集市和模型实验室,综合运用了数据仓库、知识图谱、商业智能、数据挖掘与机器学习等多种技术,为多种风险类别提供决策支持,如客户信用风险、抵质押品风险、异常交易风险、操作行为风险、机构行为风险、授信风险等等。另外,也会与行内基于巴塞尔III的全面风险管理系统、经济资本计量系统进行打通,整合全行全面风险管理与控制体系。

图:基于大数据的全行综合风险管理体系

对于银行的大数据风险计量引擎,包括不限于小微企业贷款、对公客户评级与债项评级、个贷申请评分、对公风险指标计算、信用卡申请与分期评分、零售LGD与RAROC等风险指标计算,实现对零售、对公业务风险管理的全面覆盖。而人工智能技术的应用,则仍体现在机器学习、神经网络与深度学习模型在客户行为分析、反欺诈等应用领域。

除商业银行外,证券公司、交易所、保险公司的智能风控系统架构,也多数都是依赖于分布式大数据计算引擎+实时流计算引擎,将其作为独立的系统组件、或模块整合于风险预警单元、商业智能系统之中。

图:基于大数据的风险模型实验室

4、智能风控的问题

我过去曾写过一篇文章《大数据时代的金融风险管理》,谈到的主要是数据挖掘、机器学习等技术在传统金融风险管理中的应用方法。例如,以新资本协议为核心,以风险治理、风险限额、监控指标和内控体系为要素的传统金融风险管理,已经具备了基于模型的定量风险分析(如风险价值度VaR、债券久期与凸性分析、希腊字母分析、信用风险LGD与RAROC等),以及基于传统集中式架构的管理信息系统的支撑。

对于当下热闹的智能风控市场,我认为其问题可以归纳为三点:

第一,市场上很多所谓的智能风控系统仍谈不上什么“智能”。大部分仍是基于规则组合、条件筛选来实现风险预警、半自动化的方式来辅助人来判断。一些系统其实是做了一个客户画像和标签体系,另有一些甚至把风险指标和报表系统也包装成为智能风控平台。行业没有标准,不乏有故意夸大和蹭热度的现象。

第二,对于金融机构来说,智能风控的前提是大数据的运用,而大数据则完全依赖于场景的布局。互联网公司由于具备稳定的场景优势自然能够积累海量数据来刻画用户行为,而绝大多数金融机构仍需借助于外部数据交易的方法来补充数据维度的不足。一方面买来的数据可能缺乏金融属性,不具备参考意义;另一方面由于金融机构缺乏像互联网那样稳定可持续的场景和数据运营体系,也很难形成真正的作用和价值。所以有些机构也干脆直接买同盾分、芝麻信用分,而并不自己来建设系统。

第三、大数据强调相关性而不是因果性,且基于机器学习模型的评估和结果不具备可解释性,将其运用到实际风险审核、侦测场景中的可行性有待商榷。

所以对于智能风控,只可看作是当下大数据、人工智能风口中,风险管理领域的一种新兴技术运用模式。在风险管理的方法论上、风险管理的计量标准和监管要求上,都与传统金融风险管理模式并无区别。其特色在于,通过引入更多维的客户数据(如客户线上消费、电商、运营商、行为),重构数据和应用架构,借助分布式大数据平台的能力、机器学习或深度学习模型,能够实现大批量、快速、精准的风险事件过滤或预测,从而能够在风险管理的时效性、前瞻性、精准性、技术先进性上寻求突破。未来随着生物特征识别、图像识别、区块链等技术的成熟,或可运用于风险管理领域,形成更多智能风控应用模式。

接着我们再来说说大数据风控。

现在很多大数据风控企业天天对外宣称自己公司建立了多么强悍的风控模型,行外人听了觉得挺牛,实际怎么样只有自己清楚。大数据风控真正解决的是人工风控的低效率,降低信息不对称的程度,将人的风控思维过程程序化而已,而不是说技术手段发明了全新的风控指标或者风控理论。

1、先说说大数据有哪些

IP、GPS、设备ID、WIFI、时间(注册申请时间、申请信息填写时间等)、多头借贷信息(共享机制)、人脸识别技术、阅读类信息(、阅读类app等看阅读习惯、关注的内容等)、身份证认证(公安部)、银行卡要素认证、运营商数据(手机实名、通话记录、消费记录、上网记录、联系人、出没地点等)、银联画像(消费额度、消费地点、消费时间、消费场所等分析出客户是否结婚、是否有房贷、是否买车、消费能力、是否怀孕、是否有孩子等)、乘机信息(航空公司)、车管所信息、涉诉信息(政府某网站)、被执行信息、企业商标专利/软件作品著作权……

2、大数据风控(征信)公司有两类

第一类是积累了多年的借贷业务,转型或者拓展风控服务业务,他们基于自身积累的业务数据建立风控维度,风控模型,他们可以用自身积累的数据来辅佐验证这些模型的准确性。

第二类是纯技术型公司,他们瞧不起传统风控,以为技术可以干掉传统风控。他们利用各种手段获取了很多很多的数据,甭管这些数据与信用的关联性是否是强相关。

银行赖以生存的信贷业务走到今天,他们积累的风控经验,形成的风控能力会比大数据风控也不差。

公开数据就那些,能清洗成什么样,提取出什么指标,很容易就能做到。一些风控公司把获取的数据稍微归归类就对外提供,这不过是数据的二道贩子而已,而他们所谓的风控模型,见过的人都知道水平也就那样,跟传统风控线下那一套相比,没什么革命性的不同,但不得不承认的是,一些传统风控获取不到或者不曾考虑的数据,在反欺诈方面的作用,真是大的很(比如设备关联性、ip关联性、地址关联性等)。

只要是数据,就能跟信用扯上关系,有人爱看游戏新闻,他就一定贪玩吗?有人在母婴店刷卡了,就一定是自己有了孩子或者怀孕了吗?有人在凌晨3点申请借款,就一定信用不好吗?没有什么一定的,所以针对这些大数据,大数据风控公司只能给出提示,而不能给出决定性结论。

大数据风控的本质作用是丰富风控指标所涉及的数据的维度,尽可能地解决信息不对称的问题(风险存在的根本原因)、提高风控效率、解放人的重复劳动。

本文到此结束,希望对大家有所帮助!

免责声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。朝夕网 » 现在很多机构都说是智能风控、大数据风控,能否通俗的解释下?