通过人工智能驱动的信用评分,授信决策正在被改变。这对于信用记录薄弱的借款人和从事非正规经济活动的人来说可能会改变生活通过人工智能驱动的信用评分,授信决策正在被改变。这对于信用记录薄弱的借款人和从事非正规经济活动的人来说可能会改变生活

AI驱动的信用评分用于薄档案和非正规经济

金融领域最保守的一个环节,即决定是否给予某人信贷,正在被人工智能驱动的信用评分所改变。对于信用记录丰富且长期与银行往来的个人而言,这是一个渐进的变化。然而,对于信用档案单薄的借款人和非正规经济中的人群而言,这可能会改变他们的生活。他们终于可以被系统识别,而不是对系统隐形。本文讨论了如何应用替代数据为缺乏传统信用记录的个人和小型企业创建基于人工智能的信用评分,在缺乏征信局数据时的不公平和偏见风险,以及监管机构推动为银行服务不足人群的承保创建可解释人工智能的努力。

信用档案单薄与非正规经济问题

传统的信用评级以某种金融存在为前提。它们假设个人拥有银行账户、正规金融产品,并且之前借过贷款或使用过信用卡。它们假设雇主以正规方式运营工资单,商家在经济的可见部分——即有记录的部分——运营。实际上,世界上很大一部分人并非如此。年轻成年人通常没有贷款或信用卡。移民可能在原籍国拥有良好的信用背景,但在新国家却一无所有。他们的大部分交易是通过现金或不向征信局报告的数字平台进行的:零工工作者、街头小贩、非正规店主和大量微型企业家。即使在有征信局的地方,其覆盖范围也可能很浅,或偏向于城市、正式就业人群。这类申请人的征信档案在贷款机构看来是空白或几乎空白的。由于风险团队被训练为信任征信局数据,他们会出于谨慎而犯错。结果是可预见的:拒绝率上升、额度缩减、价格上涨或完全被排除在外。

这些借款人不一定风险更高;只是系统对真正表征其财务生活的信号视而不见、充耳不闻。在这里,将人工智能应用于信用评分的基本概念很简单。在征信局统计数据缺乏或过于稀疏的地方,寻找其他来源。现代生活中有大量的数字足迹。当这些足迹以负责任的方式在获得同意的情况下收集,并转换为更有组织的信号时,它们可以告诉我们很多关于一个人的稳定性、赚钱潜力和还款机会的信息。最早也是最有价值的来源之一通常是电信数据。移动运营商了解某人如何定期充值预付费余额,他们是否多年使用同一号码还是频繁更换,他们的活动是稳定还是杂乱无章,以及他们是否购买相同大小的数据包。长期保持一个号码、定期充值并表现出一致使用模式的个人,通常比使用情况下降或波动的人更深入地融入社区,行为也更一致。稳定性与信用风险降低相关。

另一个强大的来源是电子商务和数字平台的数据。网约车司机的征信档案中可能包含的信息很少,但平台可以访问行程数量、每周收入、取消数据、客户评价以及司机的从业时长。作为市场卖家的微型商家会留下已完成订单、退款、投诉、缺货和增长模式的历史记录。对于非正规企业而言,平台数据可以用作官方财务报表的最接近等效物。接下来是银行账户、数字钱包和开放银行API现金流数据。虽然借款人可能缺乏长期信用记录,但他或她通常也会有一个存入工资、零工收入、汇款或业务收入的账户。通过分析基于时间的流入和流出,贷款机构可以估计常见收入、其变动性、是否有缓冲,以及已分配给租金、水电费和现有债务等经常性支出的收入比例。对于银行服务不足的借款人而言,现金流承保通常比严重依赖过去贷款的传统评分卡更可靠。工资单和就业API提供了另一层信息。

在雇主与工资单服务连接的情况下,贷款机构能够确认就业情况、月收入、就业期限和薪酬变化。对于有多份兼职工作的人来说,这种综合图像比一张工资单信息量大得多。最后,在适当使用的情况下,行为和设备级数据可用于协助欺诈和风险评估。个人使用同一设备的时长、登录位置的规律性、几个月来他们如何使用应用程序,以及他们通常进行交易的时间,都可以提供真实性和稳定性的指标。这些信号应该谨慎处理以防止代理歧视,尽管它们可以提供有用的支持。所有这些来源的共同点在于,它们讲述了一个人的真实生活,他/她如何生活、如何赚钱和支付,即使很明显他/她从未接触过信用卡。

\

人工智能如何将杂乱信号转化为评分?

这些其他数据来源密集且非结构化。电信日志、平台事件、银行交易和设备遥测的结构与传统征信局报告不同。它们嘈杂、多维且充满特异性模式。此时,人工智能,特别是现代机器学习,是必要的。通常的生命周期始于数据聚合。贷款机构在数据保护法和客户直接同意的条件下,可以访问电信合作伙伴、开放银行数据源、工资单API和平台合作伙伴。

他们将原始数据吸收到安全环境中并进行标准化。手机充值活动、钱包信用和电子商务订单被转换为具有规则格式的时间序列。不必要的异常和重复项被消除,缺失值被处理。由此,数据科学家构建特征。他们创建摘要变量,而不仅仅是将所有原始交易输入模型:平均每月净现金流;储蓄为正的月份比例;未向债权人付款的最长连续期间;收入不足的月份;平台收入的增长或衰减;工作时间的变动性;逐周位置的持久性。

这些属性试图将个人的经济生活压缩成模型可以消化的数字。梯度提升树、随机森林和神经网络是机器学习算法,它们在已知结果的历史数据上进行训练。在信用评分的情况下,结果通常是借款人在指定期间(例如六个月或十二个月)内的违约。模型会了解表明或多或少风险的特征组合。在人类承保人中发现的模式是人类洞察力无法识别的,例如现金流波动性与平台任期之间的微小相互作用。验证至关重要。该模型应用于未训练过的数据,以确保其性能是真实的,而不是过度拟合的结果。

AUC、基尼系数和柯尔莫哥洛夫-斯米尔诺夫统计等指标用于衡量区分能力,而校准图则表明预测概率是否与实际违约率相同。除了标题数据外,贷款机构还需要根据细分市场查看表现:新信用借款人与经验丰富的借款人、各种职业、地区和收入等级。部署后,模型将即时评估新申请人,并在几秒钟内提供回应。流程不能就此结束。统计数据随时间而变化,平台调整其政策,宏观经济也在演变。

\

:::tip 本文由Sanya Kapoor在HackerNoon商业博客计划下作为新闻稿发布。

:::

\

市场机遇
Sleepless AI 图标
Sleepless AI实时价格 (AI)
$0.04011
$0.04011$0.04011
+1.33%
USD
Sleepless AI (AI) 实时价格图表
免责声明: 本网站转载的文章均来源于公开平台,仅供参考。这些文章不代表 MEXC 的观点或意见。所有版权归原作者所有。如果您认为任何转载文章侵犯了第三方权利,请联系 [email protected] 以便将其删除。MEXC 不对转载文章的及时性、准确性或完整性作出任何陈述或保证,并且不对基于此类内容所采取的任何行动或决定承担责任。转载材料仅供参考,不构成任何商业、金融、法律和/或税务决策的建议、认可或依据。