时间:2020-04-16 18:31:26来源:融易新媒体
沈赟,2018年加入360金融,现任360金融首席数据科学家。柏林科技大学计算机科学博士,具备深厚的机器学习与金融数学的理论功底,在量化策略研发与互金风险控制领域有着超过10年以上的研究与实战经验。在人工智能、应用数学与量化金融多个领域的国际顶级学习期刊和会议上发表多篇学术论文。
360金融首席数据科学家沈赟
中国征信是时代发展的产物,标志着我国将由市场经济走向信用经济。我国征信业从无到有,逐步发展,作用日益显现,然而,其发展情况与信用经济发展突进形成了矛盾,目前国内仍有大量人群未被征信体系覆盖。
数据科学家这个“新职业物种”的出现改变了传统的商业玩法,在金融科技这一领域,更是解决了金融普惠可能性猜想问题。数据科学家们运用大数据与科学方法解决业务实际问题,赋予传统行业新的生命力,金融服务之于广大“征信白户”也不再遥不可及。但回归业务本源,他们依旧是朴素的实操者,利用技术解决问题才是他们永远的“学术追求”。
如何实现海量数据淘金?如何细分客群,从而精准评估和预测以提供定制化服务?数据科学如何转化为降本增效的利器?业务执行和学术研究有何区别?沈赟给出了如下解答。
——数据红利:取之于民,用之于民
问:如何理解数据红利这个说法?
沈赟:大数据产业是数字经济发展的核心力量,以数据流引领技术流、资金流、人才流,将深刻影响社会分工协作的组织模式。对于金融科技行业来说,不同的企业之间,技术本身并没有大的壁垒,关键在于通过经验的积累、知识的积累是否能将技术结合场景进行应用。
然而,虽然不存在技术壁垒,但数据壁垒却是存在的。因此,数据量越大,客群采集到的信息越多,机器学习出来的模型就越准确,预测性能也越好。所以从某种程度上来说,这就是所谓的数据红利。而依据这个红利,我们可以精确化评估风险,更好地预测用户的行为。
问:如何将这些数据红利回馈给用户?
沈赟:对人工智能和大数据来说,数据作为原材料,用以精准度量用户风险,从而为他们提供最适合的金融服务。在这个过程中,对数据的细致分析和精确使用非常重要。
相比“保守派”传统金融机构,有些人错误的将金融科技划分为“激进派”,但实际上,在数据加持的“激进”背后,其结果往往在更广范围内更加“保守”。比如,有些机构会因为用户无征信记录就判定其具有高风险,从而拒绝提供金融服务。但是在数据红利下,金融科技企业仍然可以通过其他类型的数据较准确地评估风险,即使用户没有征信记录,同样可以享受金融服务。因此,我们以更高的效率为更多的用户提供了享有金融服务的机会,这就是数据红利对用户的回馈。
问:在采集数据的过程中,如何保证这些数据的安全、不被滥用?
沈赟:首先,数据安全方面,360金融建立了非常严格的数据管控体系,我们采取了包括数据加密等一系列措施保证数据的安全。层层保护下,这些数据在确保不被轻易泄露的同时,也能很好地防止黑客攻击。
另外,在数据应用方面,我们对所有信息均进行了脱敏处理,比如姓名、家庭住址这些私人信息,数据分析人员是拿不到的。当然,就数据应用目的来讲,个体信息并不受关注,模型搭建过程一言以蔽之,通过机器学习手段,去发现千万量级数据中的统计规律和群体的特征。
问:对技术人员来说,学术研究和商业应用有什么区别吗?
沈赟:学术研究的目的是不断拓展人类知识的边界,关键在于分析,即在什么情况下能做什么,哪些事情在特定情况下是做不了的。比方说深度神经网络的瓶颈目前就在于,我们其实不清楚它的适用边界在哪里。