发布时间 2019.10.17 行业动态

九章云极周晓凌:金融数据科学平台建设的思考





  • 10月16日,由《金融电子化杂志》主办的2019中国金融业数字化发展战略研讨会在长沙隆重开幕,本届大会以“数字化价值探索与创新引领”为主题,国家信息化专家咨询委员会委员陈静、中国金融学会金融科技专业委员会秘书长兼副主任委员杨竑、中国互联网金融协会副秘书长杨农中国人民银行长沙中心支行副行长徐涌、湖南省农村信用社联合社党委书记赵应云等多位知名专家学者和行业翘楚出席大会。九章云极售前副总裁周晓凌受邀参加大会,并作“金融数据科学平台建设的思考”主题演讲。

  • 会上,周晓凌结合九章云极的核心产品——DataCanvas数据科学平台在金融领域各类业务场景的探索和实践,提出为实现AI能力从0到1的输出再到可持续发展,构建数据科学平台或机器学习平台时需要解决四大问题,并分享DataCanvas最新解决方案。



  • 在本次大赛中,九章云极CEO方磊向大家展示了公司的综合实力、自主研发创新技术和在金融行业的创新应用实践。DataCanvas九章云极是一家致力于打造中国最领先的数据科学平台和实时决策中心的高科技、高成长企业。公司凭借独有的机器学习开发技术、丰富的行业创新应用,不仅处于IDC MarketScape针对机器学习平台在中国市场的表现进行深入评估的报告中主要厂商位置,并且成为中国大陆地区唯一入选Gartner“Cool Vendors in AI for Fintech in Asia/Pacific”报告的企业。

  • 实现AI能力面临四大挑战

  • 自2017年2月Gartner首次定义数据科学和机器学习平台以来,各家金融企业纷纷尝试应用智能技术。在成为技术“新秀”的同时,数据科学落地也面临诸多挑战。

    1、技术发展太快。机器学习的各种算法与框架层出不穷,快速变革,远快于软件技术的发展;

    2、有效建模的门槛高。 编码建模作为构建数据模型的主要手段,对人的依赖性大;

    3、企业及管理水平不成熟。 准确性、性能、稳定性、安全性、需求管理、版本管理、生命周期管理等企业级管理水平仍处于早期水平;

    4、资产积累难度大。 数据科学人才紧缺,人才培养时间长,模型资产易流失。

    如何做好一个数据科学平台,一个高效支撑智慧金融建设的数据科学平台应该具备什么功能……成为现下金融行业企业亟需解决的问题。

  • 新一代Fintech发展趋势: 从封闭走向开放

  • 周晓凌说:“经典的软件演进方式已经不能满足AutoML与AI建模的发展要求,只有面向开放软件架构才能快速融入新技术新方法。” 不同的AI建模项目需要不同的运行环境,模型的来源途径多样难以协同管理……这些壁垒无形之中成为技术落地的绊脚石。开放性架构能够简化建模环境的准备过程、支持内外部模型管理发布、支持多语言和多框架,并有效利用已有资源,加速数据模型协同开发、资产积累和落地应用。



  • 作为一个中立的软件提供商,DataCanvas数据科学平台可以在所有硬件和技术架构上实现开放性支持,轻松处理海量多源异构数据,无缝适配各类物理设备和云环境,并对主流技术架构提供全面的支持,服务全行业应用场景。

  • AutoML 没有“人工”也有“智能”

  • 传统的数据建模只有“人工”没有“智能”。一个数据模型的成形从数据的清洗、标注、特征工程、业务降维和模型检测都需要耗费数据科学家乃至数据科学团队庞大的时间和精力,机器坐享其成。

  • 今天,由于数据科学人才能力参差不齐,技术普及程度和用户需求差别大等原因,编码建模、可视化流程建模、自动机器学习建模等多种建模方式都在被使用。为了让不同建模能力的用户快速达成协同合作,让多种建模方式能够交互成为了高效建模的有效解决方案。DataCanvas数据科学平台特有的“三位一体”建模功能,正是集三种建模方式于同一平台,使模型资产得以最大化保存和管理,解决当下用户建模能力差别大和协同难的问题。

  • 但在未来,要彻底解决建模低效、模型结果不稳定等问题,还是需要AutoML自动建模出马。因为在数据科学学科建设发展、人才逐渐补足的同时,数据的体量也愈加庞杂,业务需求随需而动,对数据模型的要求更高,被生成和训练的数量也成倍增长。DataCanvas数据科学平台实现宽表加工、特征工程、模型训练三大阶段的自动化,涵盖数据和模型的全生命周期。



  • 自动数据清洗、自动特征选择、自动模型选择、自动闭环监控和训练……人坐享其成,自动机器学习让建模没有“人工”也有“智能”。

  • 企业级平台,让运维更高效

  • 传统的数据建模往往通过开源工具尝试机器学习和某种单一的分析场景,随着业务场景、模型需求和团队协同的要求剧增,一个功能强大的企业级平台将成为主流。从技术和市场的长远发展来看,未来开放银行、AI大脑的建设更需要多平台的融合来达成。

  • 一个好的企业级平台应当开放、可靠,能够合理进行资源管理和算力分配,提供模型全生命周期管理,协同和共享模型成果,在线进行实时预测和模型训练,支持多建模平台融合。DataCanvas数据科学平台将以人工智能和机器学习为核心的增强分析技术引入到企业级服务中,是一个实时的、全自动化的和易扩展的数据科学平台,平台可以在生产模式下运行各种数据科学项目,大幅度降低模型投入生产成本,提升企业业务价值。

  • 独创“四库”,积累企业AI资产

  • 九章云极立于行业前沿视角,洞察到知识融合难题将是未来5年的企业AI建设发展的最大瓶颈。DataCanvas数据科学平台独有的“四库”有效解决行业AI建设三大难题:经验及业务知识融合,模型资产共享、平台运维管理,场景化知识迁移。



  • “四库”——特征仓库、模型仓库、场景模版仓库、AutoML Recipe仓库的建立攻克复合知识人才匮乏、跨行业知识难以快速贯通的问题,将行业经验、业务知识和数据科学技术有效结合,直接降低客户对资源的依赖和AI建设成本,高效实现企业业务知识融合和AI建设。



  • 目前,DataCanvas数据科学平台已在金融行业落地智能投研、实时推荐、智能反欺诈、小微信贷风控、用户行为分析、营销精准化、客户流失预警等诸多应用场景,并在政府、交通、IOT、教育等行业广泛落地,收获市场广泛好评。

  • 日前,凭借在AI和Data Science领域的技术不断创新以及全面贴合业务的Fintech解决方案,九章云极成为中国大陆地区唯一入选Gartner“Cool Vendors in AI for Fintech in Asia/Pacific”报告的企业,此前在《IDC MarketScape:中国机器学习开发平台厂商评估》报告中亦获得行业认可,处于主要厂商位置。

  • 目前,DataCanvas数据科学平台已在金融行业落地智能投研、实时推荐、智能反欺诈、小微信贷风控、用户行为分析、营销精准化、客户流失预警等诸多应用场景,并在政府、交通、IOT、教育等行业广泛落地,收获市场广泛好评。

  • 未来,九章云极将继续发挥自身技术优势,通过数据科学落地为客户创造更多业务价值,推动数据科学平台行业发展。

2014-2019 © datacanvas.com 版权所有 京ICP备13015186号-2 京公安网备11010802022944