通联数据CEO王政:人工智能如何作用于科学投资?

简介:

通联数据CEO王政:人工智能如何作用于科学投资?

雷锋网(公众号:雷锋网)3月13日报道,在日前于武汉举办的申万宏源投资高峰论坛上,通联数据王政就“投资科技与科学投资”做了主题演讲。

王政,美国普林斯顿大学物理学博士,曾任巴克莱全球投资公司基金经理、博时基金股票投资部总经理、ETF及量化投资总监等职,他拥有近20年资产管理、金融信息平台研发和大数据研究经验。

王政表示,投资科技是跨界的工作,需要把投资专业知识和逻辑与技术更好地结合起来,它需要具备几个核心的要素:第一是一定要有专业的投资研究理解,只有这样理解的基础上才能把技术用来解决投资中的问题。第二是需要有人工智能这样的核心工具,帮助解决大数据时代中各种各样的问题。

以下是王政演讲内容,雷锋网做了不改变原意的编辑:

今天我本来想用大的题目金融科技(FinTech),这个东西太火了,但因为金融科技涉及面太广,银行、保险、支付等等,我今天主要是讲投资科技与科学投资的关系。

什么是投资科技(InvesTech)?

为什么叫投资科技(InvesTech)呢,跟IT有点差异性。投资科技的缩写还是IT,看起来没有什么区别,其实投资科技和IT还是有本质区别的,IT帮助我们解决工作上的一些问题,投资科技更多是跨界的工作,需要把投资专业知识和逻辑与技术更好结合起来。这里面有几个核心的要素需要具备:

  • 第一是一定要有专业的投资研究理解,只有这样理解的基础上才能把技术用来解决投资中的问题。

  • 第二是需要有人工智能这样的核心工具,帮助我们解决大数据时代中各种各样的问题。

科技在投资领域的应用不是什么新鲜的事情,早期我们用科技来提升信息传输的速度,信息对投资来讲是非常重要的。随着计算机的发展,我们开始引入了计算机来传递信息,也用计算机处理信息、分析信息。从70年代开始,投资管理在产品上有很多的创新,开始有指数基金,80年代有对冲基金,现在有智能投资和新的产品,随着科技发展应运而生,科技在帮我们引领产品的创新。

投资科技的核心基础有三个技术非常重要,一是云计算,二是大数据,还有最核心的人工智能。

云计算帮助我们解决计算的能力和存储路径,在此能力基础上我们才能够采集更多的信息,才能把更多的信息存储下来,才有我们现在讲的大数据。

有了大数据之后,我们对用机器处理数据的需求越来越高,而且有这样的样本以后去学习的精确度会越来越提升。

大数据的产生归纳为三个维度:

  • 第一个是关于物的信息,我们记录下各种设备的位置。

  • 第二个是关于人的信息,每个人都有手机,这个手机有很多信息,我们的位置,我们每天走了多少步,我们在什么地方消费了,所有人的信息都会被收集下来。

  • 第三个是环境的信息,低轨卫星的发展可以让我们收集到更多环境的信息,我们也和美国卫星采集公司合作,我们要看新疆光伏场地的信息,不需要亲自去了,用低轨卫星的照片就可以看到,每隔几天扫描一次,可以帮助我们做更高层的研究。

大数据不仅仅是讲数据多少的问题,更多是在数据的维度上扩展。

如果仅仅是行情数据,再高也就是一个类型的数据,如果我们有其他维度的信息,对我们投资的帮助会更大。一般有两类信息,一类是和企业合作的专业数据,互联网公司支付体系、运营商、商贸、物流、电力、大宗商品等企业存下来非常有价值的数据,以前没有被我们所用,现在可以把这些数据用于投资,专业的数据需要通过合作引入到投资领域中,需要做一些脱敏。

公开数据,网上都可以看见,它的挑战是什么呢?需要技术把这些数据清洗干净处理好,为我们提供了多维度的信息,同时及时性也提高了,可以通过高速的处理平台引入到我们的模型中。一个是广度,一个是速度,为我们提供了更多的投资价值。

投资科技最核心的技术是人工智能,不仅仅是技术的升级,更多是改变我们服务的模式。有了人工智能,我们可以做很多场景化的服务,精准营销可以知道某个点需要什么东西,做研究和投资也是一样的,机器可以帮助你识别一些感兴趣的东西。服务的模式也会跟以前不一样,有了人工智能以后,我们做智能投顾,完全是场景化、个性化的服务。

投资科技比较大的应用领域,投资科技比较大的应用领域,是智能投研和智能投顾,帮助大家提升效率,把基本面和量化结合来做研究,用于资产管理行业。

投资科技如何帮我们做科学投资?

很多年前记得有一门课,最核心的一点就是从艺术到科学,所有模型都是用科学的方式来做,所以招了很多学理工科的做研究员。目的就是基于一定的投资逻辑构建出模型,能够实证分析,不仅样本有效,而且样本外也可以有用。用非常严格的流程和方法来做投资,这就是早期量化投资在做科学投资很核心的点。我们做指数投资,其实就是科学投资的方法,只是用了组合投资的概念。现在发展到新的阶段,有点像组合的组合了。

随着技术的发展,量化投资的引入进入了工业时代的阶段,我们会找一个团队,有研究员,有做数据的,有做基金管理的,一个团体在科学的流程下完成投资管理任务。这个阶段有点像工业时代的流水线,整个效率大幅度提升,重复性比主动投资强很多。

现在随着数据的增加,数据化程度提升,我们已经进入了信息时代。信息时代数据这么多,存储到各种各样的资源上,如果想继续用量化的方式一个个来构建,这个工作是非常大的,在座各位积累到那个程度需要很多的精力和时间。逐渐的,我们开始要借助技术,教机器去归纳和总结,机器没有人这样的创造性思维,但可以做很多以前人所思考的东西,智能投资机器的概念越来越流行。

概括来讲,第一个阶段不需要任何设备辅助可以做投资,第二个阶段可以教机器技能,就按照你交代它的事情去做。到现在,更多是想办法教机器去学习,逐渐帮助我们提取我们所需要的知识和关系。

信息处理上,每一个研究员会面临着读很多的公告,公告作为信息的主要来源,每个研究员,无论是基本面还是量化的都会关注。每个公告来了都是一百页甚至更长,怎么样把公告的信息快速读取,这是很有考验的,但是机器可以帮助我们做文本处理,提取非常有价值的信息。

第二,所有信息来了以后有很多关联关系,人去建立这样的关系是可以的,但是精力不够,机器就可以很快建立这样的关联关系,以及用模型帮你建立起关联关系的强度。

第三是主题发现,我们经常做主题,怎么样从大量信息挖掘出新的亮点和主题,我们无法从这么多东西总结出特定的主题来,这些主题又和哪些公司有关系,这是我们很关注的,怎么样匹配出这些公司来,这是文本方面。

第四,情绪分析,一篇文本信息的情绪怎么样测算,一段语言的情绪怎么样测算,都是可以通过计算机来测算。

传统金融机构如何向科学投资转型

在这里对科学投资的一点点个人理解和大家分享。

  • 第一个是在理念上要有所改变。

    我们要从传统的量化投资向智能投资方向改变,不能简单靠传统研究各种各样的模型,这个模型可能有价值,但随着数据的增加,这样的工作会非常漫长。

    以前的量化投资找市场共性工作流程,发展到研究某个行业、研究个股的模型,从共性到个性进行有规律的总结,每个股票也有规律。以前的模型数据比较好,IC比较高,但随着数据越来越多,数据信息准确度越来越低。要从高IC到低IC,要接受IC比较低的信号,我们要通过很多的信号来选取IC。

    此外是从单点到全局的转变。原来我们看的都是定义指标,抽取每个股票单点信息,尽管组合起来,但还是不够全面,我们要从公司全貌来看。有些信息可能还需要我们做非结构化到结构化的过程,我们希望把公司更全面的去看特征。

    最后是从固定模板到动态学习,原来一个模型可能是做好一直在运行,需要花很长时间修改模板,未来学习机器帮助我们动态学习和提升。

  • 第二,数据的维度上要改变思考。

    首先,以前的数据都是特定的数据专而精,现在要朝着全样本的角度发展,这样会更加科学更加合理。

    其次,以前的数据都是定时发生,现在要从定时发生的数据到实时发生,在我们的模型中去反映出来、体现出来,要求有动态反映实时信息的能力。

    再次,我们要接受低密度信息的趋势,以后很多很多的信息密度会越来越低,以前是高含金量的矿石,现在是低含金量的矿石,怎么样从里面筛取真正有价值的信息,这需要投资科技帮助我们解决。

  • 第三,要关注对平台的重视。

    现在所有做量化的,还是倾向于自己建量化研究系统,但随着数据的增加,计算能力需求加大,所有的都是自己建,这种可能性越来越低。未来一定要共享外部资源,帮助你做很多事情,包括计算资源、存储资源、数据资源,甚至你的信号都可以应用外面的信号,帮助你提升研究能力。

    第二个是我们要接受公有云的服务,以前什么东西都是自己建设,用100个机器帮你建模型不太现实,公有云发展越来越成熟,也越来越安全。

    第三个是从全方位到专业化,我们现在做投资什么都要自己弄,其实把很多精力花在不应该的地方,每个人应该专注于核心能力,业务上哪块最强就应该集中精力。互联网时代最大的变化就是能够快速共享很多资源,所以要从全方位什么都干到专注到某点共享外部资源。

    最后是从产品发行的模式向场景化服务的模式转换。传统基金管理投资还是发个产品去卖去销售,未来投资者更关注这个时候需要什么,你就给我提供什么服务。就像现在卖保险,不是像以前给你一个单子去填,你在哪里买了机票,就来个延误险,这个场景就要提供服务,而且是特定的服务。半个小时要登机了,敢不敢卖这个保险。阿里巴巴的小额贷款,能够实时给你贷款,就是因为有信用评估的能力,可以根据你的需要动态给你贷款。我们做投资,未来也是逐渐朝着这个方向发展。

这就是科学投资的理解,一个是理念,一个是数据,一个是平台。

总结

最后的小结,投资科技给我们带来的帮助无外乎三个方面,

  • 一是帮助我们做信息处理。

  • 第二个帮助我们构建机器学习。

  • 第三个可以共享知识和研究。

从科学投资来讲未来有三个阶段,大家可能可以预见:

  • 第一个是提升工作效率,怎么样做到专业搜索,让你快速获取想要的信息。现在的信息不是不够,而是太多,这么多的信息里面怎么样获取精准需要的信息,这就需要我们有专业垂直领域的搜索帮助我们解决问题。我们需要借助机器帮我们处理信息。

  • 第二个是帮助我们构建知识图谱和模型,真的让数据驱动我们投资,这是具有挑战的。一旦用数据驱动投资,构建这样机器的时候,那就是智能投资的阶段了。

  • 最后我们有个愿景,机器人基金经理,由机器人帮助我们完成投资全流程。

据雷锋网此前报道,通联数据(DataYes)是万向集团投资成立的一家金融资讯和投资管理服务公司,该公司希望通过大数据、云计算、机器学习等信息技术,为资产管理人提供新的金融资讯和投资研究数据分析服务。该公司旗下的萝卜投研,作为基本面研究平台,主要研究怎么样把基本面和量化分析框架结合起来。此外,也有在线量化研究平台,两年前也研究了智能投顾,主要在于分析用户行为,匹配更加个性化的服务,而不是在市场上做短配置。


本文作者:温晓桦

本文转自雷锋网禁止二次转载,原文链接

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
1月前
|
人工智能 自然语言处理 开发者
印度投资1037亿加速AI发展,重点布局大语言模型
【2月更文挑战第24天】印度投资1037亿加速AI发展,重点布局大语言模型
42 3
印度投资1037亿加速AI发展,重点布局大语言模型
|
3月前
|
人工智能 自然语言处理 语音技术
人工智能语音数据的多样性
人工智能语音数据的多样性
24 2
|
12天前
|
机器学习/深度学习 数据采集 人工智能
|
17天前
|
人工智能 分布式计算 Kubernetes
人工智能,应该如何测试?(三)数据构造与性能测试篇
本文探讨了人工智能场景中的性能测试,区别于传统互联网测试,其复杂性更高。主要关注点包括两类AI产品——业务类和平台类,后者涉及AI全生命周期,测试难度更大。测试重点是模型训练的性能,特别是数据模拟。需要构造大量结构化数据,如不同规模、分布、分片和特征规模的数据,以评估算法效率。此外,还涉及模拟设备规模(如视频流)和节点规模(边缘计算),以测试在大规模负载下的系统性能。文中提到了使用工具如Spark、ffmpeg、流媒体服务器和Kubernetes(K8S)的扩展项目,如Kubemark,来模拟大规模环境。最后,文章介绍了使用Golang进行异步IO操作以构建海量小文件,优化IO性能。
38 0
|
1月前
|
数据采集 机器学习/深度学习 人工智能
用人工智能和missForest构建完美预测模型,数据插补轻松驾驭
用人工智能和missForest构建完美预测模型,数据插补轻松驾驭
60 1
|
1月前
|
人工智能 算法 开发工具
预测五大数据和人工智能趋势
预测五大数据和人工智能趋势
|
2月前
|
人工智能
微软变“渣男”!据悉已投资法国开源 AI 独角兽Mistral,OpenAI成“备胎”了?
【2月更文挑战第8天】微软变“渣男”!据悉已投资法国开源 AI 独角兽Mistral,OpenAI成“备胎”了?
42 3
微软变“渣男”!据悉已投资法国开源 AI 独角兽Mistral,OpenAI成“备胎”了?
|
3月前
|
机器学习/深度学习 人工智能 计算机视觉
|
机器学习/深度学习 人工智能 自然语言处理
搜狗翻宝Pro机再次开挂,智能翻译硬件成中国人工智能的新风口
第五届世界互联网大会正在如火如荼的举行。
搜狗翻宝Pro机再次开挂,智能翻译硬件成中国人工智能的新风口
|
机器学习/深度学习 人工智能 自然语言处理
与世界同行 2017中国人工智能大会有感
与世界同行 2017中国人工智能大会有感
1542 0
与世界同行 2017中国人工智能大会有感