数据地位提升迎来算法时代的风险投资

简介:  作者Thomas Thurston是风投公司Ironstone Group的首席技术总监和资金经理。同时,他也是数据科学公司Growth Science的CEO,这家公司主要工作是运用算法和新的科技来预测商业行为。
0.jpg

 作者Thomas Thurston是风投公司Ironstone Group的首席技术总监和资金经理。同时,他也是数据科学公司Growth Science的CEO,这家公司主要工作是运用算法和新的科技来预测商业行为。
 
数据在现代商业的决策中的地位在不断上升,那为何风投不跟上这个潮流呢? 什么时候风险投资的依据会从直觉转向算法呢?
 
我们生在一个算法的时代。便宜的计算和相应的软件给各个领域都带来了巨大的进步。现在的数据学家利用算法来预测天气,疾病,赛事结果,选举结果,哪部电影会最为卖座,甚至是你的未来另一半。
 
与此同时,风投业还处在十分古典的阶段,它更多的是一门艺术而非科学。因而,为何没有更多的VC利用数据科学来指导他们的投资呢?
 
传统的VC会去拜访那些初创企业,然后再用他们的个人直觉从中择优去劣。对少数精英VC来说,这种直觉引导的投资会带来极大的回报,然而全美的前500家风投却总体表现得并不如意。美国风投报告(National Venture Capital Index)显示,整个风投业在2000到2010年的整体回报率为负。我们无需为此指责VC们,毕竟从一群初创企业中选出其中的佼佼者比表面上看起来要难许多。然而为何不因此让VC们做出更多基于数据的决定呢?

       

对于将数据科学引入风投产业的阻力主要有两个:
 
首先,很多人会说基于数据科学的对初创企业的预测是十分不靠谱的,相较之下,他们更相信业内高手的直觉。
 
其次,即便假设基于数据科学的预测是靠谱的,依然有人认为这不可行。因为许多人认为这会引导不良的社会和道德风气(机器可以取代人的决定)。
 
尽管如此,数据科学早已进入了风投业。举例来说,有一家不愿透露姓名的风投完全采用数据分析的方式进行投资,并且已经掌握一亿六千五百万美元的基金,投资了大概四十家初创企业。这家企业利用近二十年来的风投数据,在两个星期内做出投资决定;并且,他们从不独立投资(只会和别的风投一起投资);而且从不在董事会占有席位。这家公司会根据初创企业的行为为其评分,然后把得分最高的公司进行人工审核然后才能通过最后的投资评审。
 
我所在的公司,Ironstone也使用类似的审核程序。Ironstone会使用机器和人工的混合评审法在两个星期内决定是否参投初创公司。如果在数据分析这关过不了,那这单投资就没戏。如果公式告诉我们,“这家公司能行”,那也需要经过第二层的人工审核阶段。Ironstone的数据采集自发给初创企业的调查问卷和来自其他途径的数据。不同的是,Ironstone是愿意独领一轮投资的。
 
Google Ventures作为一家投资了170多家初创企业的风投公司也使用这种混合审核法,在投资企业前对其进行严格的数据分析。Google Ventures的Bill Maris说:“我们有世界上最多的数据,也有最为强大的云计算能力。如果我们不利用这些资源而直接就去随意投资那实在是太愚蠢了。”据说现在很多更为传统的风投公司也开始使用一些数据分析了。
 
除了筛选优秀的初创企业和增加收益外,在风投中引入数据科学还有什么好处呢?
 

 
运用数据科学来筛选的好处之一就是它很快。一旦输入收集到的数据,很快确定的结果就可以出来了。这也就是像Ironstone这样的公司能在两个星期内就决定是否投资一家公司的原因了。相较之下,传统的VC可以很快的拒绝一家初创企业,但决定起是否投资一家初创企业来却非常的慢。如果一家初创企业被选中,VC们可以耗费数月的时间来争论是否投资这家公司。
 
  客观
 
传统的VC做出投资决定所凭借的大多是一时冲动,因而很容易受到一系列的认知误差的干扰。比如说,他们的决定可能会被当时的室温,之前吃的食物,睡眠质量还有其他杂七杂八的因素极大的影响。尽管算法可能看上去很笨,但它们总是客观的。它们不会感到疲惫、劳累、饥饿、情绪化或是被血统显赫的创办人误导。
 
 有理有据
 
创业者总是抱怨说VC总是用一些莫名其妙甚至是有问题的标准去评价他们的企业。确实,认知偏差可能会极大的干扰VC们,让他们没法集中精力去评析初创企业。相对的,数据科学可以完全的屏蔽这些认知“杂音”。尽管不同的算法带来的结果不同,但他们至少是基于现实的假设和数据的,而非一时的心血来潮。
 
有提高空间
 
算法背后的逻辑是直白而清晰的。你可以直接的看到它是怎样做出决定的。这使得算法有坚实的基础使它能够得到改进。然而直觉却不是这样的直白和清晰。VC们那些天马行空的直觉在长期可靠性上比起算法来实在是差远了。
 
然而在风投界,针对算法筛选的双重标准依然是存在的。对于一套算法来说,在考虑其是否能进入风投的决策程序时,VC还有投资者们几乎都会质询是否有支持它的大量数据,它在统计上的稳定性,以及在操作层面的可行性。不仅如此,他们还会苛求算法中出现的样本大小,紧密的对应关系,以及清晰的定义。然而VC们那些飘忽的直觉却往往既没有经过任何的统计测试,也没有在操作上确定过可行性,甚至一点都不简明清晰。
 
  延伸性
 
因为算法筛选的快速,客观,精准和可改进性,它能够极大的缩减每次决策所需要的时间和人力。这可以留出精力给VC们去增加他们的资金而不必陷入无尽的决策泥沼。
 
平均来说,一个活跃的VC一年大概会做四宗投资。这个数字不仅是因为VC有多少钱而确立,还受到保质保量的完成一宗投资所需要的人力和时间成本所限制。当资本开始扩张,传统风投极为耗费资源(人力和时间)的特点便显露无疑了。结果就是,拥有更多资本的VC想投需要资金量更大的公司,即便这本身没什么意义。 
VC们对于数据科学的抵触也许来源于他们与之相关的意愿和技能的缺失。有些VC直白的反对把数据科学引入风投,也有的在默默观察数据科学在风投中产生的效果,还有一些VC已经开始积极的运用数据科学进行风投了。只要没有偏见的人都看的出来,VC界正处在一个伟大时代开始前的黎明。


原文发布时间为:2013-11-15


本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关文章
C4.
|
1月前
|
算法 程序员 C语言
C语言的选择结构与数据算法
C语言的选择结构与数据算法
C4.
18 0
|
2月前
|
机器学习/深度学习 数据采集 搜索推荐
Paper Digest | 突破个性化推荐数据稀疏性:长尾增强的图对比学习算法研究
本文提出了一种新的长尾增强的图对比学习方法(LAGCL),该方法促使模型同时兼顾头部节点与尾部节点之间的知识,并通过长尾增强技术来使模型产出更均匀更准确的节点表征,从而改进基于 GNN 的推荐任务。
|
2月前
|
编解码 算法 定位技术
GEE时序——利用sentinel-2(哨兵-2)数据进行地表物候学分析(时间序列平滑法估算和非平滑算法代码)
GEE时序——利用sentinel-2(哨兵-2)数据进行地表物候学分析(时间序列平滑法估算和非平滑算法代码)
74 3
|
1天前
|
算法 数据可视化 大数据
圆堆图circle packing算法可视化分析电商平台网红零食销量采集数据
圆堆图circle packing算法可视化分析电商平台网红零食销量采集数据
29 13
|
7天前
|
算法 数据可视化 Python
Python中LARS和Lasso回归之最小角算法Lars分析波士顿住房数据实例
Python中LARS和Lasso回归之最小角算法Lars分析波士顿住房数据实例
13 0
|
8天前
电信公司churn数据客户流失k近邻(knn)模型预测分析
电信公司churn数据客户流失k近邻(knn)模型预测分析
18 0
|
2月前
|
机器学习/深度学习 算法 搜索推荐
【实操】数据扩增:Retinex算法用于图像颜色恢复和对比度增强
【实操】数据扩增:Retinex算法用于图像颜色恢复和对比度增强
32 0
【实操】数据扩增:Retinex算法用于图像颜色恢复和对比度增强
|
2月前
|
算法
MATLAB | 插值算法 | 一维interpl插值法 | 附数据和出图代码 | 直接上手
MATLAB | 插值算法 | 一维interpl插值法 | 附数据和出图代码 | 直接上手
38 0
|
2月前
|
算法
MATLAB | 插值算法 | 二维griddata插值法 | 附数据和出图代码 | 直接上手
MATLAB | 插值算法 | 二维griddata插值法 | 附数据和出图代码 | 直接上手
41 0
|
2月前
|
算法
MATLAB | 插值算法 | 一维Lagrange插值法 | 附数据和出图代码 | 直接上手
MATLAB | 插值算法 | 一维Lagrange插值法 | 附数据和出图代码 | 直接上手
23 0