深耕大数据市场,所问数据打造深度学习数据分析与预测引擎

简介:

卖什么?卖多少钱?

这些是每一个线上零售卖家都会遇到的问题。在大数据时代开始之前,答案都是基于个人经验做的判断;随着近年数据分析平台纷纷上线,卖家们也渐渐开始接受多维度、不同时间粒度的数据分析服务,包括流量、销量、广告、仓储、配送、售后分析等等,一定程度上提升了运营管理能力。

但作为商家,最核心的两问,依然没有得到简单有效的解答。

所问数据(Asking Data)想以企业级服务数据平台的形式,为线上零售产业提供一款数据分析与预测的引擎,辅助商家进行决策。具体来说,平台的核心功能包括对具体行业、商品、店铺和标签四大维度的分析,以及对潜力爆品的预测——后者,是市场上首次出现的服务。第一个上线的平台,是对美国跨境电商Wish全品类商品进行数据分析的易选品。

深耕大数据市场,所问数据打造深度学习数据分析与预测引擎

第一个上线的平台,是对美国跨境电商Wish全品类商品进行数据分析的易选品。

做大数据服务的核心有二,数据源和技术。所问的数据来自全网抓取,但不同于许多大数据分析公司,所问的数据处理分析流程,从去除噪音、识别有效数据的清洗,到多来源多格式数据的转换合并,全部由机器进行,不需要任何人工介入。值得一提的是,包括京东在内的一些电商平台,并没有对外开放的产品销量数据,所问是通过对商品销售的不同维度信息进行抓取和分析推测获得的销量数据。

数据处理后的分析之外,所问最核心的技术是基于长期的产业经验和深度学习算法开发经验、自主研发的回归类预测模型。所问的创始人兼CEO颜鹏说,这个技术不止是国内、就是在全球范围内,现在都是很少见的。据悉,易选品平台对产品销量的预测,准确率在80%-90%。目前,所问已经获得公牛集团这样的付费大客户(以监控的平台和类目维度来收费,具体数额暂不方便透露),以及近300家中小型企业的使用。目前,易选品在免费试用阶段,在市场和产品都更加成熟后,会开始与已经存在的大数据分析平台一样、开始按年收取平台使用费。

深耕大数据市场,所问数据打造深度学习数据分析与预测引擎

平台每天会监控所有销售商品的信息,根据商品在上架之后一段时间内的表现,综合考虑商品本身及行业竞争等多维度数据,通过回归预测算法模型,得出从类目到单品的“潜力指数”(百分制)。指数越高,说明该类商品在未来一段时间成为爆款的可能性就越高。

艾瑞咨询的报告显示,2016年中国电子商务市场交易规模20.2万亿元,其中网络购物市场交易规模达4.7万亿元,较前年增长23.9%,预计在2017年增速为19.1%,总规模达5.6万亿元。根据阿里研究院的报告,在这个大市场中,跨境电商零售的细分市场总规模达7512亿元,其中出口额5032亿元,预计未来五年年均增速约37%,在2020年实现2.16万亿元的出口额。换言之,所问立足于一个4.7万亿的市场,并选择了其中5千亿的细分市场切入。

电商市场上的大数据分析公司并不少,有巨头级别的阿里云市场、京东数据罗盘,也有入场较早、商业化程度非常高的新兴公司如百分点科技。但深耕跨境电商这一细分市场的目前并不多,且竞品的数据服务大多仅限于数据的收集和可视化呈现。颜鹏告诉36氪,所问最大的优势也是壁垒就是技术,因为精准的选品和定价预测,对于深度学习算法开发的技术门槛非常高,且需要对电商市场独到的理解和判断,这些是目前市面上没有公司可以做到的。哪怕在较为成熟的海外市场,能够实现高精度回归预测的,也只有为数不多的公司——其中包括颜鹏曾经供职的3M公司。

深耕大数据市场,所问数据打造深度学习数据分析与预测引擎

中国跨境电商零售市场规模及年均增速

所问数据创始人兼CEO颜鹏,博士毕业于美国North Dakota State University,曾供职于美国3M、IBM等消费公司,在大数据挖掘和分布式计算有多年经验,并对消费行业非常了解。创始人兼CTO丁圣超,是中科院计算所计算机博士、美国加州大学圣地亚哥分校博士后,曾从事基因表达水平预测的研究。团队现在共有26人,其中19人为技术人员。

公司近期计划开始A轮融资。融资将主要用于团队在技术和市场方面人才的扩充。此前,公司曾获九合创投数百万的天使轮融资,和洪泰领投的千万级Pre-A轮融资。

卖什么?卖多少钱?

这些是每一个线上零售卖家都会遇到的问题。在大数据时代开始之前,答案都是基于个人经验做的判断;随着近年数据分析平台纷纷上线,卖家们也渐渐开始接受多维度、不同时间粒度的数据分析服务,包括流量、销量、广告、仓储、配送、售后分析等等,一定程度上提升了运营管理能力。

但作为商家,最核心的两问,依然没有得到简单有效的解答。

所问数据(Asking Data)想以企业级服务数据平台的形式,为线上零售产业提供一款数据分析与预测的引擎,辅助商家进行决策。具体来说,平台的核心功能包括对具体行业、商品、店铺和标签四大维度的分析,以及对潜力爆品的预测——后者,是市场上首次出现的服务。第一个上线的平台,是对美国跨境电商Wish全品类商品进行数据分析的易选品。

第一个上线的平台,是对美国跨境电商Wish全品类商品进行数据分析的易选品。

做大数据服务的核心有二,数据源和技术。所问的数据来自全网抓取,但不同于许多大数据分析公司,所问的数据处理分析流程,从去除噪音、识别有效数据的清洗,到多来源多格式数据的转换合并,全部由机器进行,不需要任何人工介入。值得一提的是,包括京东在内的一些电商平台,并没有对外开放的产品销量数据,所问是通过对商品销售的不同维度信息进行抓取和分析推测获得的销量数据。

数据处理后的分析之外,所问最核心的技术是基于长期的产业经验和深度学习算法开发经验、自主研发的回归类预测模型。所问的创始人兼CEO颜鹏说,这个技术不止是国内、就是在全球范围内,现在都是很少见的。据悉,易选品平台对产品销量的预测,准确率在80%-90%。目前,所问已经获得公牛集团这样的付费大客户(以监控的平台和类目维度来收费,具体数额暂不方便透露),以及近300家中小型企业的使用。目前,易选品在免费试用阶段,在市场和产品都更加成熟后,会开始与已经存在的大数据分析平台一样、开始按年收取平台使用费。

平台每天会监控所有销售商品的信息,根据商品在上架之后一段时间内的表现,综合考虑商品本身及行业竞争等多维度数据,通过回归预测算法模型,得出从类目到单品的“潜力指数”(百分制)。指数越高,说明该类商品在未来一段时间成为爆款的可能性就越高。

艾瑞咨询的报告显示,2016年中国电子商务市场交易规模20.2万亿元,其中网络购物市场交易规模达4.7万亿元,较前年增长23.9%,预计在2017年增速为19.1%,总规模达5.6万亿元。根据阿里研究院的报告,在这个大市场中,跨境电商零售的细分市场总规模达7512亿元,其中出口额5032亿元,预计未来五年年均增速约37%,在2020年实现2.16万亿元的出口额。换言之,所问立足于一个4.7万亿的市场,并选择了其中5千亿的细分市场切入。

电商市场上的大数据分析公司并不少,有巨头级别的阿里云市场、京东数据罗盘,也有入场较早、商业化程度非常高的新兴公司如百分点科技。但深耕跨境电商这一细分市场的目前并不多,且竞品的数据服务大多仅限于数据的收集和可视化呈现。颜鹏告诉36氪,所问最大的优势也是壁垒就是技术,因为精准的选品和定价预测,对于深度学习算法开发的技术门槛非常高,且需要对电商市场独到的理解和判断,这些是目前市面上没有公司可以做到的。哪怕在较为成熟的海外市场,能够实现高精度回归预测的,也只有为数不多的公司——其中包括颜鹏曾经供职的3M公司。

中国跨境电商零售市场规模及年均增速

所问数据创始人兼CEO颜鹏,博士毕业于美国North Dakota State University,曾供职于美国3M、IBM等消费公司,在大数据挖掘和分布式计算有多年经验,并对消费行业非常了解。创始人兼CTO丁圣超,是中科院计算所计算机博士、美国加州大学圣地亚哥分校博士后,曾从事基因表达水平预测的研究。团队现在共有26人,其中19人为技术人员。

公司近期计划开始A轮融资。融资将主要用于团队在技术和市场方面人才的扩充。此前,公司曾获九合创投数百万的天使轮融资,和洪泰领投的千万级Pre-A轮融资。 


  

本文转自d1net(转载)


相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
1月前
|
自然语言处理 小程序 数据挖掘
数据分析实战-Python实现博客评论数据的情感分析
数据分析实战-Python实现博客评论数据的情感分析
95 0
|
4天前
|
数据采集 搜索推荐 大数据
大数据中的人为数据
【4月更文挑战第11天】人为数据,源于人类活动,如在线行为和社交互动,是大数据的关键部分,用于理解人类行为、预测趋势和策略制定。数据具多样性、实时性和动态性,广泛应用于市场营销和社交媒体分析。然而,数据真实性、用户隐私和处理复杂性构成挑战。解决策略包括数据质量控制、采用先进技术、强化数据安全和培养专业人才,以充分发挥其潜力。
10 3
|
6天前
|
运维 供应链 大数据
数据之势丨从“看数”到“用数”,百年制造企业用大数据实现“降本增效”
目前,松下中国旗下的64家法人公司已经有21家加入了新的IT架构中,为松下集团在中国及东北亚地区节约了超过30%的总成本,减少了近50%的交付时间,同时,大幅降低了系统的故障率。
|
16天前
|
人工智能 监控 数据可视化
【Python】Python商业公司贸易业务数据分析可视化(数据+源码)【独一无二】
【Python】Python商业公司贸易业务数据分析可视化(数据+源码)【独一无二】
|
1月前
|
分布式计算 DataWorks 关系型数据库
DataWorks报错问题之dataworks同步rds数据到maxcompute时报错如何解决
DataWorks是阿里云提供的一站式大数据开发与管理平台,支持数据集成、数据开发、数据治理等功能;在本汇总中,我们梳理了DataWorks产品在使用过程中经常遇到的问题及解答,以助用户在数据处理和分析工作中提高效率,降低难度。
|
1月前
|
存储 数据采集 数据挖掘
python数据分析——数据分类汇总与统计
数据分类汇总与统计是指将大量的数据按照不同的分类方式进行整理和归纳,然后对这些数据进行统计分析,以便于更好地了解数据的特点和规律。
56 1
|
1月前
|
存储 SQL 数据挖掘
python数据分析——数据的选择和运算
在数据分析中,数据的选择和运算是非常重要的步骤。数据选择和运算是数据分析中的基础工作,正确和高效的选择和运算方法对于数据分析结果的准确性和速度至关重要。
42 0
|
1月前
|
JSON 数据挖掘 数据格式
python数据分析——数据分析的数据的导入和导出
数据分析的数据的导入和导出是数据分析流程中至关重要的两个环节,它们直接影响到数据分析的准确性和效率。在数据导入阶段,首先要确保数据的来源可靠、格式统一,并且能够满足分析需求。这通常涉及到数据清洗和预处理的工作,比如去除重复数据、处理缺失值、转换数据类型等,以确保数据的完整性和一致性。
36 0
|
1月前
|
算法 大数据 数据挖掘
python数据分析——大数据伦理风险分析
大数据伦理风险分析在当前数字化快速发展的背景下显得尤为重要。随着大数据技术的广泛应用,企业、政府以及个人都在不断地产生、收集和分析海量数据。然而,这些数据的利用也带来了诸多伦理风险,如隐私泄露、数据滥用、算法偏见等。因此,对大数据伦理风险进行深入分析,并采取相应的防范措施,对于保障数据安全、维护社会公平正义具有重要意义。
47 0
|
1月前
|
存储 大数据 数据挖掘
python数据分析——大数据和云计算
大数据和云计算作为当代信息技术的两大核心驱动力,正在以前所未有的速度改变着我们的生活、工作和思维方式。它们不仅为各行各业的创新提供了强大的技术支持,更是推动了整个社会的数字化转型。 从大数据的角度来看,它的核心价值在于通过对海量数据的收集、存储、分析和挖掘,发现其中的关联性和趋势,从而为决策提供更为科学、精准的依据。无论是商业领域的市场预测、消费者行为分析,还是公共服务领域的城市规划、交通管理,大数据都发挥着不可或缺的作用。同时,随着物联网、传感器等技术的普及,大数据的来源和种类也在不断扩展,这使得我们能够更全面地认识世界,把握规律。
47 0