为政府、传统企业提供大数据解决方案,数之联的核心优势是算法

简介:

大数据作为企业的一项重要资产越来越受重视。最早运用大数据的是BAT等互联网巨头,后来延伸到金融、运营商等领域,而在政府、军工、工业领域,对数据的管理依然相对传统和封闭,不同业务系统的数据无法打通,数据孤岛问题严重,更无从最大限度释放数据价值。

数之联是一家大数据解决方案提供商,主要为政府、传统企业提供数据采集、存储、治理、分析、挖掘、应用和可视化等大数据全产业链综合服务。

我们知道,数据分析之前需要按照业务逻辑梳理清楚。在过去的信息化建设过程中,政府、企业积累了几十上百个业务系统,数据分散,同时存在着一致性、完整性、准确性不达标等质量问题。数之联会同企业老板沟通,先进行IT系统的顶层规划,帮助企业了解未来3~5年需要建立怎样的系统、成本效益如何等,再按照一定的数据标准建立数据中心,将用户内部数据按照新的标准导进来,并按照不同的业务逻辑归类。对于不同系统出现的相同字段,平台会进行交叉验证,以此提高数据的完整性和准确性。

数据梳理好之后,还需要挖掘数据的资产价值。很多企业在这方面并没有足够的技术能力,对数据的分析多是拍脑袋或凭经验决策,比如生产哪些产品、投放到哪些地区、不同地区对某个商品的喜好程度,等等。而如果能把企业的内外部数据拿来分析,可以做很多事情。比如根据线上线下的销售数据、评论信息、营销数据等,为企业的生产提供决策;在生产加工过程中,根据日常生产设备的数据,比如电流电压、震动传感器数据等,了解生产状态,预测宕机等。

数之联目前通过爬虫技术积累了8000万条工商数据,300亿条微博关系网络数据、5000万招投标数据、3500万人才简历数据、1.7亿条手机APP数据、3亿条网购用户消费行为数据,等等。根据用户的需求,可以将相关的外部数据同企业内部数据打通,提供不同维度的数据分析。

数之联旗下产品主要用两个,一是iCloudUnion,这是一个算法集成平台,包含150种算法,能把数据挖掘的能力开放出去,帮助企业做编程,缩短在数据挖掘和分析上的时间;另外,为了帮助用户直观理解iCloudUnion平台的价值,数之联开发了配套的xDataInsight商业智能分析平台,将数据分析结果通过报表、树状图、饼状图呈现出来,在大屏上进行展示。

对于中小客户,数之联提供标准化的产品iCloudUnion平台,用户可以自行导入数据并进行分析。对于有定制化需求的大客户,数之联也会提供私有化部署,并针对用户需求开发不同的模型。

举个例子,数之联目前在为某大型酒业集团提供两类服务。一是营销系统,帮助其建设从线下到线上的营销体系,监控不同渠道的数据,提供竞品信息等情报分析;二是通过分析生产大数据优化生产,这块之前主要靠人工记录,比如酿酒不同阶段的温度、湿度、加水量等,数之联目前在针对某个车间现有的存量数据做分析,未来将逐步增加理化指标、微生物数据等,最终分析出不同指标对口感的影响,从而更好地指导生产。

其它应用场景还包括,根据历史质检信息、企业诉讼信息等,帮助食药监局提高抽检率;根据历史判决文书,为法官提供同类案件裁判建议;等等。

尽管不同行业业务复杂多样,但算法和技术相对固定。在服务一个行业第一家用户时,数之联会根据用户需求训练模型,之后则能快速复制到同类企业。

目前,为政府、传统企业提供数据挖掘分析的还包括IBM,不过,数之联的优势在于本地化服务,同时支持定制化,IBM通常仅提供通用产品,产品的渠道商也没有能力做定制算法;浪潮云也相继推出政务云、城市云,但其重点在硬件上,相当于建立一个云平台,把用户的数据搬上去,数之联则主要做云平台之上的数据分析,提供核心算法,挖掘数据价值。

据了解,针对客户的私有化部署,从谈判到落地周期大概为3~6个月。产品根据节点或项目的实施成本收费,客单价在几万到几百万/年不等。目前已服务过40个左右客户,服务、产品和行业解决方案已覆盖国内主要城市和标杆政府企业,通过参控股10余家不同地域和领域的大数据企业形成了集团化经营态势。

团队方面,目前公司有130多人,70%为技术研发人员。创始人周涛是80后,27岁被聘为电子科技大学教授,主要研究方向为大数据挖掘和复杂性科学,共发表200余篇SCI论文;董事长兼CFO傅彦,博士生导师,从事14年数据挖掘领域的研究与应用,在国内外发表论文70余篇,被SCI、EI收录论文50余篇;CTO方育柯,主要从事计算机科学与大数据等交叉领域的研究工作,曾担任华为大数据产品部架构师,负责并参与金融、运营商等领域的多个大数据分析挖掘项目。核心团队来自2002年成立的电子科技大学大数据研究中心,拥有14年数据挖掘和深度机器学习经验、10余项自主发明专利及软件著作权。

公司已于去年10月完成数千万元A轮融资,鼎兴量子领投、国中创投等跟投,投后估值超4亿。

本文转自d1net(转载)

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
4天前
|
运维 供应链 大数据
数据之势丨从“看数”到“用数”,百年制造企业用大数据实现“降本增效”
目前,松下中国旗下的64家法人公司已经有21家加入了新的IT架构中,为松下集团在中国及东北亚地区节约了超过30%的总成本,减少了近50%的交付时间,同时,大幅降低了系统的故障率。
|
25天前
|
存储 NoSQL 大数据
新型数据库技术在大数据分析中的应用与优势探究
随着大数据时代的到来,传统数据库技术已经无法满足海量数据处理的需求。本文将探讨新型数据库技术在大数据分析中的应用情况及其所带来的优势,为读者解析数据库领域的最新发展趋势。
|
2月前
|
存储 前端开发 算法
加密算法在网络通信中的应用及优势分析
本文将探讨加密算法在网络通信中的重要性,以及不同加密算法的应用和优势。通过对前端、后端、Java、Python、C、PHP、Go等多种技术的分析,我们将了解在日益增长的网络威胁下,加密算法对于确保数据安全和隐私保护的必要性。
|
4月前
|
分布式计算 大数据 数据处理
大数据开发企业级案例__某通信企业数据处理需求(建议收藏)
大数据开发企业级案例__某通信企业数据处理需求(建议收藏)
33 0
|
4月前
|
存储 人工智能 安全
AI大数据分析对企业安全隐私的保护非常重要
AI大数据分析在提供企业发展和决策支持的同时,也涉及到大量的企业数据和用户隐私信息。因此,保护企业安全隐私是非常重要的。
|
4月前
|
分布式计算 算法 搜索推荐
阿里巴巴内部:全技术栈PPT分享(架构篇+算法篇+大数据)
我只截图不说话,PPT大全,氛围研发篇、算法篇、大数据、Java后端架构!除了大家熟悉的交易、支付场景外,支撑起阿里双十一交易1682亿元的“超级工程”其实包括以下但不限于客服、搜索、推荐、广告、库存、物流、云计算等。 Java核心技术栈:覆盖了JVM、锁、并发、Java反射、Spring原理、微服务、Zookeeper、数据库、数据结构等大量知识点。 大数据:Spark、Hadoop
|
4月前
|
分布式计算 资源调度 大数据
【大数据技术Hadoop+Spark】Spark架构、原理、优势、生态系统等讲解(图文解释)
【大数据技术Hadoop+Spark】Spark架构、原理、优势、生态系统等讲解(图文解释)
133 0
|
4月前
|
消息中间件 存储 算法
【云计算与大数据技术】数据编码LZSS算法、Snappy压缩库及分布式通信系统的讲解(图文解释 超详细)
【云计算与大数据技术】数据编码LZSS算法、Snappy压缩库及分布式通信系统的讲解(图文解释 超详细)
69 0
|
4月前
|
存储 安全 大数据
【云计算与大数据技术】云交付模型、云部署模型、云计算优势与挑战、应用的讲解(超详细必看)
【云计算与大数据技术】云交付模型、云部署模型、云计算优势与挑战、应用的讲解(超详细必看)
338 0
|
4月前
|
存储 算法 搜索推荐
大数据管理的重要思想和算法总结----排序(上)
大数据管理的重要思想和算法总结----排序(上)
41 0