1. 阿里云>
  2. 云栖社区>
  3. 主题地图>
  4. D>
  5. 大数据信息

当前主题:大数据信息

阿里云MaxCompute 2019-9月刊

您好,MaxCompute 2019.9月刊为您带来9月产品、技术最新动态,欢迎阅读。订阅 MaxCompute 月刊 导读 【重要发布】9月产品重要发布 【文档更新】9月重要文档更新推荐 【干货精选】9月精选技术文章推荐 【重点活动预告】10月重点活动预告

阅读全文

阿里巴巴高级技术专家章剑锋:大数据发展的 8 个要点

笔者从 2008 年开始工作到现在也有 11 个年头了,一路走来都在和数据打交道,做过大数据底层框架内核的开发(Hadoop,Pig,Tez,Spark,Livy),也做过上层大数据应用开发(写 MapReduce Job 做 ETL ,用 Hive 做 A

阅读全文

「最有用」的特殊大数据:一文看懂文本信息系统的概念框架及功能

导读:作为一种特殊的大数据,文本数据泛指各种以自然语言形式存在的数据。 目前,我们正处在一个以大数据与人工智能技术为核心的新的工业革命时代,其主要特征是大量各种可利用的数据可以视为一种特殊的生产资料,经过高效的智能数据分析与挖掘以及机器学习等人工智能技术处理

阅读全文

数据分析还是文本分析?文本分析的优势在哪里

非结构化数据是相对于结构化数据而言的概念,包括所有格式的文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息等等,文本分析能够为商业活动提供关键性的知识问题。 在具体的企业活动中,非结构化的数据所占比例更高,这些非结构化的数据研究也十分重要。

阅读全文

将阿里云产品整合成为高校课程实训的训练营产品的实践(一)

从去年开始,我们与阿里云智能大学的伙伴们共同设计了一款适合于高校学生建立数据思维和数据开发分析能力的训练营产品,并且已经在多所高校实施,近期也做为某地政府支持当地新兴技术人才培养的重点项目进行落地实施,这在个过程中,我们和阿里的伙伴们共同探讨、研究、碰撞想法

阅读全文

智博会 | 奇点云全方位展示“数据智能+”应用成果

8月26日-29日,2019中国国际智能产业博览会(简称“智博会”)在山城重庆如期举行。本次智博会以「智能化:为经济赋能、为生活添彩」为主题。**奇点云作为人工智能大数据领域前沿的高科技创新企业,携「数据智能+零售」、「数据智能+政府」、「数据智能+车企」等

阅读全文

选型宝分享Informatica中国数据管理5大经典案例

写在前面 5月18日,选型直播曾做过一期题为“移动+社交时代,如何治理大数据洪水?”的节目,在那期节目中,Informatica北方区总经理李晨先生系统地介绍了Informatica公司的背景、大数据治理的完整框架,以及最新的“智能数据湖”解决方案。 节目播

阅读全文

大快搜索黑科技亮相2019(第四届)大数据产业生态大会

深耕核心技术·赋能数字化转型 ——大快搜索黑科技亮相2019(第四届)大数据产业生态大会,斩获多项大奖。 图1:2019(第四届)大数据产业生态大会 8月1日,以“激活数据价值 释放数据原力”为主题的“2019(第四届)大数据产业生态大会”在北京拉开序幕。北

阅读全文

大数据信息相关问答

查看更多 提问题

在maxcompute下提交原生pyspark任务 报错odps-0420031 具体情况如下

刚刚开始接触阿里云大数据开发平台,通过官方文档看到,是完全支持原生spark的任务的提交,于是按照文档的环境配置,搭建了spark-2.3.0版本的客户端环境,但是在提交任务的过程中,已local[N]的模式提交,运行spark下的example的demo

阅读全文

HBase2.x的RIT问题

HBase2.x版本偶然遇到RIT问题,想了各种办法都没法消除。包括unassign(对应CLOSING状态)操作、hbck -repair(不支持)、删除Zookeeper下的rit信息节点(不存在),最终以强制删除表进行问题解决,请问有其他方法解决RIT的

阅读全文

人脸大数据系统发展的趋势是什么?

  随着机器视觉技术及其相关技术的不断提升,无论是图像结构化的算法还是算力均在进步,虽然算法的进步已有限。而人工智能技术的螺旋上升极有可能会将技术热点从图像识别带入到机器人、语言识别、自然语言处理和专家系统这四个大领域中,因此未来人脸大数据系统的发展将主要

阅读全文

Flink ValueState<JSONObject> checkpoint失败,导致状态重置

## 问题 想用flink 的valueState 加上ttl的特性来做中间状态的存储,但是发现假如直接用ValueState<JSONOBJECT>来保存中间状态是没问题的,但是假如加上TTL的特性之后checkpoint就失败了,导致无法使用。 ##

阅读全文

Window.rowsBetween - 仅考虑满足特定条件的行(例如,不为null)

我有一个Spark DataFrame,其列包含不是每行的值,而是仅针对某些行(在某种程度上有规律地,例如,基于id的每5到10行)。 现在,我想将一个窗口函数应用于包含值的行,这些行包含前两个行,这两行也包含值(所以基本上假装所有包含空值的行都不存在=

阅读全文

求企业大数据解决方案

前每个业务的数据库都是保留一个季度的数据库,其他备份起来; 要求: 财务要求查询今年全年的订单的销售明细预估数据量20亿左右,还有库存信息,商品信息等现在都要有关联查询,所以也要数据汇总导入; 求解这种大数据的环境要求,要满足财务的明细和汇总查询

阅读全文

如何建立大数据存储分析和共享平台

抽毕业论文题目的时候抽到了这个,我学的专业是物理学,对这方面几乎没什么了解,想请教这里的大牛,该从哪里开始学,或者应该怎么做这个项目,如果可以的话,想请一个懂这方面的老师,辅导我完成一下论文,肯定不会是无偿的,真心真心球球大家帮忙。 具体的题目和要求是:

阅读全文

上传数据遇到困难 = = 大数据(数加)机器学习PAI

本人在使用大数据(数加)机器学习PAI平台,想用此工具进行数据分析,在上传数据,创建表结构的时候遇到了困难,提示错误信息如下,因为并不是很理解,请求大神们指教!! SQL Syntax Error,语法有错吗?我并没有进行命令行上传数据,直接使用的IDE端进行

阅读全文