1. 阿里云>
  2. 云栖社区>
  3. 主题地图>
  4. D>
  5. 大数据处理公司

当前主题:大数据处理公司

大数据处理公司相关的博客

查看更多 写博客

为什么Flink会成为下一代大数据处理框架的标准?

导读:本文将告诉你Flink是什么,以及为什么Flink会成为下一代大数据处理框架的标准。 01 什么是Flink? 在当前数据量激增传统的时代,不同的业务场景都有大量的业务数据产生,对于这些不断产生的数据应该如何进行有效地处理,成为当下大多数公司所面临的问

阅读全文

探寻流式计算

一、静态数据和流数据 静态数据:为了支持决策分析而构建的数据仓库系统,其中存放的大量历史数据就是静态数据。 流数据:以大量、快速、时变的流形式持续到达的数据。(例如:实时产生的日志、用户实时交易信息) 流数据具有以下特点: (1)、数据快速持续到达,潜在大小

阅读全文

Apache Spark中国技术交流社区历次直播回顾(持续更新)

8月28日【Spark Streaming SQL流式处理简介】 主讲人:云魄,阿里云E-MapReduce 高级开发工程师,专注于流式计算,Spark Contributor,开源爱好者 简介:本次直播将简要介绍EMR Spark Streaming SQ

阅读全文

Apache Spark中国技术交流社区历次直播回顾(持续更新)

8月28日【Spark Streaming SQL流式处理简介】 主讲人:云魄,阿里云E-MapReduce 高级开发工程师,专注于流式计算,Spark Contributor,开源爱好者 简介:本次直播将简要介绍EMR Spark Streaming SQ

阅读全文

敏捷AI | NLP技术在宜信业务中的实践【构建用户画像篇】

高级场景之构建客户画像 在许多企业中,每天业务人员和客户的沟通都会产生大量记录,这些记录可能包括了客服的沟通数据(通话记录、通话小结),也可能包括了各式各样的报告数据(陪访报告、征信报告等)(见图1)。 图1 业务人员与客户产生沟通记录 前者可能口语会多一些

阅读全文

阿里巴巴飞天大数据架构体系与Hadoop生态系统

很多人问阿里的飞天大数据平台、云梯2、MaxCompute、实时计算到底是什么,和自建Hadoop平台有什么区别。 先说Hadoop 什么是Hadoop? Hadoop是一个开源、高可靠、可扩展的分布式大数据计算框架系统,主要用来解决海量数据的存储、分析、分

阅读全文

如果你也想做实时数仓…

作者:郭华(付空) 数据仓库也是公司数据发展到一定规模后必然会提供的一种基础服务,数据仓库的建设也是“数据智能”中必不可少的一环。本文将从数据仓库的简介、经历了怎样的发展、如何建设、架构演变、应用案例以及实时数仓与离线数仓的对比六个方面全面分享关于数仓的详细

阅读全文

如果你也想做实时数仓…

作者:郭华(付空) 数据仓库也是公司数据发展到一定规模后必然会提供的一种基础服务,数据仓库的建设也是“数据智能”中必不可少的一环。本文将从数据仓库的简介、经历了怎样的发展、如何建设、架构演变、应用案例以及实时数仓与离线数仓的对比六个方面全面分享关于数仓的详细

阅读全文

大数据处理公司相关问答

查看更多 提问题

人脸大数据系统发展的趋势是什么?

  随着机器视觉技术及其相关技术的不断提升,无论是图像结构化的算法还是算力均在进步,虽然算法的进步已有限。而人工智能技术的螺旋上升极有可能会将技术热点从图像识别带入到机器人、语言识别、自然语言处理和专家系统这四个大领域中,因此未来人脸大数据系统的发展将主要

阅读全文

云计算与大数据处理

首先,云计算是提取大数据的前提。   信息社会,数据量在不断增长,技术在不断进步,大部分企业都能通过大数据获得额外利益。在海量数据的前提下,如果提取、处理和利用数据的成本超过了数据价值本身,那么有价值相当于没价值。来自公有云、私有云以及混合云之上的强大的云计

阅读全文

公司选择了使用阿里云大数据计算服务(MaxCompute,原 ODPS)进行数据 仓库建设,由一个多人的团队负责实施和运维。为了更好的进行角色分工、数据权 限、多用户协同等管理工作,同时还能实现任务的自动调度、任务监控、错误告警 及处理等运维工作,并且需要有一个简单易用的开发环境,那用客户端作为主要开发工具更高效便捷还是用管理控制台更高效便捷呢。

公司选择了使用阿里云大数据计算服务(MaxCompute,原 ODPS)进行数据 仓库建设,由一个多人的团队负责实施和运维。为了更好的进行角色分工、数据权 限、多用户协同等管理工作,同时还能实现任务的自动调度、任务监控、错误告警 及处理等运维工作,并且需要有一

阅读全文

PHP怎么直接处理MySQL中的大量数据

有时候需要独立处理数据库中的大量数据,这个时候就自己写代码去处理,但是执行的时候,很耗资源,这个一执行,基本上网站的其它功能就全都卡在那里,动不了了,大家有什么好的解决方案吗? 实际情况是这样的,公司A系统中,有电话录音文件,这些录音文件,需要和B系统中的用

阅读全文

企业大数据平台仓库架构建设思路【精品问答集锦】

本期请来了阿里云高级技术专家李金波(介然)直播分享企业大数据平台仓库架构建设思路 直播简介 随着互联网规模不断的扩大,数据也在爆炸式地增长,各种结构化、半结构化、非结构化数据的产生,越来越多的企业开始在大数据平台下进行数据处理。作为大数据应用的基础-数

阅读全文

我们公司现在数据量过大,准备将关系数据库MySQL中的数据迁移到阿里云上的MaxCompute(ODPS)中,需求1、起到历史数据备份的作用,按天增量同步。2、将数据处理后生成报表并展示。MaxCompute是否可以支持。

我们公司现在数据量过大,准备将关系数据库MySQL中的数据迁移到阿里云上的MaxCompute(ODPS)中,需求1、起到历史数据备份的作用,按天增量同步。2、将数据处理后生成报表并展示。MaxCompute是否可以支持。

阅读全文

基于大数据的全球电商系统架构性能优化【精品问答集锦】

本期请来了阿里巴巴速卖通技术总监郭东白(阿白)直播分享基于大数据的全球电商系统架构性能优化 阿里巴巴速卖通技术总监。主要从事云计算和互联网电商领域的研究。有十六年大型软件系统研发和架构经验,对跨大洲、高可用、高流量服务端软件架构和研发有深入研究。领导

阅读全文

云数据库十大经典案例总结和反思【精品问答集锦】

本期请来了阿里云资深DBA专家罗龙九(玄惭)直播分享了云数据库十大经典案例总结和反思 直播简介 《云数据库十大经典案例》以MySQL数据库为例,收集整理了自RDS成立至今,用户在使用RDS过程中最常见的问题,包括:索引,sql优化,锁,延迟,参数优化,

阅读全文