大数据基础设施建设需要得到重视 | 记清华大数据“应用·创新”讲座

简介:

“大数据基础设施是面向数据采集、数据分析和数据应用的创新性系统工程。它一方面指支撑大数据应用和大数据产业的基础设施,另一方面指用大数据和人工智能的方法,解决基础设施运行过程中的问题。 ”清华-青岛数据科学研究院(以下称“数据院”)大数据基础设施研究中心副主任赵强博士说到。数据时代,基础设施建设已经成为数据科学发展的瓶颈,提高人们对大数据基础设施建设重要性的认知迫在眉睫。10月26日新一期 清华大数据“应用·创新”讲座上,数据院特地邀请赵强博士做了 “语义视角下的跨学科与跨界数据认知”的主题演讲,为大家普及了大数据基础设施建设的意义,并强调在数据技术飞速发展的时代,基础设施建设的重要性。

1

活动当天,数据院的工作人员早早就布置好了场地,确保活动现场及活动直播能够正常进行。当天天气温度较低,伴有重度雾霾,许多清华校内学生、大数据领域的从业者依旧纷纷在活动之前就赶到了现场,只为找到更靠前的位置,方便与嘉宾互动交流。活动伊始,数据院作为主办方首先感谢了大家对此次活动的关注和支持,随后,赵强博士以语义视角切入,从大数据基础设施、社会化大规模实验、场景数据化技术3个方面分享了自己对跨学科与跨界数据的思考。赵强博士的演讲,带领活动观众深入了解到大数据基础设施建设的研究内容、应用领域及发展意义。

2

大数据分析领域的从业者李文博表示,“我一直都很关注大数据的实际应用,一直以来了解和接触较多的是不同的数据技术在各领域的应用,参与本期讲座,让我看到了在大数据各类技术之下,还存在着基础设施建设的问题。 听了赵老师专业透彻的介绍和分析,我意识到了大数据基础设施建设的重要性,同时了解到想要做好基础设施建设,需要进行跨学科的交流合作,从事该领域的人才必须具备数据科学思维和技术场景化意识。我将会继续关注这一领域的新动态,希望大数据基础设施建设能够为技术提供强有力的支持。”

演讲期间,大家积极向赵强博士提问,有多位观众还表达了对大数据基础设施研究中心(以下称“中心”)的好奇,对此,赵强博士为大家详细介绍了中心的研究方向及成立目标。 大数据基础设施研究中心是2017年8月17日成立的,围绕大数据基础设施建设领域进行研究,与数据院已有的工业大数据、经济金融数据、智慧城市大数据等研究方向的科研中心进行横向合作,孵化社会化大规模数据实验室,从而推进大数据基础设施建设,支持社会数据行业向前发展。数据院此次讲座邀请中心副主任赵强博士来给大家做分享,正是为了提高社会对大数据基础设施的认知、推动数据基础设施建设、促进数据开放共享、推动人才建设。数据院为赵强博士颁发了讲座嘉宾特邀证书,欢迎赵强博士后续再为大家做精彩的专题分享。

3

本次讲座,吸引了来自互联网、传媒、金融等多个行业的从业者以及来自各个高校化学工程、公共管理、计算机等多个院系的学生参与。清华大学化学工程系的研究生阎建辉从本科阶段起就对大数据技术有着浓厚兴趣,他对我们说: “此次讲座让我深化了对大数据基础设施的认识,通过了解大数据平台从上到下的架构,能够探究优化处理平台底层的方法。这是一个全新的视角,对我很有启发。”本科期间,阎建辉对大数据技术的接触偏工具实用性,如今,他计划深入学习数据科学的基础知识,并参与了清华大数据能力提升项目。 参加这一期讲座,让他了解了基础设施建设对推动数据科学发展的重要性,也意识到基础设施的建设急需同时具备技术与场景业务能力的跨学科人才,这也为他自身能力的提升找到了新的方向,他表示希望能经常参与此类讲座,丰富自己的综合知识。

原文发布时间为:2017-10-30
本文来自云栖社区合作伙伴“数据派THU”,了解相关信息可以关注“数据派THU”微信公众号

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
1月前
|
SQL 分布式计算 数据可视化
Tableau与大数据:可视化工具在大数据分析中的应用
【4月更文挑战第8天】Tableau是一款领先的数据可视化工具,擅长于大数据分析,提供广泛的数据连接器,支持多源整合。它与Hadoop、Spark等深度集成,实现高效大数据处理。Tableau的拖拽式界面和交互式分析功能使得非技术人员也能轻松探索数据。在实战中,Tableau用于业务监控、数据storytelling和自助式分析,推动数据民主化,提升决策效率。未来,Tableau将持续创新,扩展生态系统,并保障数据安全与合规性,助力企业最大化数据价值。
40 0
|
1月前
|
存储 消息中间件 监控
【Flume】Flume在大数据分析领域的应用
【4月更文挑战第4天】【Flume】Flume在大数据分析领域的应用
|
2月前
|
Cloud Native 数据处理 云计算
探索云原生技术在大数据分析中的应用
随着云计算技术的不断发展,云原生架构作为一种全新的软件开发和部署模式,正逐渐引起企业的广泛关注。本文将探讨云原生技术在大数据分析领域的应用,介绍其优势与挑战,并探讨如何利用云原生技术提升大数据分析的效率和可靠性。
|
1月前
|
搜索推荐 大数据 数据安全/隐私保护
大数据的应用领域
【4月更文挑战第10天】大数据已深入金融(风险评估、欺诈检测)、医疗(精准医疗、疾病预测)、公共服务(交通管理、灾害预测)、电子商务(客户分析、个性化推荐)、制造业(生产控制、优化)及农业(资源配置、生产效率)等多个领域。随着技术进步,应用范围将持续扩展,但需关注隐私保护和数据安全。
16 3
|
2月前
|
数据采集 分布式计算 大数据
Java语言在大数据处理中的应用
传统的大数据处理往往依赖于庞大的数据中心和高性能的服务器,然而随着大数据时代的到来,Java作为一种强大的编程语言正在被广泛应用于大数据处理领域。本文将探讨Java语言在大数据处理中的优势和应用,以及其在分布式计算、数据处理和系统集成等方面的重要作用。
|
2天前
|
存储 NoSQL 大数据
【MongoDB 专栏】MongoDB 在大数据场景下的应用
【5月更文挑战第11天】MongoDB,适用于大数据时代,以其灵活数据模型、高可扩展性和快速性能在大数据场景中脱颖而出。它处理海量、多类型数据,支持高并发,并在数据分析、日志处理、内容管理和物联网应用中广泛应用。电商和互联网公司的案例展示了其在扩展性和业务适应性上的优势,但同时也面临数据一致性、资源管理、数据安全和性能优化的挑战。
【MongoDB 专栏】MongoDB 在大数据场景下的应用
|
6天前
|
分布式计算 监控 数据挖掘
MaxCompute的应用
【5月更文挑战第7天】MaxCompute的应用
25 8
|
1月前
|
SQL Cloud Native 架构师
深入浅出Presto:大数据查询引擎的原理与应用
【4月更文挑战第7天】Presto是高性能的分布式SQL查询引擎,专为大规模数据交互式分析设计。它采用分离式架构,内存计算和动态规划优化查询,支持跨源查询、交互式查询和ANSI SQL兼容性。应用于大数据分析、实时数据湖查询和云原生部署。Presto的灵活性和效率使其在大数据处理领域备受推崇,适合分析师、数据科学家和IT架构师使用。未来将在博客中分享更多实践和案例。
27 1
|
1月前
|
NoSQL 大数据 数据挖掘
现代数据库技术与大数据应用
随着信息时代的到来,数据量呈指数级增长,对数据库技术提出了前所未有的挑战。本文将介绍现代数据库技术在处理大数据应用中的重要性,并探讨了一些流行的数据库解决方案及其在实际应用中的优势。
|
2月前
|
机器学习/深度学习 人工智能 数据可视化
基于Python的数据可视化技术在大数据分析中的应用
传统的大数据分析往往注重数据处理和计算,然而数据可视化作为一种重要的技术手段,在大数据分析中扮演着至关重要的角色。本文将介绍如何利用Python语言中丰富的数据可视化工具,结合大数据分析,实现更直观、高效的数据展示与分析。

热门文章

最新文章