数据同步华丽上位，大数据离线处理高枕无忧-阿里云开发者社区

数据同步华丽上位，大数据离线处理高枕无忧

2017-09-06 2299

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 大数据时代，业务量不断增长，大批量的数据离线同步已成了不可获缺的工具。而越是使用越频繁的产品，更容易成为用户关注的焦点。

大数据时代，业务量不断增长，大批量的数据离线同步已成了不可获缺的工具。

阿里云数据集成是开源DataX的服务化版本，支持400种异构数据源之间的数据同步，同时支持作业级别和数据源级别的流控、分布式并发运行以及脏数据阈值处理，是大数据处理中不可缺失的数据同步工具。

而越是使用越频繁的产品，更容易成为用户关注的焦点。

尤其在操作界面上，如果逻辑层次分配不够清晰，也会带来非常大的工作量。

1、重复报错的显示让操作更简单

edadff74a988f8178d4d8a8ac6e863ce9e240a2f

2、界面的视觉交互，是获取信息的主入口

56ae02a4919f3d6674cf7a3c58fce8106523c4b4

3、依据用户的使用场景，字段映射忽略的源端与目的端的字段大小写，提高效率

4、容易出错的地方给予明显提示：如新增的字段格式未识别，映射关系没有连线的情况

cde6c5bf690adfcf80f01da67b129a1d25e62287

5、一键建表后，自动帮用户选择已建好的的表，提高工作效率

6、针对常发的找不到数据集成的情况，在数据开发套件首页，增加数据集成的入口

a170b7820b17fe007ddc4df21f802d342ea5cec1

7、运行日志，增加右键复制功能

文档在使用中做为问题量化的重灾区，必不可少。

针对网络问题，将用户的数据源划分为阿里云产品数据源、ECS自建数据源、本地自建的有公网IP的数据源、本地自建的无公网IP的数据源，分别提供不同的数据同步策略，特别是针对本地IDC机房数据上云：

1、提供安全加密的agent同步方案；

2、针对用户的大批量同步需求，提供批量的任务配置、管理，一键化同步过程，提升用户同步数据的效率；

3、数据集成升级下一代，将会和Dataworks（数据工场）的数据地图产品紧密结合，不仅提供数据的物理移动，也提供元数据的同步，同步的元数据展现在数据地图之上，方便用户先盘点、了解数据，再进一步决定移动哪些物理数据；

4、数据集成将新增客户端App、html网站日志数据一键采集至用户自己的大数据中心，用户可以基于这部分日志数据，与用户的其他数据结合进行商业分析。

以上两大部分内容正是产品团队&用户体验团队通过用户反馈梳理出来。进行用户走访，与用户进行深入沟通交流，整理出的上百条产品建议，以此进行了一系列的优化，通过产品界面引导，文档说明，以及在数据源文档中增加通过数据集成导入导出的说明，极大的方便了用户进入最佳实践，触达用户的效率提升，进而提升了用户使用数据集成产品的效率。

但以上问题优化后的结果，是否能达到用户的满意，真的符合用户的使用场景？这就需要用户一起参与其中进行验证。也更希望用户能在使用后，把相关的使用体验通过聆听平台提交上来，以便于产品进行更加符合用户使用场景的优化。

同时我们希望这不只是一段文字的描述。我们更希望有场景描述，相关操作流程，操作截图，或者是操作视频上传，更加详细的展示相关信息。

如果您也想与其它客户一起交流相关使用经验，我们也特地为大家建立了数据集成交流钉钉群，可随时与其它小伙伴交流与分享经验，说不定还能找到志同道合的人。

7f80d60e0c006a723f9cfd5a16c4dc8754d12d98

相关实践学习

简单用户画像分析

本场景主要介绍基于海量日志数据进行简单用户画像分析为背景，如何通过使用DataWorks完成数据采集、加工数据、配置数据质量监控和数据可视化展现等任务。

SaaS 模式云数据仓库必修课

本课程由阿里云开发者社区和阿里云大数据团队共同出品，是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法，从场景到实践，体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库，助力开发者学习了解先进的技术栈，并能在实际业务中敏捷的进行大数据分析，赋能企业业务。通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景，可应用MaxCompute实现数仓搭建，快速进行大数据分析。适合大数据工程师、大数据分析师大量数据需要处理、存储和管理，需要搭建数据仓库？学它！没有足够人员和经验来运维大数据平台，不想自建IDC买机器，需要免运维的大数据平台？会SQL就等于会大数据？学它！想知道大数据用得对不对，想用更少的钱得到持续演进的数仓能力？获得极致弹性的计算资源和更好的性能，以及持续保护数据安全的生产环境？学它！想要获得灵活的分析能力，快速洞察数据规律特征？想要兼得数据湖的灵活性与数据仓库的成长性？学它！出品人：阿里云大数据产品及研发团队专家产品 MaxCompute 官网 https://www.aliyun.com/product/odps 

数据同步华丽上位，大数据离线处理高枕无忧

热门文章

最新文章

相关课程

相关电子书

相关实验场景