备案控制台

开发者社区

开发者社区云计算文章正文

HDFS文件系统数据备份

2018-02-26 3143

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： HDFS快照是一个只读的基于时间点文件系统拷贝。快照可以是整个文件系统的也可以是一部分。常用来作为数据备份，防止用户错误和容灾快照功能。HDFS实现功能：Snapshot 创建的时间复杂度为O(1)，但是不包括INode 的寻找时间只有...

HDFS快照是一个只读的基于时间点文件系统拷贝。快照可以是整个文件系统的也可以是一部分。常用来作为数据备份，防止用户错误和容灾快照功能。

HDFS实现功能：

Snapshot 创建的时间复杂度为O(1)，但是不包括INode 的寻找时间
只有当修改SnapShot时，才会有额外的内存占用，内存使用量为O(M),M 为修改的文件或者目录数
在DataNode上面的blocks 不会复制，做Snapshot 的文件是纪录了block的列表和文件的大小，但是没有数据的复制
Snapshot 并不会影响HDFS 的正常操作：修改会按照时间的反序记录，这样可以直接读取到最新的数据。快照数据是当前数据减去修改的部分计算出来的。

快照命令

设置一个目录为可快照
$ bin/hdfs dfsadmin -allowSnapshot <path>
取消目录可快照
$ bin/hdfs dfsadmin -disallowSnapshot <path>
生成快照
$ bin/hdfs dfs -createSnapshot <path> [<snapshotName>]
删除快照
$ bin/hdfs dfs -deleteSnapshot <path> <snapshotName>
列出所有可快照目录
$ bin/hdfs lsSnapshottableDir
比较快照之间的差异
$ bin/hdfs snapshotDiff <path> <fromSnapshot> <toSnapshot>

具体例子看光官网

文章标签：

容灾

关键词：

文件存储HDFS版文件系统

突突修

目录

相关文章

安然AR

|

10月前

|

存储分布式计算 Hadoop

大数据数据存储的分布式文件系统的HDFS的基本概念和架构的概念的Hadoop 分布式文件系统

Hadoop 分布式文件系统 (HDFS) 是一个开源的分布式文件系统，是 HttpFS 的后继者。

安然AR

87 2 2

bug菌

|

SQL 存储分布式计算

DataX 从HDFS文件系统上读取数据到FTP文件服务器【举例介绍】

DataX 从HDFS文件系统上读取数据到FTP文件服务器【举例介绍】

bug菌

1120 0 0

DataX 从HDFS文件系统上读取数据到FTP文件服务器【举例介绍】

游客mjas2nthly4nm

|

分布式计算资源调度 Hadoop

大数据处理 | HDFS文件系统配置及基本使用

Spark是目前Apache三大主流开源分布式大数据处理框架之一，它具有低时延、速度快、通用性强、生态系统等优点，此外它不仅可以用于数据的批计算，还可以用于数据的流计算，这让它倍受欢迎。因此，我准备用两篇文章介绍一下Spark集群环境的搭建和基本使用，由于本文是基于HDFS文件存储系统，因此第一篇文章会详细介绍Hadoop集群的搭建与基本使用，第二篇文章会介绍Spark集群的搭建与基本使用。

游客mjas2nthly4nm

411 0 0

大数据处理 | HDFS文件系统配置及基本使用

技术mix呢

|

分布式计算 Hadoop Unix

解决从本地文件系统上传到HDFS时的权限问题

技术mix呢

1974 0 0

cloudcoder

|

分布式计算 Java Hadoop

HTTPFS: 基于HTTP操作hadoop hdfs文件系统

cloudcoder

6488 0 0

开源大数据EMR

|

存储 SQL 资源调度

面对业务增长，Uber是如何扩展HDFS文件系统的

Uber将基于Hadoop的批量和流式分析应用在了广泛的场景中，例如反作弊、机器学习和ETA计算等。随着过去几年的业务增长，Uber的数据容量和访问负载也呈现了指数级增长的趋势。同时保证系统扩展能力和高性能并不是一件容易的事情，本文将详细介绍，Uber是如何通过这些改进措施来保证存储系统的持续增长、稳定和可靠的。

开源大数据EMR

714 0 0

面对业务增长，Uber是如何扩展HDFS文件系统的

科技探索者

|

Linux

HDFS文件系统命令详解

科技探索者

1368 0 0

橘子红了呐

|

存储机器学习/深度学习分布式计算

Hadoop 分布式文件系统 - HDFS

橘子红了呐

1499 0 0

技术小牛人

|

Web App开发 Java Apache

通过javaAPI上传文件到HDFS文件系统

技术小牛人

1776 0 0

余二五

|

分布式计算 Java Hadoop

Hadoop Hdfs 配置挂载hdfs文件系统

余二五

1804 0 0

热门文章

最新文章

bigdata-07-Hdfs原理到实战

Hadoop【基础知识 05】【HDFS的JavaAPI】（集成及测试）

Hadoop【基础知识 03+04】【Hadoop集群资源管理器yarn】（图片来源于网络）（hadoop fs + hadoop dfs + hdfs dfs 使用举例）

Hadoop【基础知识 04】【HDFS常用shell命令】（hadoop fs + hadoop dfs + hdfs dfs 使用举例）

【Hadoop】HDFS 读写流程

java管理hdfs文件的常用类小结

客户端向hdfs读写数据流程

世界杯项目案例:HDFS分布式文件系统

Hadoop核心组件之HDFS

hadoop: hdfs API示例

Hadoop【基础知识 05】【HDFS的JavaAPI】（集成及测试）

Hadoop【基础知识 03+04】【Hadoop集群资源管理器yarn】（图片来源于网络）（hadoop fs + hadoop dfs + hdfs dfs 使用举例）

Hadoop【基础知识 04】【HDFS常用shell命令】（hadoop fs + hadoop dfs + hdfs dfs 使用举例）

【Hadoop】HDFS 读写流程

bigdata-07-Hdfs原理到实战

HDFS的API操作

HDFS的常用命令

分布式文件系统（HDFS）

Sqoop【付诸实践 01】Sqoop1最新版 MySQL与HDFS\Hive\HBase 核心导入导出案例分享+多个WRAN及Exception问题处理（一篇即可学会在日常工作中使用Sqoop）

Flink报错问题之flink-sql写hdfs报错如何解决

相关课程

更多

Hadoop 分布式文件系统 HDFS

相关电子书

更多

海量数据分布式存储——Apache HDFS之最新进展

HBase 数据备份与恢复

零基础实现hadoop 迁移 MaxCompute 之数据

相关实验场景

更多

利用HBR实现文件存储NAS备份

下一篇

部署LAMP环境（Alibaba Cloud Linux 3）