备案控制台

开发者社区

开发者社区云计算文章正文

高性能计算GPU解决方案系列课程七--分布式文件系统

2018-03-06 2135

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

7.    分布式文件系统
7.1.    文件系统
   1）本地文件系统
   一种存储和组织计算机数据的方法，它使得对其存取和查找变得容易。

文件系统管理的存储资源直接连在本地节点上，如：ext2，ext3，ext4，NTFS

2）分布式文件系统

文件系统管理的存储资源通过网络不节点相连

分布式文件系统的设计是基于客户机/服务器模式，如：nfs

3）集群文件系统
由多个服务器节点组成的分布式文件系统，如ISILON，LoongStore，Lustre 4）并行文件系统
所有客户端可以同时幵发读写同一个文件

      支持幵行应用(如MPI) 如Lustre，GPFS
7.2.    基于集群的分布式架构
  1）特点
      分布式文件系统

服务器直连各自存储

MDS管理元数据

RAID、卷管理、文件系统三者合一

性能和容量同时扩展

规模可以很大

2）    典型案例
   a）  国外商业产品
         IBM GPFS, EMC ISILON, PanasasPanFS
   b ) 国外开源系统
         Intel Lustre, Redhat GFS, GlusterGlusterfs
         Clemon PVFS,Sage Weil/InktankCeph, Apache HDFS
   c )    国内产品
         中科蓝鲸BWFS

龙存Loongstore

余庆FastDFS

淘宝TFS

7.3.    性能评价方法
         1）带宽
         2）IOPS
         3）试工具

Linux dd

IOzone

IOmeter

Mdtest

IOR

原文发布时间为： 2016-7-11 15:14:44

原文由：十四王爷发布，版权归属于原作者

本文来自云栖社区合作伙伴NVIDIA，了解相关信息可以关注NVIDIA官方网站

文章标签：

GPU云服务器

超级计算集群

存储

异构计算

关键词：

GPU云服务器分布式

GPU云服务器解决方案

高性能计算 HPC解决方案

高性能计算GPU云服务器解决方案

高性能计算GPU云服务器

相关实践学习

基于阿里云DeepGPU实例，用AI画唯美国风少女

本实验基于阿里云DeepGPU实例，使用aiacctorch加速stable-diffusion-webui，用AI画唯美国风少女，可提升性能至高至原性能的2.6倍。

cuda_study

目录

相关文章

三分钟热度的鱼

|

2月前

|

机器学习/深度学习人工智能 Java

机器学习PAI报错问题之跑collective gpu分布式报错如何解决

人工智能平台PAI是是面向开发者和企业的机器学习/深度学习工程平台，提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务；本合集将收录PAI常见的报错信息和解决策略，帮助用户迅速定位问题并采取相应措施，确保机器学习项目的顺利推进。

三分钟热度的鱼

45 1 1

阿里云大数据Al技术

|

10月前

|

存储机器学习/深度学习缓存

阿里云PAIx达摩院GraphScope开源基于PyTorch的GPU加速分布式GNN框架

阿里云机器学习平台 PAI 团队和达摩院 GraphScope 团队联合推出了面向 PyTorch 的 GPU 加速分布式 GNN 框架 GraphLearn-for-PyTorch(GLT) 。

阿里云大数据Al技术

6223 26 41

阿里云PAIx达摩院GraphScope开源基于PyTorch的GPU加速分布式GNN框架

编程技术君

|

10月前

|

存储人工智能缓存

带你读《云存储应用白皮书》之33：6. 高性能计算存储在渲染行业的应用

带你读《云存储应用白皮书》之33：6. 高性能计算存储在渲染行业的应用

编程技术君

135 0 0

编程达人

|

11月前

|

存储弹性计算运维

带你读《生命科学行业云上解决方案及最佳实践》——阿里云 E-HPC 生命科学行业整体解决方案（上）

带你读《生命科学行业云上解决方案及最佳实践》——阿里云 E-HPC 生命科学行业整体解决方案（上）

编程达人

295 0 0

编程达人

|

11月前

|

存储弹性计算运维

带你读《生命科学行业云上解决方案及最佳实践》——阿里云 E-HPC 生命科学行业整体解决方案（下）

带你读《生命科学行业云上解决方案及最佳实践》——阿里云 E-HPC 生命科学行业整体解决方案（下）

编程达人

253 0 0

编程达人

|

11月前

|

弹性计算缓存运维

带你读《生命科学行业云上解决方案及最佳实践》——五大解决方案（上）

带你读《生命科学行业云上解决方案及最佳实践》——五大解决方案（上）

编程达人

191 0 0

编程达人

|

11月前

|

弹性计算并行计算数据挖掘

带你读《生命科学行业云上解决方案及最佳实践》——五大解决方案（下）

带你读《生命科学行业云上解决方案及最佳实践》——五大解决方案（下）

编程达人

199 0 0

编程达人

|

11月前

|

机器学习/深度学习人工智能并行计算

带你读《生命科学行业云上解决方案及最佳实践》——GHDDI，阿里云高性能计算助力药物研发实现高通量分子筛选

带你读《生命科学行业云上解决方案及最佳实践》——GHDDI，阿里云高性能计算助力药物研发实现高通量分子筛选

编程达人

167 0 0

Deephub

|

机器学习/深度学习并行计算算法

在PyTorch中使用DistributedDataParallel进行多GPU分布式模型训练

在PyTorch中使用DistributedDataParallel进行多GPU分布式模型训练

Deephub

744 0 0

在PyTorch中使用DistributedDataParallel进行多GPU分布式模型训练

auqbllxiu

|

存储

《HPC高性能计算数据存储解决方案蓝皮书》电子版地址

HPC高性能计算数据存储解决方案蓝皮书

auqbllxiu

104 0 0

《HPC高性能计算数据存储解决方案蓝皮书》电子版地址

热门文章

最新文章

【2024】英伟达吞噬世界！新架构超级GPU问世，AI算力一步提升30倍

【PyTorch&TensorBoard实战】GPU与CPU的计算速度对比（附代码）

使用GaLore在本地GPU进行高效的LLM调优

GPU如何成为AI的加速器

台积电董事长预测：未来15年每瓦GPU性能提升1000倍，GPU晶体管数破万亿！

【Python】GPU内存监控脚本

Anaconda+Cuda+Cudnn+Pytorch（GPU版）+Pycharm+Win11深度学习环境配置

GPU震撼发布：性能飙升，功耗惊人，液冷成新宠？

GPU实例使用--单实例上运行Linux桌面多开解决方案

阿里云异构计算发布：轻量级GPU云服务器实例VGN5i

在高性能计算（HPC）场景下，阿里云存储的文件存储产品的实践

阿里云弹性裸金属服务器_弹性物理机_高性能计算服务_弹性计算

带你读《云存储应用白皮书》之33：6. 高性能计算存储在渲染行业的应用

带你读《生命科学行业云上解决方案及最佳实践》——阿里云 E-HPC 生命科学行业整体解决方案（上）

带你读《生命科学行业云上解决方案及最佳实践》——阿里云 E-HPC 生命科学行业整体解决方案（下）

带你读《生命科学行业云上解决方案及最佳实践》——五大解决方案（上）

带你读《生命科学行业云上解决方案及最佳实践》——五大解决方案（下）

带你读《生命科学行业云上解决方案及最佳实践》——GHDDI，阿里云高性能计算助力药物研发实现高通量分子筛选

高性能计算HPC照亮AIGC未来：PC集群+Stable Diffusion 打造极致游戏体验

阿里云产品体系分为6大分类——云计算基础——弹性计算——高性能计算HPC

相关课程

更多

分布式文件存储系统技术及实现

基于Zookeeper、Dubbo构建互联网分布式基础架构

分布式协调系统 Zookeeper 快速入门

Spring Boot+Vue.js+FastDFS实现分布式图片服务器

企业级云上网络构建

阿里云原生内存数据库 Tair 课程

相关电子书

更多

DeepStream: GPU加速海量视频数据智能处理

阿里巴巴高性能GPU架构与应用

GPU在超大规模深度学习中的发展和应用

相关实验场景

更多

基于Hologres+PAI+计算巢，5分钟搭建企业级AI问答知识库

基于阿里云E-HPC平台的WRF气象预报实验

倚天大数据电商数据分析快速实践

利用大模型大规模分发技术，实现AIGC在线应用秒级弹性

使用计算巢企业应用，一键获取专属图数据库服务

通过GPU云服务器训练GPT-2

下一篇

阿里云oss简介和使用流程