阿里云HPC助力新制造 | 上汽仿真计算云SSCC

本文涉及的产品
云服务器 ECS,每月免费额度280元 3个月
云服务器ECS,u1 2核4GB 1个月
简介: 据了解,借助阿里云,上汽乘用车实现了工程开发仿真能力升级,仿真计算效率提升了25%,使工程开发人员更加专注于产品设计和性能优化,打造出世界级产品的高品质。今年北京车展上全球首秀的概念车MG X-Motion,其量产车的卓越整车性能正是经过上汽仿真计算云平台反复验证和优化的。

       随着上汽集团与阿里云的合作开展,阿里云各项技术逐步深入到上汽汽车研发领域的核心业务实现落地。其中上海汽车集团股份有限公司乘用车分公司(以下简称上汽乘用车)与阿里云共建的仿真计算混合云就是新制造产业升级的典型代表项目。

       上汽乘用车作为上汽集团全资子公司,承担着上汽自主品牌汽车的研发、制造与销售,拥有荣威、MG两大品牌,上海、南京和英国三地技术研发中心,上海临港、南京浦口和英国长桥三个制造基地。伴随上汽乘用车的市场表现强劲,车型研发工作也在持续加速升级,而为工程仿真服务的的计算资源供应开始远远落后于现实需求,具体表现为:

【研发需求强烈】

当前CAE仿真计算已经承担非常重要的任务,普遍出现计算任务工况多、规模大、时间紧的情况,迫切需要快速获取高性能计算资源;

【资源迭代滞后】

当前上汽乘用车建设的本地HPC集群虽然经历多次扩建,但是硬件资源严重老化,硬件资源故障率居高不下,计算性能难以满足业务需求,且资源更新迭代速度缓慢,严重影响仿真研发业务进度;

  用户体验欠佳】

仿真研发人员一直保留着传统的HPC计算中心操作方式,线下前后处理与到线上求解计算,流程割裂,数据挪动频繁,亟需建设高沉浸、全业务、CAE仿真分析在线服务平台。

针对以上问题,2017年底上汽乘用车携手阿里云、泛云科技建设业内首个IaaS混合型工业仿真计算服务平台——上汽仿真计算云SSCC(SAIC Simulation Computing Cloud),并于2018年初成功上线,再度验证了云计算模式在工业研发领域的弹性、快速与高效!  

       上汽仿真计算云主要由阿里云公共云集群和上汽乘用车自建集群两大部分组成,同时通过高速专线实现了数据互通和计算资源的联合调度,其中阿里云公共云集群主要提供了以下计算资源:

【HPC计算集群】HPC集群计算节点由超级计算集群scch5实例组成。SCC与弹性裸金属(神龙)服务器一脉相承,既提供了云计算的成熟管控、弹性资源优势,又达到了物理机的性能,并在此之上加入高速RDMA互联支持,大幅提升网络性能,显著提高大规模集群加速比。

655105ea3fb77925984e00846ac05b86e597d077

【NAS共享文件存储】NAS作为云上数据流的共享交通枢纽,无论是用户提交的作业输入,作业求解结果,后处理输入数据,都经由NAS中转使得VPC内所有计算资源可以同时访问数据,NASplus还打通了Windows/Linux跨平台共享数据访问,满足常见企业业务场景。NAS结合阿里云飞天盘古2.0最新技术,提供了高聚合带宽,完全满足CAE软件的I/O性能需求,并通过多备份等手段提供了10个9的数据可用性。随着业务规模增长,还可以根据需求升级为CPFS分布式文件系统提供极致I/O性能。

【图形处理集群】采用Pascal架构的Nvidia Tesla系列企业级GPU,在提供高可用性的同时,确保在多用户登录使用图形服务器时仍能生成流畅的演示动画,快速完成模型渲染等工作,保障前/后处理工作流的完整性、可靠性。

 beda5340e0449f1e9f1598aadf02a55bec703929 

数据显示,平均每天500多个碰撞分析、结构刚度分析、流体分析、NVH分析等多学科仿真计算作业在上汽仿真计算云平台上完成,模拟了整车、发动机数百种工况。由于阿里云超级计算集群带来的性能提升,相对本地集群节约了计算求解时间,用户作业排队时间也明显缩短,工程师可以在工作时间段做更多的模型调整,提升工作效率。另外作业数据绝大部分在阿里云公共云集群闭环流动,大大减轻了本地存储的压力,更多历史工程数据得以保留,为工程师做多方案对比分析提供了极大帮助。据了解,借助阿里云,上汽乘用车实现了工程开发仿真能力升级,仿真计算效率提升了25%,使工程开发人员更加专注于产品设计和性能优化,打造出世界级产品的高品质。今年北京车展上全球首秀的概念车MG X-Motion,其量产车的卓越整车性能正是经过上汽仿真计算云平台反复验证和优化的。

上汽乘用车数据及信息系统部工程应用支持高级经理尤静表示,阿里云与上汽自建HPC集群,性能表现卓越、资源弹性伸缩,大大缓解了研发需求的压力,很好地保障了工程开发进度。数据及信息系统部基础设施总监强斌也表示,阿里云公共云管控模式成熟,安全性符合上汽相关规范,资源开通灵活,节约了自建集群的资源投入和人力成本。据了解,混合云技术的应用,有效推动了上汽乘用车技术中心的全球化数字研发发展进程,符合上汽乘用车产品国际化的研发思维;同时这种高效合作的模式,可以快速扩展到产品研发的完整业务链,助力上汽乘用车向终端市场快速推出符合上汽“新四化”——电动化、智能网联化、共享化、国际化发展方向的汽车产品和出行服务。

阿里云EHPC技术特点

综合IaaS/PaaS/SaaS各方面的创新,上汽仿真计算云表现出以下几方面的技术优势:

第一,性能优越

   *HPC计算节点性能强劲,采用Intel Xeon Gold 6149 CPU,最新第五代Skylake架构带来更卓越的计算性能;

   *先进高性能网;络架构,RoCE 2 × 25 Gbps 互联,低延迟高带宽,大幅提升加速比;

   *NASplus/CPFS共享存储提供聚合带宽,满足绝大多数CAE场景需求,还可升级至CPFS文件系统;

集群整体性能处于国际领先地位

cf41f9b72ab9287e2f233ba102b9c966be226ce4

 第二,SLA保证

       公共云完善稳定的管控系统及宕机迁移等响应手段,保障了单个计算节点99.95%的可用性,确保CAE仿真计算业务的连续性。 

第三,混合云架构

   *云上VPC与本地集群通过高速通道(专线)打通成为独立子网,确保数据安全互通。

   *云上计算资源无缝接入本地license、调度器及SaaS等。

   *出现超出规划的计算资源需求(如紧急项目),临时增加公共云资源是最佳应对手段

第四,自动伸缩(*E-HPC支持)

       在合理设置集群负载阈值的前提下,自动伸缩功能既可最大限度地节省公共云资源花销,又能在高峰期消化负荷,保障CAE仿真计算求解业务顺利运作。

b78952fae5c9b9c059159c3498fd4f37b4c4f44b

第五,快速POC

       直接在阿里云控制台操作公共云资源开通,分钟级交付整个集群,即可开展测试。无需等待采购或数据中心机房规划/安装部署等琐碎问题。

       POC进行时,可以选择临时开通超过正式环境规划的资源量,加快CAE应用验证流程

第六,Linux/Windows数据共享互通

       NASplus提供了业界领先的NAS同时以NFS协议挂载到Linux/Windows上的重要功能,使得用户可以在使用熟悉的Windows操作界面进行交互式后处理操作的时候,能够直接读取共享存储中的求解计算结果。

第七,弹性容量的数据闭环

       用户上传作业输入数据后,求解计算后的结果数据写入NAS后即可进入使用云上图形服务器的后处理,形成数据闭环,安全可靠。如无特殊情况无需下载回本地。

       另一方面,即使数据用量已超过规划量(比如超出购买的容量包),公共云NAS的10PB存储上限可完全确保数据正常写入,求解计算几乎不受存储空间限制,充分保障了业务连续性

第八,完善的帐号管理使能协同开发

       客户可以通过RAM授权子帐号只读权限的方式,让合作伙伴登录云上机器进行软件维护,错误排查/分析等,无需长途奔波到现场。共享后台VNC链接也大大方便了多方讨论合作。 

第九,完备的SaaS服务能力

平台内置集群计算、虚拟应用两类IaaS资源入口,并根据工程软件的应用特点进行统一的部署、集成、调度及监控,可以提供CAD、CAE等工程软件在线服务:

交互类应用:HyperWorks, EnSight, Converge Studio, Star-CCM+, Fluent, MSC.Admas,Abaqus,NCode

计算类应用:LS-Dyna, Converge, Star-CCM+, Fluent, MSC.Nastran, NX.Nastran, MSC.Admas, NCode, OptiStruct, Abaqus, Star-CD, iSight

 2f3d5b360168d380a4c2952cf74d2b8c9fe93d28

第十,精细化业务调度能力

    基于上汽乘用车本地HPC集群、阿里云的资源差异性,结合用户数据存储一致性需求,平台设计并实现了精细化的仿真计算业务调度能力,包括并不仅限于:

1.资源配额调剂。平台基于部门、项目组属性进行固定资源、公共资源配额约束,既可保障部门、项目组的刚性计算需求,亦可满足企业层面的弹性资源调度要求;

2.IaaS资源统一调度。平台通过设备分组策略,将本地HPC设备、阿里云集群实例进行统一调度,既可保证单一算例的高效并行效率,也可为海量任务提供资源快速调度;

3.用户数据统一视图。平台可同时管理本地存储与阿里云存储,为了保障用户数据管理体验,特别设计并实现了用户数据统一视图,CAE数据可与临近资源节点智能匹配并发起计算或交互;

4.闲时抢占调度策略。平台针对用户计算业务场景,特别设计并实现了闲时抢占调度策略,在规定时段可突破预定资源配额约束,最大化利用计算资源;

5.许可证高级调度机制。平台针对工业软件许可证特点,设计并实现了一系列高级调度机制,可以为设备节点组、用户组进行许可证资源预留控制。

上汽仿真计算云SSCC (是国内首个投入实际生产的CAE仿真计算混合云,可为数百人的仿真分析团队提供在线服务,月均完成仿真计算任务达到上万例。

回顾项目历程,同时展望中国工业自主研发的未来征程,上汽仿真计算云SSCC将会成为云计算实践的一个重要里程碑事件,为中国企业揭示智慧工业研发云的真实能力与巨大价值:

上汽集团已建成计算资源弹性供应体系与灵活管控机制,实现了精细化的研发资源管理、安全可靠的核心研发数据闭环生产,必将完全释放智慧研发创造力,进一步提升核心研发生产效率; 阿里云正在为中国智造提供全面、高效的计算引擎服务,在工业仿真计算领域实现了不可估量的价值。

相关实践学习
基于ECS和NAS搭建个人网盘
本场景主要介绍如何基于ECS和NAS快速搭建个人网盘。
阿里云文件存储 NAS 使用教程
阿里云文件存储(Network Attached Storage,简称NAS)是面向阿里云ECS实例、HPC和Docker的文件存储服务,提供标准的文件访问协议,用户无需对现有应用做任何修改,即可使用具备无限容量及性能扩展、单一命名空间、多共享、高可靠和高可用等特性的分布式文件系统。 产品详情:https://www.aliyun.com/product/nas
目录
相关文章
|
5月前
|
Java 云计算
阿里云国际站代理商:Java计算当前时间处于某段时间内的第几周、第几个月
@luotuoemo飞机@TG阿里云国际站代理商:Java计算当前时间处于某段时间内的第几周、第几个月,以上就是使用Java代码计算当前时间处于某段时间内的第几周和第几个月的全部内容。通过该篇文章,我们可以了解到如何使用Java的Calendar类以及日期函数来计算时间段内的周数和月数,掌握相应的计算方法和实践技巧。在开发过程中,合理运用这些方法,可以方便地获取时间相关的信息,满足业务需求,提高开发效率。希望本文能对读者在使用阿里云国际站代理商开发Java应用时计算时间段的周数和月数提供一些帮助与启示。
|
5月前
|
弹性计算 人工智能 安全
阿里云弹性计算产品线负责人张献涛 为计算提速,弹性计算的创新与普惠
“阿里云始终围绕‘稳定、安全、性能、成本、弹性’的目标不断创新,为客户创造业务价值。”10月31日,杭州云栖大会上,阿里云弹性计算计算产品线负责人张献涛表示,通过持续的产品和技术创新,阿里云发布了HPC优化实例等多款新品,性能可提升40%,并对g8i等多款第八代ECS实例升级算力、降低成本,让客户真正体验到云计算带来的创新和普惠。
阿里云弹性计算产品线负责人张献涛  为计算提速,弹性计算的创新与普惠
|
1天前
|
存储 机器学习/深度学习 网络协议
阿里云企业级ARM计算规格族特点、适用场景及收费标准与活动价格参考
阿里云企业级ARM计算规格族是阿里云继X86计算、异构计算、弹性裸金屈服务器、超级计算集群之后推出的全新架构云服务器,ARM计算规格族有通用型实例规格族g8y、计算型实例规格族c8y、通用型实例规格族g6r等。下面是阿里云企业级ARM计算规格族特点、适用场景及最新收费标准和活动价格参考。
阿里云企业级ARM计算规格族特点、适用场景及收费标准与活动价格参考
|
1月前
|
存储 机器学习/深度学习 并行计算
阿里云服务器X86计算、Arm计算、GPU/FPGA/ASIC、高性能计算架构区别
在我们选购阿里云服务器的时候,云服务器架构有X86计算、ARM计算、GPU/FPGA/ASIC、弹性裸金属服务器、高性能计算可选,有的用户并不清楚他们之间有何区别,本文主要简单介绍下不同类型的云服务器有何不同,主要特点及适用场景有哪些。
阿里云服务器X86计算、Arm计算、GPU/FPGA/ASIC、高性能计算架构区别
|
1月前
|
存储 安全 网络协议
2024阿里云上云采购季活动,云服务器计算型c8a、通用型g8i/g8a/g8y实例区别及价格参考
在阿里云2024年的上云采购季活动中,除了以往活动中有的轻量应用服务器和经济型e、通用算力型u1、计算型c7、通用型g7实例之外,阿里云还新增了计算型c8a、通用型g8i/g8a和g8y实例规格,这些都是具有超高性能的AMD&Intel&倚天第八代云服务器,那么这几个云服务器实例规格的性能及适用场景是怎样的呢?本文为大家介绍阿里云计算型c8a、通用型g8i/g8a和g8y实例规格性能及适用场景。
367 0
2024阿里云上云采购季活动,云服务器计算型c8a、通用型g8i/g8a/g8y实例区别及价格参考
|
2月前
|
存储 弹性计算 安全
云服务器ECS_云主机_服务器托管_计算-阿里云
云服务器ECS_云主机_服务器托管_计算-阿里云,阿里云服务器是什么?云服务器ECS是一种安全可靠、弹性可伸缩的云计算服务,云服务器可以降低IT成本提升运维效率,免去企业或个人前期采购IT硬件的成本,阿里云服务器让用户像使用水、电、天然气等公共资源一样便捷、高效地使用服务器
云服务器ECS_云主机_服务器托管_计算-阿里云
|
2月前
|
弹性计算 大数据 测试技术
阿里云服务器服务费怎么计算?详细解析2024新版
阿里云服务器服务费怎么计算?详细解析2024新版,云服务器ECS经济型e实例2核2G、3M固定带宽99元一年、ECS u1实例2核4G、5M固定带宽、80G ESSD Entry盘优惠价格199元一年,轻量应用服务器2核2G3M带宽轻量服务器一年61元、2核4G4M带宽轻量服务器一年165元12个月、2核4G服务器30元3个月
47 1
|
2月前
|
存储 弹性计算 大数据
云服务器ECS_云主机_服务器托管_计算-阿里云
云服务器ECS_云主机_服务器托管_计算-阿里云,阿里云服务器全方位介绍包括云服务器ECS优势、云服务器租用价格、云服务器使用场景及限制说明,阿里云百科分享云服务器ECS介绍、个人和企业免费试用、云服务器活动、云服务器ECS规格、优势、功能及应用场景详细说明
34 0
|
3月前
|
存储 缓存 资源调度
阿里云购买云服务器选择经济型、通用算力型、计算型、通用型、内存型实例参考
在我们通过阿里云的活动选购云服务器的时候会发现,相同配置的云服务器往往有多个不同的实例可选,而且价格差别也比较大,这会是因为不同实例规格的由于采用的处理器不同,底层架构也有所不同(例如X86 计算架构与Arm 计算架构),因此不同实例的云服务器其性能与适用场景是有所不同。本文为大家详细介绍阿里云的经济型、通用算力型、计算型、通用型和内存型实例的性能特点及适用场景,以供大家选择参考。
阿里云购买云服务器选择经济型、通用算力型、计算型、通用型、内存型实例参考
|
3月前
|
存储 机器学习/深度学习 人工智能
阿里云倚天云服务器计算型c8y、通用型g8y、内存型r8y实例性能介绍及活动价格参考
计算型c8y、通用型g8y、内存型r8y是阿里云推出的基于ARM架构的新一代阿里自研倚天实例,采用阿里自研倚天710处理器,基于最新一代CIPU架构,通过芯片快速路径加速手段实现计算、存储、网络性能的大幅提升。其中计算型c8y实例网站应用、各种类型和规模的企业级应用,通用型g8y实例适用于网站应用、各种类型和规模的企业级应用,内存型r8y实例适用于网站应用、各种类型和规模的企业级应用。本文为大家详细介绍倚天云服务器实例的主要性能和最新活动价格情况。
阿里云倚天云服务器计算型c8y、通用型g8y、内存型r8y实例性能介绍及活动价格参考