1. 云栖社区>
  2. 全部标签>
  3. #GPU#
GPU

#GPU#

已有1人关注此标签

内容分类:
博客 | 问答 | 视频 |

教你如何在机器学习竞赛中更胜一筹(上)

本文总结由Marios Michailidis(a.k.a Kazanova),Kaggle Grandmaster在2016年3月5日现在排名第3位的在线研讨会上分享的技巧,更好地在机器学习竞赛中取胜

深度学习 大数据 算法 解决方案 GPU 神经网络

雅捷一体化方案新品提速金融大数据

本文讲的是雅捷一体化方案新品提速金融大数据,3月28日,国内领先的金融大数据应用企业——上海雅捷信息技术股份有限公司在京举办了鸡年的首场新产品发布会。在本次发布会上,雅捷信息发布了三款重磅产品,包括DataTurbine大数据并行处理平台2.0版本以及DataTurbines-P、DataTurbines-D两种软硬件一体化解决方案。

深度学习 大数据 架构 服务器 性能 数据处理 人工智能 高并发 解决方案 高性能 IBM GPU

IBM突破性分布式计算:搞定深度学习负载

本文讲的是IBM突破性分布式计算:搞定深度学习负载,为什么深度学习会是计算机的“杀手级应用”? IBM是怎么找到分布式计算来加快大数据人工智能工作负载处理速度的?

深度学习 分布式 大数据 服务器 性能 人工智能 分布式计算 IBM GPU 图像识别 神经网络

阿里云异构计算产品家族亮相 覆盖全场景AI和高性能计算需求

本文讲的是阿里云异构计算产品家族亮相 覆盖全场景AI和高性能计算需求,计算正推动着人工智能产业更大规模的爆发。9月12日,阿里云宣布推出全新一代异构加速平台,为人工智能产业提供多场景化的全球加速能力。这是阿里云异构计算家族首次亮相,涵盖GPU、FPGA在内等6款异构实例,可满足从图形渲染到高性能计算及人工智能等复杂应用的计算需求。

深度学习 算法 阿里云 人工智能 集群 弹性伸缩 物联网 并行计算 高性能 GPU

【深度学习框架大PK】褚晓文教授:五大深度学习框架三类神经网络全面测评(23PPT)

香港浸会大学褚晓文教授团队在2016年推出深度学习工具评测的研究报告《基准评测 TensorFlow、Caffe、CNTK、MXNet、Torch 在三类流行深度神经网络上的表现》,并在2017年年初发布更新,引起广泛关注。

深度学习 性能 HTTPS 测试 Image GPU 神经网络

十个表明你已AI就绪的迹象——但可能不会成功

并不是每个问题都可以通过机器学习来解决,并不是每个公司都准备应用人工智能。以下是如何知道你的IT组织是否准备好获得人工智能的好处。 由于机器学习是灵丹妙药,你的公司应该能够有利地使用它,对吗?也许是;也许不是。

深度学习 人工智能 GPU 神经网络

Facebook开源PyTorch版本fairseq翻译模型,训练速度提高50%

FAIR的开源序列到序列(sequence-to-sequence)引擎现在可以在PyTorch使用了。FAIR今天发布了fairseq-py,这是一个用PyTorch实现的卷积seq2seq模型。fairseq-py是语言翻译以及其他 seq2seq 的NLP任务的一个很好的模型,新的工具包比以前的更高效率:生成翻译的速度比以前的提高了80%,训练速度提高了50%。

python java HTTPS 测试 脚本 facebook GPU 神经网络

《OpenACC并行程序设计:性能优化实践指南》一 导读

这是一本关于并行编程的书,不仅仅介绍OpenACC语法或从文档中收集的信息,更介绍了如何编写实际的、高性能的以及可移植的程序,这些程序可以运行在从CPU到GPU的大量设备上。具体而言,书中演示了使用PGI、Cray和PathScale等供应商提供的编译器编译示例代码,并在Intel x86处理器、Cavium 96核64位ARMv8处理器芯片集和NVIDIA GPU上运行。

性能优化 性能 HTTPS 应用性能 测试 aliyun 编程 GPU

阿里云CTO章文嵩:阿里云强大的数据和计算能力助力企业实现“弯道超车”

 7月22日,阿里云在京召开以“从0到1”阿里云分享日X云栖大会。通过6年的研发、探索、累积,阿里云已经打造成为中国产品体系最完备的云计算平台。此次会议将由众多大咖带来行业前瞻性的分享与讨论,以及如何看待当前云计算市场以及DT世界趋势。

云栖社区 深度学习 阿里云 云栖大会 人工智能 语音识别 集群 数据分析 cto GPU 数据存储 海量数据 人脸识别

《OpenACC并行程序设计:性能优化实践指南》一 3.10 使用Score-P和Vampir记录OpenACC运行时事件

本节书摘来自华章出版社《OpenACC并行程序设计:性能优化实践指南》一 书中的第3章,第3.10节,作者:[美] 罗布·法伯(Rob Farber),更多章节内容可以访问云栖社区“华章计算机”公众号查看。

性能优化 线程 主机 MPI CPU GPU ScreenShot

《OpenACC并行程序设计:性能优化实践指南》一 3.9 增加GPU任务并行

本节书摘来自华章出版社《OpenACC并行程序设计:性能优化实践指南》一 书中的第3章,第3.9节,作者:[美] 罗布·法伯(Rob Farber),更多章节内容可以访问云栖社区“华章计算机”公众号查看。

性能优化 线程 主机 同步 GPU ScreenShot

《OpenACC并行程序设计:性能优化实践指南》一 3.8 优化GPU内核

本节书摘来自华章出版社《OpenACC并行程序设计:性能优化实践指南》一 书中的第3章,第3.8节,作者:[美] 罗布·法伯(Rob Farber),更多章节内容可以访问云栖社区“华章计算机”公众号查看。

性能优化 函数 性能 HTTPS 线程 同步 数据结构 GPU 数组 ScreenShot

《OpenACC并行程序设计:性能优化实践指南》一 3.7 释放主机进程

本节书摘来自华章出版社《OpenACC并行程序设计:性能优化实践指南》一 书中的第3章,第3.7节,作者:[美] 罗布·法伯(Rob Farber),更多章节内容可以访问云栖社区“华章计算机”公众号查看。

性能优化 HTTPS 线程 ace 主机 MPI GPU ScreenShot

《OpenACC并行程序设计:性能优化实践指南》一 3.6 第一个并行PIConGPU实现

本节书摘来自华章出版社《OpenACC并行程序设计:性能优化实践指南》一 书中的第3章,第3.6节,作者:[美] 罗布·法伯(Rob Farber),更多章节内容可以访问云栖社区“华章计算机”公众号查看。

性能优化 函数 性能 线程 主机 MPI GPU

《OpenACC并行程序设计:性能优化实践指南》一 3.3 激光驱动电子束的粒子单元模拟

本节书摘来自华章出版社《OpenACC并行程序设计:性能优化实践指南》一 书中的第3章,第3.3节,作者:[美] 罗布·法伯(Rob Farber),更多章节内容可以访问云栖社区“华章计算机”公众号查看。

性能优化 性能 c++ GPU ScreenShot

《OpenACC并行程序设计:性能优化实践指南》一 2.5 在多核系统中并行运行

本节书摘来自华章出版社《OpenACC并行程序设计:性能优化实践指南》一 书中的第2章,第2.5节,作者:[美] 罗布·法伯(Rob Farber),更多章节内容可以访问云栖社区“华章计算机”公众号查看。

架构 性能优化 性能 HTTPS 并行计算 编程 CPU 带宽 GPU ScreenShot

《OpenACC并行程序设计:性能优化实践指南》一 2.4 优化循环

本节书摘来自华章出版社《OpenACC并行程序设计:性能优化实践指南》一 书中的第2章,第2.4节,作者:[美] 罗布·法伯(Rob Farber),更多章节内容可以访问云栖社区“华章计算机”公众号查看。

性能优化 性能 HTTPS 线程 GPU 数组 ScreenShot

《OpenACC并行程序设计:性能优化实践指南》一 2.2 描述并行度

本节书摘来自华章出版社《OpenACC并行程序设计:性能优化实践指南》一 书中的第2章,第2.2节,作者:[美] 罗布·法伯(Rob Farber),更多章节内容可以访问云栖社区“华章计算机”公众号查看。

性能优化 程序员 函数 HTTPS c++ 索引 GPU 数组 ScreenShot

《OpenACC并行程序设计:性能优化实践指南》一 1.6 控制并行资源

本节书摘来自华章出版社《OpenACC并行程序设计:性能优化实践指南》一 书中的第1章,第1.6节,作者:[美] 罗布·法伯(Rob Farber),更多章节内容可以访问云栖社区“华章计算机”公众号查看。

性能优化 HTTPS 线程 c++ 应用性能 测试 cpp 序列 编程 高性能 GPU ScreenShot

《OpenACC并行程序设计:性能优化实践指南》一 1.4 并行执行和竞争条件

本节书摘来自华章出版社《OpenACC并行程序设计:性能优化实践指南》一 书中的第1章,第1.4节,作者:[美] 罗布·法伯(Rob Farber),更多章节内容可以访问云栖社区“华章计算机”公众号查看。

性能优化 HTTPS 线程 数据流 并行计算 编程 GPU ScreenShot

31
GO