1. 云栖社区>
  2. 全部标签>
  3. #Mars#
Mars

#Mars#

已有0人关注此标签

内容分类:
博客 | 问答 | 视频 | 资料 |

MaxCompute Mars 完全指南

Mars 能利用并行和分布式技术,加速 Python 数据科学栈,包括 numpy、pandas 和 scikit-learn。同时,也能轻松与 TensorFlow、PyTorch 和 XGBoost 集成。

python 分布式 集群 PyOdps DataFrame pandas index session html MaxCompute scikit-learn Numpy Mars

Spark DataFrame 不是真正的 DataFrame

最早的 "DataFrame" ,来源于贝尔实验室开发的 S 语言。R 语言,作为 S 语言的开源版本,于 2000 年发布了第一个稳定版本,并且实现了 dataframe。pandas 于 2009 年被开发,Python 中于是也有了 DataFrame 的概念。

python SQL Apache spark scala PyOdps DataFrame pandas Mars

当 Mars 遇上 RAPIDS:用 GPU 以并行的方式加速数据科学

在数据科学世界,Python 是一个不可忽视的存在,且有愈演愈烈之势。而其中主要的使用工具,包括 Numpy、Pandas 和 Scikit-learn 等。 Mars 在 MaxCompute 团队内部诞生,它的主要目标就是让 Numpy、pandas 和 scikit-learn 等数据科学的库能够并行和分布式执行,支持通过 RAPIDS 平台用 GPU 加速数据科学。

python 深度学习 分布式 算法 性能 DataFrame pandas GPU big data 数据科学 scikit-learn tensor Numpy Mars

Mars 开源月报(2020.3)

本月,Mars 发布了 0.4.0b1 ,0.4.0b2 和 0.3.2 以及 0.3.3,点击链接查看详细的 Release Notes。本月两次发布版本是特殊情况,0.4.0b2 修复了 0.4.0b1 中比较紧急的问题。

python 函数 开源 DataFrame mean csv github Mars

并行正则采样排序算法及在 Mars 中的应用

相信大家对排序算法都非常熟悉了,快速排序、堆排序、归并排序等等。如果我们想在一个很大的数据集上进行排序,能利用上多核,甚至是分布式集群,有什么办法么? 本文就介绍一种并行排序算法:并行正则采样排序算法(Parallel Sorting by Regular Sampling),简称 PSRS 算法。

python 分布式 算法 排序 钉钉 数组 排序算法 Numpy Mars

Mars 算法实践——人脸识别

Mars 是一个基于矩阵的统一分布式计算框架,在之前的文章中已经介绍了 Mars 是什么, 以及 Mars 分布式执行 ,而且 Mars 已经在 GitHub 中开源。当你看完 Mars 的介绍可能会问它能做什么,这几乎取决于你想做什么,因为 Mars 作为底层运算库,实现了 numpy 70% 的常用接口。

python 分布式 算法 session 人脸识别 tensor Numpy Mars svd

Mars 如何分布式地执行

先前,我们已经介绍过 Mars 是什么。如今 Mars 已在 Github 开源并对内上线试用,本文将介绍 Mars 已实现的分布式执行架构,欢迎大家提出意见。 架构 Mars 提供了一套分布式执行 Tensor 的库。

分布式 集群 PyOdps 磁盘 存储 tensor Mars Arrow

Mars 是什么、能做什么、如何做的——记 Mars 在 PyCon China 2018 上的分享

最近,在 PyCon China 2018 的北京主会场、成都和杭州分会场都分享了我们最新的工作 Mars,基于矩阵的统一计算框架。本文会以文字的形式对 PyCon 中国上的分享再进行一次阐述。 听到 Mars,很多第一次听说的同学都会灵魂三问:Mars 是什么,能做什么,怎么做的。

python 分布式 机器学习 性能 多进程 pandas GPU Numpy Mars cupy numexpr

Mars——基于张量的统一分布式计算框架

很高兴在这里宣布我们的新项目:Mars,一个基于张量的统一分布式计算框架。我们已经在 Github 开源:https://github.com/mars-project/mars 。 背景 Python Python 是一门相当古老的语言了,如今,在数据科学计算、机器学习、以及深度学习领域,Python 越来越受欢迎。

python 深度学习 分布式 大数据 算法 PyOdps pandas 分布式计算 actor scikit-learn tensor Numpy Mars ndarray cupy

阿里云MaxCompute 2018-12月刊

MaxCompute12月刊等待您的查收,12月产品更新文档、技术直播干货整理,1月最新产品发布动态,详情请阅读本文

分布式 大数据 线下活动 aliyun MaxCompute Mars

1
GO