已有0人关注此标签
Mars 能利用并行和分布式技术,加速 Python 数据科学栈,包括 numpy、pandas 和 scikit-learn。同时,也能轻松与 TensorFlow、PyTorch 和 XGBoost 集成。
python 分布式 集群 PyOdps DataFrame pandas index session html MaxCompute scikit-learn Numpy Mars
在数据科学世界,Python 是一个不可忽视的存在,且有愈演愈烈之势。而其中主要的使用工具,包括 Numpy、Pandas 和 Scikit-learn 等。 Mars 在 MaxCompute 团队内部诞生,它的主要目标就是让 Numpy、pandas 和 scikit-learn 等数据科学的库能够并行和分布式执行,支持通过 RAPIDS 平台用 GPU 加速数据科学。
python 深度学习 分布式 算法 性能 DataFrame pandas GPU big data 数据科学 scikit-learn tensor Numpy Mars
Numpy 一、属性: ndarray.shape 返回一个元组,里面是各个维度的size ndarray.ndim 返回数组的维度 ndarray.dtype 返回数组数据的类型 二、方法: np.array(x, dtype=complex) 接收一个数组, dtype指定数据类型, np.zeros( (3,4) ) 接收一个代表数组维度size的元组 np.ones((3,4)) 同上 np.arange(10, 30, 5) 返回一个起始为10,每次增加5,一直到30但不包括30的数组(本例返回[10, 15, 20, 25]),一般会跟reshape配合使用。