容器服务Docker&Kubernetes 关注
手机版

基于Docker的Tensorflow实验环境

  1. 云栖社区>
  2. 容器服务Docker&Kubernetes>
  3. 博客>
  4. 正文

基于Docker的Tensorflow实验环境

易立 2016-09-14 16:51:56 浏览44818 评论7

摘要: 利用Docker和阿里云容器服务轻松在本地和云端搭建Tensorflow的学习环境

tensorflow_jpeg

本系列将利用Docker和阿里云容器服务,帮助您上手TensorFlow的机器学习方案

机器学习作为人工智能重要的技术,已经在计算机视觉、自然语言处理、医学诊断等等领域得到了广泛的应用。TensorFlow 是谷歌推出的开源的分布式机器学习框架,它也是Github社区上最受关注的机器学习项目,目前点赞已经超过3万个星。

TensorFlow提供了多种安装方式,配置也相对简单,但是对于初学者而言,从零开始搭建一个TensorFlow学习环境依然具有一些挑战。幸运的是TensorFlow提供了基于Docker的部署方式,开发者可以快速上手。

本文是系列中的第一篇文章,会基于Docker快速创建一个Tensorflow学习环境。

准备Docker环境

为了利用Docker和Docker Compose编排搭建实验环境,我们需要

安装Docker for Mac/Windows 或在Linux上安装Docker和Docker Compose。可以使用阿里云提供Docker EngineDocker Toolbox的镜像网站

本地环境搭建

在GitHub上有很多Tensorflow的学习资料, 其中 https://github.com/aymericdamien/TensorFlow-Examples 是一个很好的教程。在文中提供了由浅入深的示例来介绍Tensorflow的功能。

首先执行如下命令获得教程代码 (包含对Tensorflow 1.0 的支持)

git clone https://github.com/denverdino/TensorFlow-Examples
cd TensorFlow-Examples

为了运行这个教程你需要安装Tensorflow的执行环境,并配置"jupyter", "tensorboard"来进行交互操作。

一个最简单的方法是在当前目录,创建如下的docker-compose.yml模板

version: '2'
services:
  jupyter:
    image: registry.cn-hangzhou.aliyuncs.com/denverdino/tensorflow:1.0.0
    container_name: jupyter
    ports:
      - "8888:8888"
    environment:
      - PASSWORD=tensorflow
    volumes:
      - "/tmp/tensorflow_logs"
      - "./notebooks:/root/notebooks"
    command:
      - "/run_jupyter.sh"
      - "/root/notebooks"
  tensorboard:
    image: registry.cn-hangzhou.aliyuncs.com/denverdino/tensorflow:1.0.0
    container_name: tensorboard
    ports:
      - "6006:6006"
    volumes_from:
      - jupyter
    command:
      - "tensorboard"
      - "--logdir"
      - "/tmp/tensorflow_logs"
      - "--host"
      - "0.0.0.0"

执行如下命令一键创建Tensorflow的学习环境

docker-compose up -d 

我们可以检查启动的Docker容器

yili@yili-mbp:~/work/TensorFlow-Examples$ docker-compose ps

              Name                            Command               State                Ports               
------------------------------------------------------------------------------------------------------------
tensorflowexamples_jupyter_1       /run_jupyter.sh /root/note ...   Up      6006/tcp, 0.0.0.0:8888->8888/tcp 
tensorflowexamples_tensorboard_1   tensorboard --logdir /tmp/ ...   Up      0.0.0.0:6006->6006/tcp, 8888/tcp 

可以直接通过 http://127.0.0.1:8888/ 从浏览器中访问Tensorflow的Jupyter交互实验环境

登录密码为: tensorflow

14738178907665

通过 http://127.0.0.1:6006 从浏览器中访问模型可视化工具TensorBoard
注:可以运行 http://127.0.0.1:8888/notebooks/4_Utils/tensorboard_basic.ipynb 来实验Tensorboard的功能,示例中Tensorboard容器配置的log目录是 “/tmp/tensorflow_logs”。对于用户自己的notebook,可以参照tensorboard_basic在代码中设置log的输出路径。

14738194651219

注:

  • 其中registry.cn-hangzhou.aliyuncs.com/denverdino/tensorflow:1.0.0是基于tensorflow/tensorflow:1.0.0镜像构建的,只添加了apt源和pipy源的阿里云镜像。 大家也可以参照https://github.com/denverdino/tensorflow-docker中的Dockerfile自己构建,预先添加自己所需的python库、算法库等资源。
  • 利用volumes机制,jupyter可以直接从当前notebooks目录获取示例。jupyter和tensorboard两个容器也通过可以文件卷来共享事件日志。

阿里云容器服务上体验

阿里云容器服务支持Docker Compose模板部署,通过下面模板我们可以轻松把Tensorflow的学习环境部署到云端

version: '2'
services:
  jupyter:
    image: registry.cn-hangzhou.aliyuncs.com/denverdino/tensorflow-examples:1.0.0
    volumes:
      - "/tmp/tensorflow_logs"
    environment:
      - PASSWORD=tensorflow
    labels: 
      aliyun.routing.port_8888: jupyter
    command:
      - "/run_jupyter.sh"
      - "/root/notebooks"
  tensorboard:
    image: registry.cn-hangzhou.aliyuncs.com/denverdino/tensorflow:1.0.0
    labels: 
      aliyun.routing.port_6006: tensorboard
    volumes_from:
      - jupyter
    command:
      - "tensorboard"
      - "--logdir"
      - "/tmp/tensorflow_logs"
      - "--host"
      - "0.0.0.0"

注:

  • 利用aliyun.routing标签,我们可以轻松定义Jupyter和TensorBoard的访问访问端点
  • 如果是老集群,需要点击容器服务agent升级来提供所需特性和稳定性增强。

几分钟之后,我们就可以在云端有一个学习环境来体验Tensorflow。

14738212612862

14738177187646

14738178032537

14738178506257

总结

我们可以利用Docker和阿里云容器服务轻松在本地和云端搭建Tensorflow的学习环境。Docker作为一个标准化的软件交付手段,可以大大简化应用软件的部署和运维复杂度。阿里云容器服务支持以Docker Compose的方式进行容器编排,并提供了众多扩展,可以方便地支持基于容器的微服务应用的云端部署和管理。

阿里云容器服务还会和高性能计算(HPC)团队一起配合,之后在阿里云上提供结合GPU加速和Docker集群管理的机器学习解决方案,在云端提升机器学习的效能。

想了解更多容器服务内容,请访问 https://www.aliyun.com/product/containerservice

【云栖快讯】阿里云栖开发者沙龙(Java技术专场)火热来袭!快来报名参与吧!  详情请点击

网友评论

1F
nekoneko

你好按照教程,我已经进行到“可以直接通过 http://127.0.0.1:8888/tree 从浏览器中访问Tensorflow的Jupyter交互实验环境”这一步了,但是当我在浏览器中想要访问http://127.0.0.1:8888/tree时,总是网页告诉我127.0.0.1拒绝了我的访问,想问一下,监听此端口前还有没有什么要准备的工作?

易立

你的Docker是怎么安装的Docker Machine还是, Docker for Windows/Mac?

nekoneko

后者,已经解决了,谢谢回复

嘴强网哲

请问,是如何解决的

1386888274547141

@nekoneko 非常的不具备分享精神呀

袋鼠利卡提

可能层主忘记在这里发过言了

1878207670465392

那我回答吧.
solve:

It is an selinux issue.    
You can temporarily issue    
su -c "setenforce 0"
on the host to access or else add an selinux rule by running    
chcon -Rt svirt_sandbox_file_t /path/to/volume

or

If you are using Docker 1.7 you can do this by doing either 
    -v /home/share:/home/share:z 
or 
    -v /home/share:/home/share:Z 
depending on if you want it to be shared or private.
评论
2F
易立

本文已经更新支持Tensorflow 1.0.0

3F
阳春白雪08

阿里云优惠券分享给你,
https://promotion.aliyun.com/ntms/act/ambassador/sharetouser.html?userCode=ecw04enl&utm_source=ecw04enl
用优惠券购买或者升级阿里云相应产品会有特惠惊喜哦!把想要买的产品的幸运券都领走吧!快下手,马上就要抢光了。 注意在手机上下订单不能使用优惠券的哦。

您的八折推荐码如下:vl9sqt,a9wlha,4lvolc,zo9gj0,ciqa6f,amzwf8,qh6tzz,0f6hfv

4F
jamboo

我的也是一样,无法建立到 127.0.0.1:8888 服务器的连接。 windows10版本。

jamboo

你好按照教程,我已经进行到“可以直接通过 http://127.0.0.1:8888/tree 从浏览器中访问Tensorflow的Jupyter交互实验环境”这一步了,但是当我在浏览器中想要访问http://127.0.0.1:8888/tree时,总是网页告诉我127.0.0.1拒绝了我的访问,想问一下,监听此端口前还有没有什么要准备的工作?

易立

Windows环境下,需要使用Docker虚拟机IP地址

评论
5F
卡卡罗特01

可以部署不同版本的tensorflow吗?用户需要什么版本的tensorflow可供选择吗?

易立

https://cr.console.aliyun.com/#/imageDesc/4094/detail
可以看到支持的Tensorflow版本,最新1.4.1

评论
6F
1612096456938752

您好,请问为什么我这里notebooks文件夹下总是空的

7F
无处藏身

您好,我是用docker for windows装的。Docker容器正常启动,能打开页面。docker stop jupyter后再docker start jupyter就报
Error response from daemon: error while creating mount source path '/host_mnt/c/Users/user/TensorFlow-Examples/notebooks': mkdir /host_mnt/c: file exists
Error: failed to start containers: jupyter
请问是哪出问题了吗