备案控制台

开发者社区

开发者社区雷锋网文章正文

深度学习实践：如何使用Tensorflow实现快速风格迁移？

2017-08-01 2025

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

一、风格迁移简介

风格迁移（Style Transfer）是深度学习众多应用中非常有趣的一种，如图，我们可以使用这种方法把一张图片的风格“迁移”到另一张图片上：

深度学习实践：如何使用Tensorflow实现快速风格迁移？

然而，原始的风格迁移（点击查看论文）的速度是非常慢的。在GPU上，生成一张图片都需要10分钟左右，而如果只使用CPU而不使用GPU运行程序，甚至需要几个小时。这个时间还会随着图片尺寸的增大而迅速增大。

这其中的原因在于，在原始的风格迁移过程中，把生成图片的过程当做一个“训练”的过程。每生成一张图片，都相当于要训练一次模型，这中间可能会迭代几百几千次。如果你了解过一点机器学习的知识，就会知道，从头训练一个模型要比执行一个已经训练好的模型要费时太多。而这也正是原始的风格迁移速度缓慢的原因。

二、快速风格迁移简介

那有没有一种方法，可以不把生成图片当做一个“训练”的过程，而当成一个“执行”的过程呢？答案是肯定的。可看快速风格迁移（fast neural style transfer）：Perceptual Losses for Real-Time Style Transfer and Super-Resolution

快速风格迁移的网络结构包含两个部分。一个是“生成网络”（原文中为Transformation Network），一个是“损失网络”（Loss Network）。生成网络接收一个图片当做输入，然后输出也是一张图片（即风格迁移后的结果）。如下图，左侧是生成网络，右侧为损失网络：

深度学习实践：如何使用Tensorflow实现快速风格迁移？

训练阶段：首先选定一张风格图片。训练的目标是让生成网络可以有效生成图片。目标由损失网络定义。

执行阶段：给定一张图片，将其输入生成网络，输出这张图片风格迁移后的结果。

我们可以发现，在模型的“执行”阶段我们就可以完成风格图片的生成。因此生成一张图片的速度非常块，在GPU上一般小于1秒，在CPU上运行也只需要几秒的时间。

三、快速风格迁移的Tensorflow实现

话不多说，直接上我的代码的Github地址（点击可看）

还有变换效果如下。

原始图片：

深度学习实践：如何使用Tensorflow实现快速风格迁移？

风格迁移后的图片：

深度学习实践：如何使用Tensorflow实现快速风格迁移？

深度学习实践：如何使用Tensorflow实现快速风格迁移？

深度学习实践：如何使用Tensorflow实现快速风格迁移？

深度学习实践：如何使用Tensorflow实现快速风格迁移？

以上图片在GPU(Titan Black)下生成约需要0.8s，CPU（i7-6850K）下生成用时约2.9s。

关于快速风格迁移，其实之前在Github上已经有了Tensorflow的两个实现：

但是第一个项目只提供了几个训练好的模型，没有提供训练的代码，也没有提供具体的网络结构。所以实际用处不大。

而第二个模型做了完整的实现，可以进行模型的训练，但是训练出来的效果不是很好，在作者自己的博客中，给出了一个范例，可以看到生成的图片有很多噪声点：

深度学习实践：如何使用Tensorflow实现快速风格迁移？

我的项目就是在OlavHN/fast-neural-style的基础上做了很多修改和调整。

四、一些实现细节

1、与Tensorflow Slim结合

在原来的实现中，作者使用了VGG19模型当做损失网络。而在原始的论文中，使用的是VGG16。为了保持一致性，我使用了Tensorflow Slim对损失网络重新进行了包装。

Slim是Tensorflow的一个扩展库，提供了很多与图像分类有关的函数，已经很多已经训练好的模型（如VGG、Inception系列以及ResNet系列）。

下图是Slim支持的模型：

深度学习实践：如何使用Tensorflow实现快速风格迁移？

使用Slim替换掉原先的网络之后，在损失函数中，我们不仅可以使用VGG16，也可以方便地使用VGG19、ResNet等其他网络结构。具体的实现请参考源码。

2、改进转置卷积的两个Trick

原先我们需要使用网络生成图像的时候，一般都是采用转置卷积直接对图像进行上采样。

这篇文章指出了转置卷积的一些问题，认为转置卷积由于不合理的重合，使得生成的图片总是有“棋盘状的噪声点”，它提出使用先将图片放大，再做卷积的方式来代替转置卷积做上采样，可以提高生成图片的质量，下图为两种方法的对比：

深度学习实践：如何使用Tensorflow实现快速风格迁移？

对应的Tensorflow的实现：

深度学习实践：如何使用Tensorflow实现快速风格迁移？

以上为第一个Trick。

第二个Trick是文章 Instance Normalization: The Missing Ingredient for Fast Stylization 中提到的，用 Instance Normalization来代替通常的Batch Normalization，可以改善风格迁移的质量。

3、注意使用Optimizer和Saver

这是关于Tensorflow实现的一个小细节。

在Tensorflow中，Optimizer和Saver是默认去训练、保存模型中的所有变量的。但在这个项目中，整个网络分为生成网络和损失网络两部分。我们的目标是训练好生成网络，因此只需要去训练、保存生成网络中的变量。在构造Optimizer和Saver的时候，要注意只传入生成网络中的变量。

找出需要训练的变量，传递给Optimizer：

深度学习实践：如何使用Tensorflow实现快速风格迁移？

五、总结

总之是做了一个还算挺有趣的项目。代码不是特别多，如果只是用训练好的模型生成图片的话，使用CPU也可以在几秒内运行出结果，不需要去搭建GPU环境。建议有兴趣的同学可以自己玩一下。

关于训练，其实也有一段比较坎（dan）坷（teng）的调参经历，下次有时间再分享一下，今天就先写到这儿。谢谢大家！

本文作者：何之源

本文转自雷锋网禁止二次转载，原文链接

文章标签：

GPU云服务器

机器学习/深度学习

算法框架/工具

TensorFlow

异构计算

关键词：

深度学习tensorflow

TensorFlow深度学习

TensorFlow实践

深度学习迁移

深度学习风格迁移

相关实践学习

基于阿里云DeepGPU实例，用AI画唯美国风少女

本实验基于阿里云DeepGPU实例，使用aiacctorch加速stable-diffusion-webui，用AI画唯美国风少女，可提升性能至高至原性能的2.6倍。

云栖大讲堂

目录

相关文章

wljslmz

|

7天前

|

机器学习/深度学习 API 语音技术

深度学习框架-Tensorflow2：特点、架构、应用和未来发展趋势

【4月更文挑战第6天】

wljslmz

39 8 8

叫个什么名字

|

1月前

|

机器学习/深度学习算法计算机视觉

利用深度学习技术实现图像风格迁移

本文将介绍如何利用深度学习技术中的卷积神经网络，结合风格迁移算法，实现图像风格的转换。通过对图像内容和风格的理解，深度学习模型可以生成具有新风格的图像，为图像处理领域带来了新的可能性。

叫个什么名字

46 12 12

绝不原创的飞龙

|

3月前

|

机器学习/深度学习存储人工智能

TensorFlow Lite，ML Kit 和 Flutter 移动深度学习：6~11（3）

TensorFlow Lite，ML Kit 和 Flutter 移动深度学习：6~11（3）

绝不原创的飞龙

80 0 0

绝不原创的飞龙

|

3月前

|

机器学习/深度学习 Dart TensorFlow

TensorFlow Lite，ML Kit 和 Flutter 移动深度学习：6~11（5）

TensorFlow Lite，ML Kit 和 Flutter 移动深度学习：6~11（5）

绝不原创的飞龙

67 0 0

1941623231718325

|

21小时前

|

机器学习/深度学习运维监控

TensorFlow分布式训练：加速深度学习模型训练

【4月更文挑战第17天】TensorFlow分布式训练加速深度学习模型训练，通过数据并行和模型并行利用多机器资源，减少训练时间。优化策略包括配置计算资源、优化数据划分和减少通信开销。实际应用需关注调试监控、系统稳定性和容错性，以应对分布式训练挑战。

1941623231718325

8 0 0

Freedom123

|

2天前

|

机器学习/深度学习 PyTorch TensorFlow

【TensorFlow】TF介绍及代码实践

【4月更文挑战第1天】TF简介及代码示例学习

Freedom123

14 0 0

叫个什么名字

|

1月前

|

机器学习/深度学习人工智能自然语言处理

从零开始学习深度学习：入门指南与实践建议

本文将引导读者进入深度学习领域的大门，从基础概念到实际应用，为初学者提供全面的学习指南和实践建议。通过系统化的学习路径规划和案例实践，帮助读者快速掌握深度学习的核心知识和技能，迈出在人工智能领域的第一步。

叫个什么名字

39 9 9

桃李春风一杯酒

|

1月前

|

机器学习/深度学习 Python

有没有一些开源的深度学习项目可以帮助我实践所学的知识？

【2月更文挑战第14天】【2月更文挑战第40篇】有没有一些开源的深度学习项目可以帮助我实践所学的知识？

桃李春风一杯酒

19 1 1

嘿嘿就是写

|

2月前

|

机器学习/深度学习 PyTorch TensorFlow

Python中的深度学习：TensorFlow与PyTorch的选择与使用

Python中的深度学习：TensorFlow与PyTorch的选择与使用

嘿嘿就是写

51 0 0

艾派森_

|

2月前

|

机器学习/深度学习数据可视化 TensorFlow

基于tensorflow深度学习的猫狗分类识别

基于tensorflow深度学习的猫狗分类识别

艾派森_

61 1 1

雷锋网

热门文章

最新文章

Sklearn、TensorFlow 与 Keras 机器学习实用指南第三版（三）（2）

揭秘深度学习在图像识别中的创新应用

【动手学深度学习】深入浅出深度学习之线性神经网络

深度学习框架-Tensorflow2：特点、架构、应用和未来发展趋势

利用深度学习进行自然语言处理的最新进展

深度学习框架-Pytorch：特点、架构、应用和未来发展趋势

深度学习模型可视化工具——Netron使用介绍

基于深度学习的图像识别技术进展

基于深度学习的图像识别技术在自动驾驶系统中的应用

基于深度学习的图像识别技术在无人机导航中的应用

深度学习在图像识别中的应用与挑战

Anaconda+Cuda+Cudnn+Pytorch（GPU版）+Pycharm+Win11深度学习环境配置

深度学习在图像识别中的应用与挑战

深度学习在图像识别方面的应用

探索深度学习中的序列建模新范式：Mamba模型的突破与挑战

深度学习引领未来：Apollo 8.0自动驾驶感知模块的全新篇章

揭秘深度学习在图像识别中的创新应用

AI人工智能机器学习的类型：监督学习、无监督学习、半监督学习、增强学习和深度学习

【动手学深度学习】深入浅出深度学习之线性神经网络

深度学习框架-Tensorflow2：特点、架构、应用和未来发展趋势

相关课程

更多

高校精品课-复旦大学-机器学习与深度学习

深度学习框架TensorFlow入门

深度学习与自动驾驶

深度学习理论与实战（基于TensorFlow实现）

Pytorch实战

深入浅出PyTorch

相关电子书

更多

深度学习的最新进展

搜狗深度学习技术在广告推荐领域的应用

深度学习在电商搜索和聊天机器人中的应用

相关实验场景

更多

如何快速体验调用通义大模型

使用函数计算部署通义千问大模型实现AI对话

使用计算巢AI应用，快速上手实践Stable Diffusion

免费撸A10显卡！在PAI-DSW里用FaceChain训练专属形象照

函数计算X RDS PostgreSQL，基于LLM大语言模型构建AI知识库

基于Higress构建AIGC ChatBot

下一篇

阿里云oss简介和使用流程