备案控制台

开发者社区

开发者社区> 问答> 正文

对于tensorflow中的LSTM模型，无法在多次运行中重现相同的结果

我在tensorflow中训练LSTM网络。我的模型具有以下配置：

time_steps = 1700
细胞大小：120
输入要素数x = 512。
批量：34
优化器：AdamOptimizer，学习率= 0.01
时期数= 20
我有GTX 1080 Ti。我的tensorflow版本是1.8。

另外，我已经设置了随机种子tf.set_random_seed(mseed)，我为每个可训练变量的初始化器设置了随机种子，这样我可以在多次运行后重现相同的结果。

在多次训练模型之后，每次20个时期，我发现我在前几个时期（7,8或9）“在每次运行期间”实现了相同的精确损失，然后损失开始有所不同。我想知道为什么会这样; 如果可能的话，有人可以完全重现任何模型的结果。

另外，在我的情况下，我在每次迭代期间提供整个数据。也就是说，我通过时间（BPTT）进行反向传播而不是截断BPTT。换句话说，我总共有2次迭代，它也等于时期的数量。

下图说明了我的问题。请注意，每一行对应一个纪元。
pLeVJ
请注意，每列对应不同的运行。（我只包括2列/次）来证明我的观点。

最后，使用尺寸100的新功能替换输入要素，我得到更好的结果，如下图所示：
expMB
因此，我不确定这是否是硬件问题？

展开

收起

一码平川MACHEL 2019-01-22 16:43:33 3995 0

1 条回答

写回答

取消提交回答

一码平川MACHEL

据我所知，正如您可能尝试过的那样，tf.set_random_seed(seed=1)或seed等于任何其他整数可能是一种可能的解决方案。

2019-07-17 23:26:20

赞同展开评论打赏

问答分类：

机器学习/深度学习 TensorFlow 算法框架/工具

问答标签：

TensorFlow lstm lstm tensorflow TensorFlow模型 lstm模型 lstm运行

问答地址：

开发者社区 > 人工智能 > 问答

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

相关问答

pipeline加载TensorFlow架构模型，怎么指定TensorFlow使用gpu显存大小？

28

0

0

模型如何下载到本地，并通过本地pytorch或tensorflow runtime 运行推理？

408

1

0

ModelScope机器翻译模型导出为TensorFlow模型后，推理的时候怎么把字符串转化为输入？

164

4

0

请问各位同学 covnexttiny ocr模型转rknn lstm报错的问题遇到过吗？

411

14

0

请问用Blade优化基于TensorFlow的ResNet50模型的流程大概是怎样的？

553

2

0

请问对TensorFlow模型进行量化优化时量化后的模型不满足精度要求怎么办？

3222

2

0

请问对TensorFlow模型量化优化时如何执行离线INT8优化？

1914

2

0

请问对于TensorFlow模型，blade.optimize函数的model参数如何进行模型输入？

883

2

0

机器学习Tensorflow模型如何部署到PAI-EAS

260

1

0

anaconda创建的虚拟环境，运行tensorflow不报错但是也没有结果？ ?报错

540

1

0

问答排行榜

最热

最新

1 通过阿里云代备案系统进行个人快速备案 2699566

2 【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥 1818171

3 据说在家办公的程序员是这样写代码的？ 1792115

4 阿里云开放端口权限 689795

5 《阿里云服务器从入门到精通》—论坛精华帖汇总（2013.8.21更新） 599360

6 如何升级配置 536025

7 【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？ 522316

8 【精品问答】python技术1000问(1) 513945

9 Flink Forward Asia 2021 有奖问答 512767

10 Linux Bash严重漏洞修复紧急通知（已全部给出最终修复方案） 456893

11 工信部官网：www.miitbeian.gov.cn打不开解决办法 399462

12 OceanBase 使用动画（持续更新） 359227

13 阿里云LNAMP(Linux + Nginx + Apache + MySQL + PHP)环境一键安装脚本 329686

14 OSS存储服务-客户端工具 321240

15 为体验实验室取一个新名字。 307161

16 企业邮箱发送邮件时，若出现投递失败产生退信，内容提示包含如下： the mta server of * reply:550 failed to meet SPF requirements 或者 the mta server of 163.com — 163mx01.mxmail.netease.com(220.181.14.141) reply:550 MI:SPF mx14,QMCowECpA0qTiftVaeB3Cg—.872S2 1442548128 http://mail.163.com/help 303664

17 Win Server 2003-2016 加密勒索事件必打补丁合集 295097

18 FLASH播放器，在IE浏览器下显示请确定您的域名已完成备案和CNAME绑定 283451

19 安全组详解，新手必看教程 277226

20 写code还是做管理，开发者如何进行职业规划？ 268259

1 乘风问答官5月排位赛开启！ 220

2 你见过哪些独特的代码注释？ 548

3 你遇到过哪些触发NPE的代码场景？ 442

4 如何让系统具备良好的扩展性？ 1660

5 在JS编程中有哪些常见的编程“套路”或习惯？ 1372

6 表单新加了个字段A，历史数据要添加字段A的值问题 269

7 在做程序员的道路上，你掌握了什么关键的概念或技术让你感到自身技能有了显著飞跃？ 1859

8 作为一个经典架构模式，事件驱动在云时代为什么会再次流行呢？ 1632

9 宜搭：提交表单前，如何校验另一张表单的数据？ 347

10 Windows 11系统电脑自动重启后，vscode启动通义灵码插件报错：此应用无法在你的电脑上运行 146

11 如何看待首个 AI 程序员入职科技公司？ 2243

12 未启用对服务器的访问 565

13 在图像处理应用场景下，Serverless架构的优势体现在哪些方面？ 1895

14 如何处理线程死循环？ 2553

15 宜搭自定义页面，这个是怎么配置的 247

16 Idea 2024.1RC 报错提示 344

17 宜搭自己写js代码调用html或者jsx打印，宜搭写js代码导出某个容器内容为图片，钉钉端异常。 118

18 如何写出更优雅的并行程序？ 1754

19 你认为一个优秀的技术PM应该具备什么样的能力？ 2197

20 宜搭页面复制问题 415

相关课程

更多

深度学习框架TensorFlow入门

17302

24

去学习

深度学习理论与实战（基于TensorFlow实现）

485

91

去学习

跟着指南学PyTorch

143

10

去学习

9419

29

去学习

机器学习基础与回归算法

75

7

去学习

【算法实战】8. 集成方法-Adaboost

30

5

去学习

推荐问答

乘风问答官招募中！机械键盘免费拿

相关电子书

更多

使用TensorFlow搭建智能开发系统自动生成AppUI 立即下载

使用TensorFlow搭建智能开发系统自动生成App UI 立即下载

从零到一：IOS平台TensorFlow入门及应用详解 立即下载

相关实验场景

更多