1. 阿里云>
  2. 云栖社区>
  3. 主题地图>
  4. X>
  5. 训练模型

当前主题:训练模型

独家 | 谷歌发布NLP最先进预训练模型:开源BERT

作者:Jacob Devlin and Ming-Wei Chang, Research Scientists, Google AI Language 翻译:佟海宁 校对:吴金笛 文章来源:微信公众号 数据派THU 本文约2000字,建议阅读9分钟。 本文为

阅读全文

开放下载!8篇入选顶级语音领域会议的阿里论文抢先看

2019年,国际语音交流协会INTERSPEECH第20届年会将于9月15日至19日在奥地利格拉茨举行。Interspeech是世界上规模最大,最全面的顶级语音领域会议,近2000名一线业界和学界人士将会参与包括主题演讲,Tutorial,论文讲解和主会展览

阅读全文

语音顶会Interspeech 论文解读|Autoencoder-based Semi-Supervised Curriculum Learning For Out-of-domain Speaker Verification

2019年,国际语音交流协会INTERSPEECH第20届年会将于9月15日至19日在奥地利格拉茨举行。Interspeech是世界上规模最大,最全面的顶级语音领域会议,近2000名一线业界和学界人士将会参与包括主题演讲,Tutorial,论文讲解和主会展览

阅读全文

ElasticDL: Kubernetes-native 弹性分布式深度学习系统

9月11日,蚂蚁金服在 Google Developer Day Shanghai 2019 上宣布开源了基于 TensorFlow 2.0 eager execution 的分布式深度学习系统 ElasticDL。基于 TensorFlow 的支持弹性调度

阅读全文

语音顶会Interspeech 论文解读|Towards A Fault-tolerant Speaker Verification System: A Regularization Approach To Reduce The Condition Number

2019年,国际语音交流协会INTERSPEECH第20届年会将于9月15日至19日在奥地利格拉茨举行。Interspeech是世界上规模最大,最全面的顶级语音领域会议,近2000名一线业界和学界人士将会参与包括主题演讲,Tutorial,论文讲解和主会展览

阅读全文

详解阿里99大促活动页内容识别技术实现

闲鱼技术-仝辉,深宇 引言:       淘宝99大促今年会有天猫,淘宝和聚划算全员参与,有上千个页面形式的展现。其中,测试是保障活动页面的正常发布的一个必不可少的关键环节。      传统的测试方法,需要测试人员去分析这个页面是否正常生成,以及是否实现正常

阅读全文

语音顶会Interspeech 论文解读|Multi-Task Multi-Network Joint-Learning of Deep Residual Networks and Cycle-Consistency Generative Adversarial Networks for Robus

2019年,国际语音交流协会INTERSPEECH第20届年会将于9月15日至19日在奥地利格拉茨举行。Interspeech是世界上规模最大,最全面的顶级语音领域会议,近2000名一线业界和学界人士将会参与包括主题演讲,Tutorial,论文讲解和主会展览

阅读全文

语音顶会Interspeech 论文解读|Towards Language-Universal Mandarin-English Speech Recognition

2019年,国际语音交流协会INTERSPEECH第20届年会将于9月15日至19日在奥地利格拉茨举行。Interspeech是世界上规模最大,最全面的顶级语音领域会议,近2000名一线业界和学界人士将会参与包括主题演讲,Tutorial,论文讲解和主会展览

阅读全文

训练模型 相关问答

查看更多 提问题

如何解决训练模型过程中产生的字符串驻留占用过大内存问题

我训练一个自己编写的LSTM语言模型,但是由于字符串驻留问题导致zhan'y占用内存guo,python停止运行,并退出训练,想问一下有什么解决方法,谢谢。

阅读全文

你好,我想问最后一位演讲者,我们目前是通过java调用tensorflow训练好的模型,可以做成在线上训练模型的同时,不断更新模型的准确率吗

你好,我想问最后一位演讲者,我们目前是通过java调用tensorflow训练好的模型,可以做成在线上训练模型的同时,不断更新模型的准确率吗

阅读全文

深度学习做回归问题,需要对数据做标准化吗?输出层是否需要激活函数?

1、一些 Paper 会将数据做 min-max normalization 或者 z-score normalization,然后在输出层可能会用 tanh(对应缩放到 [-1, 1])或者 sigmoid(缩放到 [0, 1])。然而有人认为做 Regre

阅读全文

怎么利用阿里云的计算资源训练深度学习模型

请问各位大佬,怎么利用阿里云的计算资源训练深度学习模型?我已经写好了整个py文件,现在想要在阿里云上训练,该怎么做?谢谢各位大佬!

阅读全文

用Keras中的LSTM模型进行predict怎么分time-step逐个输入而不是先构建一个数据矩阵直接输入?

大家好,我现在训练了一个LSTM模型,在用它进行predict的时候需要首先构建一个(1,time_steps, dims)的数据矩阵然后输入模型中,但是现在每个time_step的数据是随时间不断产生的,怎么做才能将其一个个输入模型中同步进行预测而不是收集完

阅读全文

keras中的lstm模型怎么分time-step输入?

大家好,我有个训练好了的lstm模型(Keras),进行正向传播的时候都是构建一个(n_samples, time_steps,feature_dims)的数据矩阵进行predict,但是现在我的每个time_step的数据是分时获得的,能否获取一个time_

阅读全文

对于tensorflow中的LSTM模型,无法在多次运行中重现相同的结果

我在tensorflow中训练LSTM网络。我的模型具有以下配置: time_steps = 1700 细胞大小:120 输入要素数x = 512。 批量:34 优化器:AdamOptimizer,学习率= 0.01 时期数= 20 我有GT

阅读全文

如何使用pickle进行k-means聚类

现在我正在学习k-means聚类我想要使用pickle来转储和加载我训练过的模型如何做到这一点。 我的代码是: import numpy as np import matplotlib.pyplot as plt import pandas a

阅读全文