免费将音频转成文字的快速方法

简介: 前言最近在看YouTube视频时,里面有自动字幕功能,当时非常激动,字幕很准确;其实YouTube这个功能在2010就上线了。今天就是想利用YouTube这个强大的功能,将音频转换成文本啊!因为尝试了讯飞和百度后,不只是收费,准确率也不好,特别是英文。

前言

最近在看YouTube视频时,里面有自动字幕功能,当时非常激动,字幕很准确;其实YouTube这个功能在2010就上线了。今天就是想利用YouTube这个强大的功能,将音频转换成文本啊!因为尝试了讯飞和百度后,不只是收费,准确率也不好,特别是英文。

自己的音频(视频)

如果是视频,直接在YouTube上传就可以,如果是音频,YouTube不接受纯音频文件。所以,我们得通过第三方网站 TunesToTube - Upload 上传,给音频配上画面。

上传音频后转换视频:

img_c6cec68b0a51e648fdbaffd35d03843c.png
Jietu20180223-230805.png

在YouTube视频管理,查看刚才上传的视频,需要等待一下,会自动生成字幕:

img_b70ae2c4aac36c71b7b57448e13a9b3d.png
Jietu20180223-231102.png

可以查看自动生成的字幕,并且下载!

img_bb4581a45678a7afb64149acbf3680a8.png
Jietu20180223-231146.png

YouTube的视频

如果是YouTube上已经有的视频,你想下载字幕,则可以通过第三方API来下载完整的字幕,以下是用 - YouTube字幕下载 网站示意:

img_762600cdbd525ffbd1453de66dee2614.png
Jietu20180223-232209.png

选择下载的字幕:

img_d191579cef5cc72ef90b14c9d006f437.png
Jietu20180223-232142.png

下载的字幕示意:

img_a20d8e0f4e318e0e32d26b1d066b7696.png
Jietu20180223-232557@2x.png

总结

随着今年AI人工智能的发展,谷歌的自动翻译已经给世界带来了巨大的改变,相反国内,其实一直在说AI,却没有做出大的变化,就像优酷,没有考虑谷歌的强大,一直与爱x艺视频,腾x视频都在为版本争,而且国内都是综艺视频占大头,有点可惜。希望,AI在未来能解决更多简单操作但繁琐的重复劳动工作的问题,一起加油!

参考引用


注:本文首发于 iHTCboy's blog,如若转载,请注来源

目录
相关文章
|
2月前
|
人工智能 自然语言处理 API
图片转音乐模型来了!Image to Music V2 :只需上传一张照片,自动转换成与图片内容匹配的音频!
图片转音乐模型来了!Image to Music V2 :只需上传一张照片,自动转换成与图片内容匹配的音频!
|
9月前
|
编解码
有转码、截取、拼接功能的播放器,免费还无广告,你值得安装!
虽然处理这些工作的软件有很多,但很多都太专业,很多又不好下载,很容易就下载到了广告。还有的软件免费版限制太多,处理时间稍长的音视频都需要付费。
117 1
|
2月前
|
机器学习/深度学习 搜索推荐 计算机视觉
字节推出DreamTuner:只需提供一张图片,就能帮你生成与该图片主题风格一致的新图像
【2月更文挑战第17天】字节推出DreamTuner:只需提供一张图片,就能帮你生成与该图片主题风格一致的新图像
45 2
字节推出DreamTuner:只需提供一张图片,就能帮你生成与该图片主题风格一致的新图像
|
9月前
|
机器人 语音技术
神器 | 文本转语音,直接可以合成多人多风格音频了!
为了适应更多的音频使用场景和需求,近期我们将文本转语音服务进行了升级,全新的功能将成为你配音工具的不二之选。
298 1
|
9月前
|
缓存
实战--实现任意格式文件的音视频播放器
实战--实现任意格式文件的音视频播放器
30 0
|
6月前
|
存储 Cloud Native Linux
音视频 ffmpeg命令图片与视频互转
音视频 ffmpeg命令图片与视频互转
|
11月前
|
编解码
语音厅源码实用功能屏幕的转换
说了这么多,其实最终目的是告诉大家语音厅源码屏幕转换功能的重要性,当然不只是这一个功能重要,语音厅源码的各个功能都是很重要的,它们共同组成了语音厅源码平台
语音厅源码实用功能屏幕的转换
|
前端开发 JavaScript 搜索推荐
文字水印的几种实现方式
文字水印是一种强提示,一般会用在前端展示敏感、权利声明等场景下。我们简单介绍几种方法。
394 0
文字水印的几种实现方式
|
算法 图形学 数据安全/隐私保护
Unity 之 音频类型和编码格式介绍
Inspector窗口显示多个导入设置。这些设置决定了:加载行为,压缩行为,质量,采样率,以及是否支持双声道音频。
376 0
Unity 之 音频类型和编码格式介绍
|
数据采集 存储 JavaScript
如何将录制的DOM转成视频文件
如何将录制的DOM转成视频文件
957 0
如何将录制的DOM转成视频文件