免费将音频转成文字的快速方法

简介: 前言最近在看YouTube视频时,里面有自动字幕功能,当时非常激动,字幕很准确;其实YouTube这个功能在2010就上线了。今天就是想利用YouTube这个强大的功能,将音频转换成文本啊!因为尝试了讯飞和百度后,不只是收费,准确率也不好,特别是英文。

前言

最近在看YouTube视频时,里面有自动字幕功能,当时非常激动,字幕很准确;其实YouTube这个功能在2010就上线了。今天就是想利用YouTube这个强大的功能,将音频转换成文本啊!因为尝试了讯飞和百度后,不只是收费,准确率也不好,特别是英文。

自己的音频(视频)

如果是视频,直接在YouTube上传就可以,如果是音频,YouTube不接受纯音频文件。所以,我们得通过第三方网站 TunesToTube - Upload 上传,给音频配上画面。

上传音频后转换视频:

img_c6cec68b0a51e648fdbaffd35d03843c.png
Jietu20180223-230805.png

在YouTube视频管理,查看刚才上传的视频,需要等待一下,会自动生成字幕:

img_b70ae2c4aac36c71b7b57448e13a9b3d.png
Jietu20180223-231102.png

可以查看自动生成的字幕,并且下载!

img_bb4581a45678a7afb64149acbf3680a8.png
Jietu20180223-231146.png

YouTube的视频

如果是YouTube上已经有的视频,你想下载字幕,则可以通过第三方API来下载完整的字幕,以下是用 - YouTube字幕下载 网站示意:

img_762600cdbd525ffbd1453de66dee2614.png
Jietu20180223-232209.png

选择下载的字幕:

img_d191579cef5cc72ef90b14c9d006f437.png
Jietu20180223-232142.png

下载的字幕示意:

img_a20d8e0f4e318e0e32d26b1d066b7696.png
Jietu20180223-232557@2x.png

总结

随着今年AI人工智能的发展,谷歌的自动翻译已经给世界带来了巨大的改变,相反国内,其实一直在说AI,却没有做出大的变化,就像优酷,没有考虑谷歌的强大,一直与爱x艺视频,腾x视频都在为版本争,而且国内都是综艺视频占大头,有点可惜。希望,AI在未来能解决更多简单操作但繁琐的重复劳动工作的问题,一起加油!

参考引用


注:本文首发于 iHTCboy's blog,如若转载,请注来源

目录
相关文章
|
29天前
|
人工智能 自然语言处理 API
图片转音乐模型来了!Image to Music V2 :只需上传一张照片,自动转换成与图片内容匹配的音频!
图片转音乐模型来了!Image to Music V2 :只需上传一张照片,自动转换成与图片内容匹配的音频!
|
8月前
|
编解码
有转码、截取、拼接功能的播放器,免费还无广告,你值得安装!
虽然处理这些工作的软件有很多,但很多都太专业,很多又不好下载,很容易就下载到了广告。还有的软件免费版限制太多,处理时间稍长的音视频都需要付费。
112 1
|
1月前
|
文字识别 数据挖掘 网络安全
Python实现avif图片转jpg格式并识别图片中的文字
在做数据分析的时候有些数据是从图片上去获取的,这就需要去识别图片上的文字。Python有很多库可以很方便的实现OCR识别图片中的文字。这里介绍用EasyOCR库进行图片文字识别。easyocr是一个比较流行的库,支持超过80种语言,识别率高,速度也比较快。
25 2
|
8月前
|
机器人 语音技术
神器 | 文本转语音,直接可以合成多人多风格音频了!
为了适应更多的音频使用场景和需求,近期我们将文本转语音服务进行了升级,全新的功能将成为你配音工具的不二之选。
288 1
|
11月前
|
数据采集 Python
一日一技:如何识别一张图片的格式
一日一技:如何识别一张图片的格式
163 0
|
人工智能 文字识别 API
20行代码教你如何批量提取图片中文字
大家好,我是志斌~ 之前志斌在考研的时候遇到了一个问题,就是要将图片中的文字给提取出来,当时是J哥帮忙搞出来的,现在已经考完研了,也学会了提取方式,现在来给大家分享一下。
686 0
20行代码教你如何批量提取图片中文字
|
前端开发 JavaScript 搜索推荐
文字水印的几种实现方式
文字水印是一种强提示,一般会用在前端展示敏感、权利声明等场景下。我们简单介绍几种方法。
387 0
文字水印的几种实现方式
|
编解码 iOS开发 内存技术
iOS 录音、音频的拼接剪切以及边录边压缩转码
iOS 录音、音频的拼接剪切以及边录边压缩转码
736 0
iOS 录音、音频的拼接剪切以及边录边压缩转码
|
API 开发工具 C#
C#使用原生方法将文字朗读出来
C#使用原生方法将文字朗读出来
189 0
|
API 语音技术 Python
Python语音转文字、音频切割、语音识别
不知道你有没有录过自我介绍的视频,尤其是那种加上PPT播放的长时间视频 可能因为说错一句话就得重来,又或者因为思考而暂停时间太久又得重来,以至于弄了两个小时才做好五分钟的视频
1966 0
Python语音转文字、音频切割、语音识别