使用语音即时校对输入内容

简介:

 

 

此文将介绍利用微软TTS引擎,在录入数据时进行即时语音校对的示例。

 

这是一项非常简单且非常实用的技术,此功能在行业软件中使用的话,将会使用户的录入准确率大幅提高,还可减少甚至取消后期核对工作。

 

你需要使用以下类库来操作TTS

 

 

在文章末尾处提供的源代码中将包含此类库。

 

现在开始编写这个示例程序:

 

新建一个WinForm项目,引入上述dll,在窗体后台代码中添加对其命名空间的引用:

 

 

using  DotNetSpeech;

 

 

由于我们还需要用到正则表达式,所以也将其所在命名空间一并引用:

 

 

using  System.Text.RegularExpressions;

 

 

然后来设计一个基本的用户界面:

 

 

添加一个BackgroundWorker组件:

 

 

为其DoWork事件添加处理:

 

 

private   void  backgroundWorker1_DoWork( object  sender, DoWorkEventArgs e)

{

        SpeechVoiceSpeakFlags SpFlags 
=  SpeechVoiceSpeakFlags.SVSFlagsAsync;

        SpVoice Voice 
=   new  SpVoice();

        Voice.Rate 
=   - 3 ;

        Voice.Speak(e.Argument.ToString(), SpFlags);

}

 

 

Voice.Rate属性是用来设置语速的修正值的,我希望它读慢点,所以就设为了-3

 

这个事件处理的功能就是在后台将接收到的字符串通过TTS念出来。

 

我们再来编写一个方法,来统一对backgroundWorker1进行调用:

 

 

void  朗读( object  内容)

{

    
try

    {

        backgroundWorker1.RunWorkerAsync(内容);

    }

    
catch  (Exception er)

    {

        MessageBox.Show(er.Message, 
" 提示 " , MessageBoxButtons.OK, MessageBoxIcon.Error);

    }

}

 

 

为了便于演示,加上我个人习惯,我将此方法名称设为了中文。

 

由于语音处理需要一定时间,在此期间如果再度调用backgroundWorker1的RunWorkerAsync方法,将会引发异常,所以需要进行捕获。

 

实际应用中如需要照顾较高速度的录入,可以采用多个BackgroundWorker组件,轮流滚动处理。

 

接下来就是为每个输入框定义朗读方式了,我们会在用户按下回车键时,进行语音处理,并将光标跳转到下一个输入框。

 

首先设置序号输入框的事件处理:

 

 

private   void  numericUpDown1_KeyDown( object  sender, KeyEventArgs e)

{

    
if  (e.KeyData  !=  Keys.Enter)  return ;

    朗读(numericUpDown1.Value);

    textBox1.Select();

}

 

 

然后是品名的:

 

 

private   void  textBox1_KeyDown( object  sender, KeyEventArgs e)

{

    
if  (e.KeyData  !=  Keys.Enter)  return ;

    朗读(textBox1.Text);

    numericUpDown2.Select();

}

 

 

这两个都比较简单,九十直接念出原文。

 

单价则有些不同:

 

 

private   void  numericUpDown2_KeyDown( object  sender, KeyEventArgs e)

{

    
if  (e.KeyData  !=  Keys.Enter)  return ;

    朗读(
" "   +  numericUpDown2.Value);

    numericUpDown3.Select();

}

 

 

在其内容前加了人民币符号,它阅读时就会这样读:九百六十七元

 

数量与之类似:

 

 

private   void  numericUpDown3_KeyDown( object  sender, KeyEventArgs e)

{

    
if  (e.KeyData  !=  Keys.Enter)  return ;

    朗读(numericUpDown3.Value 
+   " " );

    textBox2.Select();

}

 

 

内部编号有些特殊,我期望它能够将每个字母或数字都单独念出,这可以通过加注拼写标记来实现:“<spell></spell>”

但是这样还有一个问题,就是他读数字的时候会将其读作英文,这不是我们所希望的,这还需通过加注语言标记来修正:“<voice required=""Language=804""></voice>”

故此我们需要附属一个方法来将源文本格式化:

 

 

private   void  textBox2_KeyDown( object  sender, KeyEventArgs e)

{

    
if  (e.KeyData  !=  Keys.Enter)  return ;

    朗读(加注中文标记(textBox2.Text));

    button1.Select();

}

 

string  加注中文标记( string  原字符串)

{

    
return   string .Format( " <spell>{0}</spell> " , Regex.Replace(原字符串,  @" (.) " @" <voice required=""Language=804"">$1</voice> " ));

}

 

 

好了,最后是提交按钮的事件处理,我们也要让他朗读点东西:

 

 

private   void  button1_Click( object  sender, EventArgs e)

{

    listBox1.Items.Add(
new

    {

        序号 
=  numericUpDown1.Value,

        品名 
=  textBox1.Text,

        价格 
=  numericUpDown2.Value,

        数量 
=  numericUpDown3.Value,

        内部编号 
=  textBox2.Text

    });

    朗读(numericUpDown1.Value 
+   " 号,添加完毕 " );

    numericUpDown1.Value
++ ;

    numericUpDown2.Value 
=   0 ;

    numericUpDown3.Value 
=   1 ;

    textBox1.Text 
=  textBox2.Text  =   "" ;

    numericUpDown1.Select();

}

 

 

至此这个示例就完成了,其使用效果见下面这段视频:

 

 

源代码下载

 


 

插播个小喇叭广播:

 

我的MailMail现已正式发布,现在开始到9月1日0时止举办免费赠送注册码活动,欢迎参与^^:http://www.cnblogs.com/SkyD/archive/2008/08/28/1278463.html

 

  


本文转自斯克迪亚博客园博客,原文链接:http://www.cnblogs.com/SkyD/archive/2008/08/28/1278478.html,如需转载请自行联系原作者

相关文章
|
2月前
|
机器学习/深度学习 人工智能 数据安全/隐私保护
免费交互式大模型在线图像去除水印.擦除.替换和增强照片项目代码(免费在线图像修复工具)
免费交互式大模型在线图像去除水印.擦除.替换和增强照片项目代码(免费在线图像修复工具)
46 0
|
18天前
|
API Python
对于超过5000字符的文本,建议使用批量翻译接口
对于超过5000字符的文本,建议使用批量翻译接口
11 4
|
1月前
|
机器学习/深度学习 搜索推荐 小程序
数字人播报视频这么流行,你想要做一个吗
数字人播报视频这么流行,你想要做一个吗
25 0
|
1月前
|
人工智能 机器人 Android开发
ChatGPT新增朗读功能,可以语音播报生成结果
【2月更文挑战第15天】ChatGPT新增朗读功能,可以语音播报生成结果
38 1
ChatGPT新增朗读功能,可以语音播报生成结果
|
4月前
|
人工智能
AI批量写文章伪原创:基于ChatGPT长文本模型,实现批量改写文章、批量回答问题(长期更新)
AI批量写文章伪原创:基于ChatGPT长文本模型,实现批量改写文章、批量回答问题(长期更新)
109 1
|
4月前
|
SQL 数据可视化 数据库
聊天记录年度报告一览无余:轻松多格式导出永久保存,深度智能分析
聊天记录年度报告一览无余:轻松多格式导出永久保存,深度智能分析
聊天记录年度报告一览无余:轻松多格式导出永久保存,深度智能分析
|
6月前
持续输出:自媒体持续输出文字内容、视音频创作(视频课程、书籍章节)
持续输出:自媒体持续输出文字内容、视音频创作(视频课程、书籍章节)
|
7月前
|
存储 Shell
shell写一个录制的语音转化为文字的脚本
shell写一个录制的语音转化为文字的脚本
41 1
|
8月前
vbs自动阅读语音播放
让电脑自动播放txt文件中的内容。
52 0
|
10月前
|
人工智能
批量提取某音视频文案(二)
介绍批量提取视频文案的流程, 以及做视频的步骤
351 0