更改Office语音识别工作的语音识别引擎

时间:2022年12月14日

/

来源:我滴崽崽最可爱

/

编辑:本站小编

收藏本文

下载本文

下面是小编为大家整理的更改Office语音识别工作的语音识别引擎,本文共8篇,仅供参考,大家一起来看看吧。本文原稿由网友“我滴崽崽最可爱”提供。

篇1:更改Office语音识别工作的语音识别引擎

Office语音识别是通过语音识别引擎来完成工作的,就像多媒体播放器需要利用多媒体解码包来播放出视频、音乐一样,更改Office语音识别引擎可以用另一种语言听写或使用第三方引擎。

1、在 Microsoft Windows XP控制面板中,单击声音、语音和音频设备,再单击语音,

在 Windows 控制面板中,双击语音图标。

2、单击语音识别选项卡。

3、在语言下,选择语音识别引擎。

注释

如果您要切换语音识别引擎:

若要使用听写,您必须切换键盘布局以便与语音引擎的语言相匹配。

若要使用声音命令,请确保您正在使用的语言用户界面与语音引擎的语言用户界面相匹配。

篇2:语音识别调查报告

让计算机能听懂人的语言,是自计算机诞生以来人类便梦寐以求的,Intel创办人Gordon Moore曾说,语音技术是影响未来科技发展最关键的技术;IBM总裁Lou Gerstner指出,有朝一日,将有数十亿的人运用自然语言在Intern et上浏览、查询【’]。随着移动电话、掌上电脑、PDA等移动设备以及移动计算环境中各类智能设备的广泛应用,使用语音作为用户操作界面的要求越来越迫切,移动设备体积小,计算能力和存储空间有限,其使用场合又往往处于复杂、多变的噪声环境中,使得基于这类设备的语音识别实用技术面临许多挑战。如今语音识别的应用领域不断拓展,在军事、工业、家电、消费电子、交通等各方面都得到了广泛的应用。常见的应用有: (1>语音控制语音识别技术可实现这样的功能,利用声音来控制一台机器设备的运行。例如现在的智能家电,就可以通过语音控制其开关和其他功能的实现。语音控制一方面可以提高工作效率,另一方面也可以在人们手脚被占用的时候实现控制,解放人们的双手。

(2)语音输入利用语音识别技术,将人们的声音信号直接转换成相应的文字输入计算机系统,不仅可以代替键盘使文字的输入工作更加省力和高效,同时也为那些不熟悉键盘输入法的人们提供了一种新的文字输入途径。

(3)身份识别和指纹类似,人们的声纹也具有较强的排他性,因此可以利用语音识别来进行身份的识别和确认工作。

语音识别一般有广义和狭义之分。广义的语音识别指的是从语音信号中提取出任何人们感兴趣内容的技术,而我们通常所说的语音识别指的是狭义的语音识别,即从语音信号中提取出文本内容的技术。也就是通过算法,将语音转换成文本的过程[}2}根据识别的对象不同,语音识别大致分为3类:孤立词识别,连续语音识别,关键词识别。

其中孤立词识别是识别事先己知的孤立词,如“开始”、“结束”等;连续语音识别的任务则是识别任意的连续语音,如一个句子或者一段话;连续语音流中的关键词检测针对的也是连续语音,但它并不要求识别全部文字,而只是检测己知关键词在何处出现,如在一段话中检测“西安”、“中国”这两个词。根据语音识别系统所针对的发音人,可以将语音识别分为2类:特定人语音识别和非特定人语音识别。 其中前者只能识别特定的一个人或几个人的语音,而后者则可以被任何人使用。显然,非特定人语音识别系统更符合实际需要,但它要比特定人的识别困难得多。另外,根据语音设备和通道,可以分为桌面CPC)语音识别、电话语音识别和嵌入式设备(手机、PDA等)语音识别。不同的.采集通道会使发音的声学特性产生变形,因此需要构造各自的识别系统。

虽然当前语音识别技术在实际应用中取得了较好效果,但我们也应清醒的认识到其中存在的问题并对其进行深入的分析。目前国内外对语音识别技术研究存在的主要问题有:

(1>标准输入的问题缺乏标准输入是目前语音识别面临的主要难

题之一。因为语言、方言之间的差异,

所以很难确定一个标准的输入,导致实际使用时误识率过高,较难达到人们预期的效果。即使语言相同,我们每个人的发音习惯也不尽相同,这就导致了根据某些人的语音数据

设计出来的语音识别系统很难适应所有的使用者。因此目前绝大多数的语音识别系统在使用前,都需要使用者对其进行适应性训练,使其习惯自己的发音,以提高识别的正确率。另外,对语音识别的输入设备缺乏统一标准也是导致语音输入不标准的重要方面。

因为当前的录音设备都是以人能听清,听懂为标准进行设计的,至于如何调整输入设备的各项参数,使其适应计算机识别的特点,让识别系统能够更好的分辨,对此我们还需要做大量的数据收集,分析和研究工作。

(2)环境噪声的问题环境噪声的干扰也是语音识别研究中一个不可回避的问题。在实际应用时,我们并不能保证识别系统始终处于一个安静的环境中工作。大多数的应用场景总是存在着环境噪声,且不同场景的噪声也各不相同。我们在语音识别系统开发时很难做到训练环境和真实环境的匹配,导致很多识别系统在实验室环境下识别效果很好,但是到了实际应用的场景,一旦遇到较强的环境噪声,识别的效果就大打折扣了。所以说,噪声环境中语音识别要比安静环境下困难很多。目前解决环境噪声干扰问题的途径主要有三个:一是在语音识别的前端,即语音输入环节,开发抗噪性能更好的语音输入设备,从源头上降低语音信号中的噪声分量;二是在对己经混入了噪声的语

音信号进行特征提取时,选取抗噪性高的特征参数;三是在对语音识别系统进行训练时,充分考虑到噪声的干扰问题,进行针对性的训练以提高系统识别的鲁棒性。

(3)协同发音现象:人们在交流时很少一个字一个字的孤立发音,多数情况下都是按照自己的习惯连续发音,这时原本孤立的声学单元就会受到上下文的影响而发生模糊、变异。因此无论在语音识别系统中选取何种建模单元(词、音节、声韵母、音素),都需要对这些单元之间的相互影响做细化处理,这样就会带来模型数目的剧增和训练数据的相对医乏。

语音信号处理是以语音学和数字信号处理为基础,涉及语言学、模式识别、机器学习、人工智能、信息论等领域的一门综合性学科,它主要包括四个部分:语音识别(Speech Recognition)、语音合成(Speech Synthesis)、语音编码(SpeechCoding)和语音分类(Speech Classification)}4]。语音识别是指机器从语音信号中提取语言信息,从而使机器能够有效地理解和执行发声者的各种意图,其目的是要让机器听懂人类口述的语言,“听懂’,有两层含义,其一是指将语音转换为文本,其二是指理解语音包含的意义。通常所说的语音识别是指第一层含义,而第二层含义则属于语言理(LanguageUnderstanding)的范畴,让机器听懂我们的话语,是自动语音识别(Automatic Speech Recognition, ASR要研究的课题。ASR的最终目标是要将连续的语音自动地变换成文本字符,实现所谓的音字转换。在日常生活中,人们用数以万计的词语,组成连续的语句来进行交谈,在这种自然发音的

语句中,由于协同发音以及语调、重音和抑扬顿挫等节律的影响,很多音素的声学特性跟单字念读时差别很大,这给ASR带来了许多挑战。

在语音识别方法中,目前占主导地位的是基于统计的模式识别方法〔川。一段语音波形通过前端信号处理后可以得到一组特征序列。在给定观测序列Y的情况下识别系统采用最大后验概率准则决定输出词序列(2-1)其中,P(幼与词序列W无关,因此在式(2-1)中分母可以忽略,即 2-2式中,P(W)为语一言模型,表示特定词序列出现的先验概率,与观测语音信号无关;P(Y}W)为声学模型,表示给定词序列W情况下输出Y的概率,也就是给定声学模型输出Y的概率。如图所示,大词汇量连续语音识别系统是一般由语音信号处理、声学特征提取、声学模型、语言模型、解码器以及错误处理模块组成。从语音数据提取声学特征并输入到解码器,利用声学模型和语言模型,基于最大后验概率准则解码,并对解码输出进行错误处理,得到最终的识别结果

篇3:Office语音识别词典如何删除单词

Office语音识别有一个数据库,存储着所有的与识别工作相关的词语,这个数据库也就是语音识别词典,可以向语音识别词典中添加单词,例如公司名称,或从中删除不再使用的单词。可以有效的提高工作的效率。

一、从文档中添加多个单词

1、如果您还没执行该项操作,请打开一篇文档,该文档中包含要添加到语音识别词典中的单词。

2、在“语言”栏上,单击“语音工具” 按钮图像,然后单击“从文档取词”。

如果语音识别引擎确定词典中不需要添加词汇,您会看到一条相关消息。在该情况下,不需要执行步骤 3。

3、在“添加这些单词”下,选择不想添加到语音识别词典中的单词,然后单击“删除”,

注释 若要一次选择多个单词,请在选择的同时请按住 Ctrl。

4、单击“全部添加”。

二、听写时添加单个单词

1、在“语言”栏上,单击“语音工具”按钮图像,然后单击“添加/删除字词”。

2、在“单词”下,键入要添加的单词。

3、单击“录制发音”,再朗读单词。

识别单词时,它将被添加到“词典”下。在单词添加到列表之前,您可能需要多次朗读单词。

三、删除单词

可以删除已经添加到语音识别词典中的单词。

1、在“语言”栏上,单击“语音工具”按钮图像 ,然后单击“添加/删除字词”。

2、在“词典”下,选择要删除的单词。

若要一次选择多个单词,请在选择的同时按住 Ctrl。

3、单击“删除”,再单击“关闭”。

注释该功能在简体中文版中不可用。

篇4:win8语音识别怎么用

不知道win8语音识别怎么用?下文将演示win8语音控制使用教程,有了语音识别功能,我们就可以完全抛弃鼠标,想要体验语音控制的朋友请参考下文步骤操作吧~

--启动语音识别功能

首先,用户需要准备一部笔记本电脑和一个麦克风。Win8语音识别程序能够支持任何类型的麦克风,甚至包括内置在用户笔记本中的扩音器。不过,微软表示,价格在20美元左右的麦克风效果最佳。

激活语音识别功能最简单方法就是打开“开始”(Start)界面,输入“语音”(Speech),在搜索结果中,点击“Windows语音识别”(Windows Speech Recognition)。当你首次打开该程序时,就会进入“tutorial/introduction”模式。然后,用户根据屏幕上的提示,快速启动和运行“Windows语音识别”。这会语音识别模板就会出现在显示屏上方,点击麦克风图标,它就会变蓝,然后就可以来接受用户“语音指令”。

--使用语音识别功能

比如,如果想要打开Windows8系统中自带计算器程序,用传统方法首先就需要打开Charms Bar超级栏,然后点击进入“开始”图标,右击,打开应用程序,再点击计算器图标。不过,要是借助语音识别功能,你只需要说,“打开计算器”就OK。

以下列出了几种基本语音控制操作:

1)“打开计算器(或者Word, Excel, Internet Explorer等)”:无需点击鼠标就可以打开你所指定的程序,超级方便!

2)“转至Word (或者Excel, Internet Explorer…)”:转至你所指定的应用程序。

3)“打开文件(File. Open)”:比如,你说“编辑(Edit)”,就可以打开编辑菜单,说“全选”(Select All),就执行选择命令,

4)“打印(取消,桌面)”:通过语音可以点击任何按钮或者对话框中的任何标签。

5)“联系我们(Contact us)”:只要说出网页中的任意版块,就可以打开网页上相应连接。

6)“双击回收站(Double-click Recycle Bin)”:用户可以告诉Windows去双击或者右击任何你在屏幕中所看到的图标、程序。

7)“跳至标题(地址,或者正文)”:在邮件、网页、浏览器,或者对话框中,“Go toXXX”意思就是进入你所指定的板块。比如,“地址”就指地址框。

8)“关闭它(Close that)”:关闭最靠前窗口,当然也包括“最小化(Minimize that)”,“最大化(Maximize that)”。

9)“滚动(上下,左右)”:指上下或左右滚动窗口。此外,你也可以说“向下滚动10行”,鼠标指针向下滚动10行后停止。

10)“按F键(Shift+F、大写、下行箭头和放大3倍)”:借助语音指令可以按任何键。

--拖拉图标

以上所描述的语音指令适合点击屏幕中出现的图标,并且效果不错。但是如何“拖拉“屏幕上的图标呢?比如,当用户说“鼠标隔(Mousegrid)”时,就会在屏幕上增添一个超大3 x 3方格,总共有9个方格,且都进行了1-9的编号。

当你说,“5“时,第五个方格中又会出现尺寸更小的3 x 3小方格。以此推类,你可以通过这种方式不断的”细化“方格,直到在屏幕中将目标锁定。然后说“Four Mark”,就可以将目标定位在第四个格中,在说“Seven click”就可以点击其中的第7小方格所锁定的图标。

以上就是win8语音识别怎么用的全部内容哦~大家看明白了吗?

篇5:Office语音识别时错误的更正

在使用Office语音识别功能时,你会遇到各种错误,比如错误的听写、错误的拼写等。怎么样快速修正这些错误?

1、用右键单击某个错误。

2、在快捷菜单 (快捷菜单:显示与特定项目相关的

一列命令的菜单。要显示快捷菜单,请用右键单击某一项目或按下 Shift+F10。)上,单击可选更正。

3、如果未列出可选更正,请单击“其他”,再单击某个可选项。

注释

·如果用右键单击某个语法错误,请单击快捷菜单上的“语法”来更正错误。也可以通过单击快捷菜单上的“可选语音”来选择可选的更正。

·单击“语言”栏上的“更正” 选择更正可选项。

更正错误拼写

1、用鼠标或键盘来选择错误。

2、在“听写”模式中,请朗读“spelling mode”,稍微暂停,然后拼写更正。

例如,如果您朗读的是“sun”,但插入的文本为“son”,通过朗读“s-u-n”可以更正错误拼写,

更正错误听写

1、使用鼠标或键盘选择错误,包括错误前后的一至两个单词。

例如,如果听写“This is another example sentence”,而您看到“This is an utter example sentence”,请选择“is an utter example”。

2、朗读所选的单词,包括错误的更正。

例如,朗读“is another example”。

注释 也可以只选择不正确的单词,但听写多于一个单词时,识别准确性会更高。

重新键入更正错误

1、使用键盘或鼠标选择错误。

2、使用键盘键入更正。

提示

·朗读“scratch that”可以删除刚才朗读的最后一段语音。

·在“声音命令”模式下也可以用声音选定文本。例如,朗读“下一行”、“下一单元”、“更正”或“回车”。

篇6:Office语音识别功能的常见疑难解答

(1)我不知道语音识别是否打开,

当麦克风打开时,语音识别也就打开了,您可以在语言栏上看到听写 和声音命令。

通过查看工具菜单上的语音命令,您也可以知道是否打开了语音识别。如果语音旁边有选中标记,则语音识别是打开的。(在 Microsoft Excel 中,指向工具菜单上的语音,然后查看语音识别。)

若要打开或关闭语音,请单击语言栏上的麦克风,或者单击工具菜单上的语音(在 Excel 中为语音识别)。还可以通过口述麦克风关闭麦克风。

请记住在不使用语音识别的时候关闭麦克风。直到关闭麦克风后,语音识别才停止处理声音。

(2)当我说出公司名后,语音识别没有将其识别出来。

您可以将公司名称以及语音识别不识别的其他词汇添加到语音识别词典中,

方法是:在语言栏上,单击工具,再选择添加/删除词(参考:在Office语音识别词典中增加或删除单词)。

(3)我已尝试使用了一次语音识别,现在我无法除去语言栏。

右键单击语言栏,再单击关闭语言栏。

注释 如果已安装了输入法,则无法关闭语言栏。

(4)我关闭了语言栏,但是现在无法使其重新出现。

1、在 Microsoft Windows开始菜单上,单击控制面板,单击日期、时间、语言和区域设置,再单击区域和语言选项。

2、在区域和语言选项对话框中,单击语言选项卡,再单击文字服务和输入语言下的详细信息。

3、单击首选项下的语言栏...,选中在桌面上显示语言栏复选框,再单击确定。

篇7:强大的语音识别引擎?让电脑服从命令

让电脑听你的话,这个话题不陌生吧,WPS、OfficeXP下就能实现,可用语音输入汉字或打开“文件”、“编辑”等菜单,我这里要说的是在Windows操作系统中用语音执行“运行”、字处理软件等操作。

软件名称:语音专家V1.9

软件大小:565KB

收拾行囊

由于语音专家使用了微软公司提供的语音识别引擎,所以,您在使用之前必须安装语音识别引擎。

请到如下地址下载语音识别引擎:www.ie5.net/speechsoft/speechsdk51.exe

执行“控制面板→语音”,打开语音属性对话框,如图所示。在“语言”下选择“MicrosoftSimplifiedChinese…”(简体中文),再单击“训练配置文件”,按提示一步一步地进行语音训练就可完成语音配置。

如果大家用过MicrosoftOfficeXP的语音输入功能,对这一训练过程一定有会感到陌生,

而且,安装语音引擎和进行训练后,你还会得到一个附加的好处??可在MicrosoftOfficeXP下用语音输入汉字。同样地,如果你已安装了MicrosoftOfficeXP的语音输入法,上述过程可免。

-背包出发

启动“语音专家”,单击“设置”,根据自己所需勾选一些必要的选项。然后就能对电脑进行语音操作了,比如,对准话筒说“控制面板”,控制面板就会自动打开,怎么样,不错吧。

如果要想让它工作得更好,我们还得在“网上语音”和“常用程序”下作更进一步的设置。比如在“常用程序”下,勾选“说‘文字编辑’打开的软件”,再单击后面的文件夹图标,找到C:\\ProgramFiles\\MicrosoftOffice\\Office10(MicrosoftOfficeXP的默认安装目录)下的WINWORD.EXE,今后,只要对着话筒说“文字编辑”,Word就能自动打开。

“语言属性”对话框

声音,男女有别,老少不同。如果用户甲进行过上述语音训练,它发出语音命令电脑能听出的正确率较高。换另一个用户乙,那就会对牛弹琴,得添加一个用户:在如图所示界面中单击“新建”,新的用户进行完语音训练后,就可以他的声音为标准进行识别。当然,原用户不会删除,可在如图所示界面中进行转换。

提示:没事时,最好不要把“语音专家”打开,不然,各种声音将干扰你正常使用电脑,而且影响电脑运行其它程序的速度。

篇8:语音识别控制电话机方案

语音识别控制电话机方案

1、简介

本方案主要由电话机芯片CD802加语音识别录放模块JT802构成。

CD802的专业性、成熟性保证了此电话机的档次和品质。

而JT802的特异化功能则会满足高端用户对电话机的易用性、智能化、人性化的需求,从而大大提升产品的附加值。

2、主要功能特性:

(1)电话机的全部基本功能。

(2)语音拨号功能:说对方的名字就可接通对方电话。名字与电话的对应关系存储于长达60人的'语音电话簿中。此功能免去用户记电话号码和翻查电话本的麻烦。

(3)来电报名报号功能:来电号码在语音电话簿中有记录,则会报出来电者的姓名。此功能使用户不会漏接重要电话,也可拒接不想接的电话。

(4)电话录音功能:与人通话时,重要信息如电话号码、地址等,可以随时录下。录音最多3段、每段20秒。此功能免去用户接电话时找纸找笔的麻烦。

(5)12种特性铃声功能。

(6)200

组来电查询,100组去电查询,长达150人的普通电话簿(区别于语音电话簿。

(7)欧美流行的BabyCall功能。

3、主要优势:

与其它准备推广的语音识别拨号电话相比,我们的优势在于:

(1)声控部分增加了电话录音/回放功能、来电报名功能;

(2)电话机部分更专业、更成熟,功能也更多,更贴近电话用户的需求。

4、方案原理框图

《普通话语音》教案设计

英语语音基本知识

新教材语音教学反思

浅谈普通话语音特点

恋与制作人开场白语音

下载更改Office语音识别工作的语音识别引擎(共8篇)
更改Office语音识别工作的语音识别引擎.doc
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档
点击下载本文文档