1、首先安装Python程序推荐37
2、下载 pyttsx3库。
3、将需要转换的文本和程序放到一起。
4、运行程序就会朗读文本和保存文本朗读的语音文件。
以下是源代码:
import pyttsx3
with open ( 'wordtxt' , encoding = 'utf-8' ) as obj:
line=objreadline()
engine=pyttsx3init()
rate=enginegetProperty( 'rate' )
enginesetProperty( 'rate' , 160 )
volume=enginegetProperty( 'volume' )
enginesetProperty( 'volume' , 06 )
enginesay(line)
enginesave_to_file(line, 'abcmp3' )
enginerunAndWait()
参考一下 :speechlib语音识别
C# 实现中文发音或中文语音识别 2008-10-18 07:44在net中,对英文语音有较好的支持,但是对中文语音的支持还没有加入进来,我们要想实现中文发音或中文语音识别,必需先安装微软的Speech Application SDK(SASDK),它的最新版本是 SAPI 51 他能够识别中、日、英三种语言,你可以在这里下载:http://wwwmicrosoftcom/speech/download/sdk51/,需要安装这两个文件Speech SDK 51和51 Language Pack,其中51 Language Pack可以选择安装支持的语言。
安装好以后,我们就可以开始进行语音程序的开发了,当然,在这之前我们需要把SAPIdll通过如下图所示添加到引用中
下面我们设计一个能够朗读中英文混合语言的类:
我们将用单例模式实现该类,类的代码如下,我们将详细解释:
public class Speach
{
private static Speach _Instance = null ;
private SpeechLibSpVoiceClass voice =null;
private Speach()
{
BuildSpeach() ;
}
public static Speach instance()
{
if (_Instance == null)
_Instance = new Speach() ;
return _Instance ;
}
private void SetChinaVoice()
{
voiceVoice = voiceGetVoices(stringEmpty,stringEmpty)Item(0) ;
}
private void SetEnglishVoice()
{
voiceVoice = voiceGetVoices(stringEmpty,stringEmpty)Item(1) ;
}
private void SpeakChina(string strSpeak)
{
SetChinaVoice() ;
Speak(strSpeak) ;
}
private void SpeakEnglishi(string strSpeak)
{
SetEnglishVoice() ;
Speak(strSpeak) ;
}
public void AnalyseSpeak(string strSpeak)
{
int iCbeg = 0 ;
int iEbeg = 0 ;
bool IsChina = true ;
for(int i=0;i<strSpeakLength;i++)
{
char chr = strSpeak ;
if (IsChina)
{
if (chr<=122&&chr>=65)
{
int iLen = i - iCbeg ;
string strValue = strSpeakSubstring(iCbeg,iLen) ;
SpeakChina(strValue) ;
iEbeg = i ;
IsChina = false ;
}
}
else
{
if (chr>122||chr<65)
{
int iLen = i - iEbeg ;
string strValue = strSpeakSubstring(iEbeg,iLen) ;
thisSpeakEnglishi(strValue) ;
iCbeg = i ;
IsChina = true ;
}
}
}//end for
if (IsChina)
{
int iLen = strSpeakLength - iCbeg ;
string strValue = strSpeakSubstring(iCbeg,iLen) ;
SpeakChina(strValue) ;
}
else
{
int iLen = strSpeakLength - iEbeg ;
string strValue = strSpeakSubstring(iEbeg,iLen) ;
SpeakEnglishi(strValue) ;
}
}
private void BuildSpeach()
{
if (voice == null)
voice = new SpVoiceClass() ;
}
public int Volume
{
get
{
return voiceVolume ;
}
set
{
voiceSetVolume((ushort)(value)) ;
}
}
public int Rate
{
get
{
return voiceRate ;
}
set
{
voiceSetRate(value) ;
}
}
private void Speak(string strSpeack)
{
try
{
voiceSpeak(strSpeack,SpeechVoiceSpeakFlagsSVSFlagsAsync) ;
}
catch(Exception err)
{
throw(new Exception("发生一个错误:"+errMessage)) ;
}
}
public void Stop()
{
voiceSpeak(stringEmpty,SpeechLibSpeechVoiceSpeakFlagsSVSFPurgeBeforeSpeak) ;
}
public void Pause()
{
voicePause() ;
}
public void Continue()
{
voiceResume() ;
}
}//end class
在 private SpeechLibSpVoiceClass voice =null;这里,我们定义个一个用来发音的类,并且在第一次调用该类时,对它用BuildSpeach方法进行了初始化。
我们还定义了两个属性Volume和Rate,能够设置音量和语速。
我们知道,SpVoiceClass 有一个Speak方法,我们发音主要就是给他传递一个字符串,它负责读出该字符串,如下所示。
private void Speak(string strSpeack)
{
try
{
voiceSpeak(strSpeack,SpeechVoiceSpeakFlagsSVSFlagsAsync) ;
}
catch(Exception err)
{
throw(new Exception("发生一个错误:"+errMessage)) ;
}
}
其中SpeechVoiceSpeakFlagsSVSFlagsAsync表示异步发音。
接上篇《中文语音识别技术在c#中的应用(一)》………但是,这个方法本身并不知道你给的字符串是什么语言,所以需要我们它这个字符串用什么语言读出。SpVoiceClass 类的Voice 属性就是用来设置语种的,我们可以通过SpVoiceClass 的GetVoices方法得到所有的语种列表,然后在根据参数选择相应的语种,比如设置语种为汉语如下所示:
private void SetChinaVoice()
{
voiceVoice = voiceGetVoices(stringEmpty,stringEmpty)Item(0) ;
}
0表示是汉用,1234都表示英语,就是口音不同。
这样,我们就设置了语种,如果结合发音方法,我们就可以设计出一个只发汉语语音的方法。
private void SpeakChina(string strSpeak)
{
SetChinaVoice() ;
Speak(strSpeak) ;
}
只发英语语音的方法也是类似的,上面程序里有。
对于一段中英文混合的语言,我们让程序读出混合语音的方法就是:编程把这段语言的中英文分开,对于中文调用SpeakChina方法,英文调用SpeakEnglishi方法;至于怎样判断一个字符是英文还是中文,我采用的是判断asc码的方法,具体的类方法是通过AnalyseSpeak实现的。
这样,对于一段中英文混合文字,我们只需把它作为参数传递给AnalyseSpeak就可以了,他能够完成中英文的混合发音。
当然,对于发音的暂定、继续、停止等操作,上面也给出了简单的方法调用,很容易明白。
下面简单介绍一下中文语音识别的方法:
先把该语音识别的类源代码贴在下面,然后再做说明:
public class SpRecognition
{
private static SpRecognition _Instance = null ;
private SpeechLibISpeechRecoGrammar isrg ;
private SpeechLibSpSharedRecoContextClass ssrContex =null;
private SystemWindowsFormsControl cDisplay ;
private SpRecognition()
{
ssrContex = new SpSharedRecoContextClass() ;
isrg = ssrContexCreateGrammar(1) ;
SpeechLib_ISpeechRecoContextEvents_RecognitionEventHandler recHandle =
new _ISpeechRecoContextEvents_RecognitionEventHandler(ContexRecognition) ;
ssrContexRecognition += recHandle ;
}
public void BeginRec(Control tbResult)
{
isrgDictationSetState(SpeechRuleStateSGDSActive) ;
cDisplay = tbResult ;
}
public static SpRecognition instance()
{
if (_Instance == null)
_Instance = new SpRecognition() ;
return _Instance ;
}
public void CloseRec()
{
isrgDictationSetState(SpeechRuleStateSGDSInactive) ;
}
private void ContexRecognition(int iIndex,object obj,SpeechLibSpeechRecognitionType type,SpeechLibISpeechRecoResult result)
{
cDisplayText += resultPhraseInfoGetText(0,-1,true) ;
}
}
我们定义了ssrContex 和isrg为语音识别的上下文和语法,通过设置isrg的DictationSetState方法,我们可以开始或结束识别,在上面的程序中是BeginRec和CloseRec方法。cDisplay 是我们用来输出识别结果的地方,为了能够在大部分控件上都可以显示结果,我用了一个Control 类来定义它。当然,每次语音识别后都会触发ISpeechRecoContextEvents_RecognitionEventHandler 事件,我们定义了一个这样的方法ContexRecognition来响应事件,并且在这个方法里输出识别结果。
这样,中文语音处理的一些最基本的问题就有了一个简单的解决方法,当然,这种方法还有很多不完善的地方,希望大家多提出批评意见,共同提高。
TT产品的操作代码是666888,tt语音踢人代码是666888。从功利角度看,懂编程,施展的空间是非常有限的,并且受训练量的影响,这方面能力不会太强,很难在不影响主要技能的情况下解决非常专业的问题。
这个是可以实现的。
注:testpcm是语音文件,可以用audacity软件打开,选择 文件->导入->裸数据。 设置采样率为8000Hz。点击播放就能听见声音了。
这个时候程序跑起来还有问题,需要将apiKey 以及secretKey填写上。这两个值是你申请应用对应的分配好的。
cuid填本机mac地址就可以了,这个值我试过好像无所谓没啥要求。
程序能跑起来,并且按照正常返回识别的语音结果。但是返回结果的编码为GBK,所以汉字显示为乱码,需要对其进行一次转码。转码的代码是我自己加上去的
欢迎分享,转载请注明来源:浪漫分享网
评论列表(0条)