自己动手写Python进行文本转语音程序，共计11行代码2024年_知识

1、首先安装Python程序推荐37

2、下载 pyttsx3库。

3、将需要转换的文本和程序放到一起。

4、运行程序就会朗读文本和保存文本朗读的语音文件。

以下是源代码：

import pyttsx3

with open ( 'wordtxt' , encoding = 'utf-8' ) as obj:

line=objreadline()

engine=pyttsx3init()

rate=enginegetProperty( 'rate' )

enginesetProperty( 'rate' , 160 )

volume=enginegetProperty( 'volume' )

enginesetProperty( 'volume' , 06 )

enginesay(line)

enginesave_to_file(line, 'abcmp3' )

enginerunAndWait()

参考一下：speechlib语音识别

C# 实现中文发音或中文语音识别 2008-10-18 07:44在net中,对英文语音有较好的支持，但是对中文语音的支持还没有加入进来，我们要想实现中文发音或中文语音识别，必需先安装微软的Speech Application SDK（SASDK），它的最新版本是 SAPI 51 他能够识别中、日、英三种语言，你可以在这里下载：http://wwwmicrosoftcom/speech/download/sdk51/,需要安装这两个文件Speech SDK 51和51 Language Pack，其中51 Language Pack可以选择安装支持的语言。

安装好以后，我们就可以开始进行语音程序的开发了，当然，在这之前我们需要把SAPIdll通过如下图所示添加到引用中

下面我们设计一个能够朗读中英文混合语言的类：

我们将用单例模式实现该类，类的代码如下，我们将详细解释：

public class Speach

{

private static Speach _Instance = null ;

private SpeechLibSpVoiceClass voice =null;

private Speach()

{

BuildSpeach() ;

}

public static Speach instance()

{

if (_Instance == null)

_Instance = new Speach() ;

return _Instance ;

}

private void SetChinaVoice()

{

voiceVoice = voiceGetVoices(stringEmpty,stringEmpty)Item(0) ;

}

private void SetEnglishVoice()

{

voiceVoice = voiceGetVoices(stringEmpty,stringEmpty)Item(1) ;

}

private void SpeakChina(string strSpeak)

{

SetChinaVoice() ;

Speak(strSpeak) ;

}

private void SpeakEnglishi(string strSpeak)

{

SetEnglishVoice() ;

Speak(strSpeak) ;

}

public void AnalyseSpeak(string strSpeak)

{

int iCbeg = 0 ;

int iEbeg = 0 ;

bool IsChina = true ;

for(int i=0;i<strSpeakLength;i++)

{

char chr = strSpeak ;

if (IsChina)

{

if (chr<=122&&chr>=65)

{

int iLen = i - iCbeg ;

string strValue = strSpeakSubstring(iCbeg,iLen) ;

SpeakChina(strValue) ;

iEbeg = i ;

IsChina = false ;

}

else

{

if (chr>122||chr<65)

{

int iLen = i - iEbeg ;

string strValue = strSpeakSubstring(iEbeg,iLen) ;

thisSpeakEnglishi(strValue) ;

iCbeg = i ;

IsChina = true ;

}

}//end for

if (IsChina)

{

int iLen = strSpeakLength - iCbeg ;

string strValue = strSpeakSubstring(iCbeg,iLen) ;

SpeakChina(strValue) ;

}

else

{

int iLen = strSpeakLength - iEbeg ;

string strValue = strSpeakSubstring(iEbeg,iLen) ;

SpeakEnglishi(strValue) ;

}

private void BuildSpeach()

{

if (voice == null)

voice = new SpVoiceClass() ;

}

public int Volume

{

get

{

return voiceVolume ;

}

set

{

voiceSetVolume((ushort)(value)) ;

}

public int Rate

{

get

{

return voiceRate ;

}

set

{

voiceSetRate(value) ;

}

private void Speak(string strSpeack)

{

try

{

voiceSpeak(strSpeack,SpeechVoiceSpeakFlagsSVSFlagsAsync) ;

}

catch(Exception err)

{

throw(new Exception("发生一个错误："+errMessage)) ;

}

public void Stop()

{

voiceSpeak(stringEmpty,SpeechLibSpeechVoiceSpeakFlagsSVSFPurgeBeforeSpeak) ;

}

public void Pause()

{

voicePause() ;

}

public void Continue()

{

voiceResume() ;

}

}//end class

在 private SpeechLibSpVoiceClass voice =null;这里，我们定义个一个用来发音的类，并且在第一次调用该类时，对它用BuildSpeach方法进行了初始化。

我们还定义了两个属性Volume和Rate，能够设置音量和语速。

我们知道，SpVoiceClass 有一个Speak方法，我们发音主要就是给他传递一个字符串，它负责读出该字符串，如下所示。

private void Speak(string strSpeack)

{

try

{

voiceSpeak(strSpeack,SpeechVoiceSpeakFlagsSVSFlagsAsync) ;

}

catch(Exception err)

{

throw(new Exception("发生一个错误："+errMessage)) ;

}

其中SpeechVoiceSpeakFlagsSVSFlagsAsync表示异步发音。

接上篇《中文语音识别技术在c#中的应用(一)》………但是，这个方法本身并不知道你给的字符串是什么语言，所以需要我们它这个字符串用什么语言读出。SpVoiceClass 类的Voice 属性就是用来设置语种的，我们可以通过SpVoiceClass 的GetVoices方法得到所有的语种列表，然后在根据参数选择相应的语种，比如设置语种为汉语如下所示：

private void SetChinaVoice()

{

voiceVoice = voiceGetVoices(stringEmpty,stringEmpty)Item(0) ;

}

0表示是汉用，1234都表示英语，就是口音不同。

这样，我们就设置了语种，如果结合发音方法，我们就可以设计出一个只发汉语语音的方法。

private void SpeakChina(string strSpeak)

{

SetChinaVoice() ;

Speak(strSpeak) ;

}

只发英语语音的方法也是类似的，上面程序里有。

对于一段中英文混合的语言，我们让程序读出混合语音的方法就是：编程把这段语言的中英文分开，对于中文调用SpeakChina方法，英文调用SpeakEnglishi方法；至于怎样判断一个字符是英文还是中文，我采用的是判断asc码的方法，具体的类方法是通过AnalyseSpeak实现的。

这样，对于一段中英文混合文字，我们只需把它作为参数传递给AnalyseSpeak就可以了，他能够完成中英文的混合发音。

当然，对于发音的暂定、继续、停止等操作，上面也给出了简单的方法调用，很容易明白。

下面简单介绍一下中文语音识别的方法：

先把该语音识别的类源代码贴在下面，然后再做说明：

public class SpRecognition

{

private static SpRecognition _Instance = null ;

private SpeechLibISpeechRecoGrammar isrg ;

private SpeechLibSpSharedRecoContextClass ssrContex =null;

private SystemWindowsFormsControl cDisplay ;

private SpRecognition()

{

ssrContex = new SpSharedRecoContextClass() ;

isrg = ssrContexCreateGrammar(1) ;

SpeechLib_ISpeechRecoContextEvents_RecognitionEventHandler recHandle =

new _ISpeechRecoContextEvents_RecognitionEventHandler(ContexRecognition) ;

ssrContexRecognition += recHandle ;

}

public void BeginRec(Control tbResult)

{

isrgDictationSetState(SpeechRuleStateSGDSActive) ;

cDisplay = tbResult ;

}

public static SpRecognition instance()

{

if (_Instance == null)

_Instance = new SpRecognition() ;

return _Instance ;

}

public void CloseRec()

{

isrgDictationSetState(SpeechRuleStateSGDSInactive) ;

}

private void ContexRecognition(int iIndex,object obj,SpeechLibSpeechRecognitionType type,SpeechLibISpeechRecoResult result)

{

cDisplayText += resultPhraseInfoGetText(0,-1,true) ;

}

我们定义了ssrContex 和isrg为语音识别的上下文和语法，通过设置isrg的DictationSetState方法，我们可以开始或结束识别，在上面的程序中是BeginRec和CloseRec方法。cDisplay 是我们用来输出识别结果的地方，为了能够在大部分控件上都可以显示结果，我用了一个Control 类来定义它。当然，每次语音识别后都会触发ISpeechRecoContextEvents_RecognitionEventHandler 事件，我们定义了一个这样的方法ContexRecognition来响应事件，并且在这个方法里输出识别结果。

这样，中文语音处理的一些最基本的问题就有了一个简单的解决方法，当然，这种方法还有很多不完善的地方，希望大家多提出批评意见，共同提高。

TT产品的操作代码是666888，tt语音踢人代码是666888。从功利角度看，懂编程，施展的空间是非常有限的，并且受训练量的影响，这方面能力不会太强，很难在不影响主要技能的情况下解决非常专业的问题。

这个是可以实现的。

注：testpcm是语音文件，可以用audacity软件打开，选择文件->导入->裸数据。设置采样率为8000Hz。点击播放就能听见声音了。

这个时候程序跑起来还有问题，需要将apiKey 以及secretKey填写上。这两个值是你申请应用对应的分配好的。

cuid填本机mac地址就可以了，这个值我试过好像无所谓没啥要求。

程序能跑起来，并且按照正常返回识别的语音结果。但是返回结果的编码为GBK，所以汉字显示为乱码，需要对其进行一次转码。转码的代码是我自己加上去的

欢迎分享，转载请注明来源：浪漫分享网

原文地址:https://hunlipic.com/qinggan/7561949.html

自己动手写Python进行文本转语音程序，共计11行代码

发表评论

评论列表（0条）