项目来源
目前从事的 VR 内容开发工作,经常用到 文字转语音 的功能。需要有一款软件能够方便的实现 文字转语音 的功能,并且声音能够尽可能接近真实人声,没有僵硬的机器声。
目前网上虽然也有很多 TTS 的软件,但是鱼龙混杂,曾经有同学在下载安装的过程中不小心中招, 被安装了全套的垃圾广告软件,确实有点恶心。
于是我决定自己定制一款 文字转语音 的软件,一方面,自己制作的东西安全可靠,没有广告病毒骚扰;另一方面,自己制作也锻炼了自己的编程开发能力。
预期目标
希望制作一款自己的 文字转语音助手 软件,一键将文字生成接近真实人声的语音, 从而实现为课件和视频配音讲解的效果。
功能需求

文本区 :在此区域输入需要转换成语音的文字。
参数设置 :可以设置合成语音的参数,包括数字发音方式、语速、音量三个参数。
选择文件夹 :可以自定义设置文件保存的路径,默认为软件安装路径。
试听 :可以在生成语音文件之前试听,挑选满意的效果。
生成音频 :可以在设置好的路径下生成音频文件,命名规则为 Smart_年月日_时分, 如 Smart_20180911_2230。
打开文件夹 :打开生成的音频所在文件夹位置。
发音人选择 :多种发音人可供选择。
百度语音 API 基本参数
基于百度 AI 语音 API (C# SDK),使用 Unity + C# 进行开发。
有四种声音可以选择:
- Female, // 0为普通女声
- Male, // 1为普通男生
- Duxiaoyao, // 3为情感合成-度逍遥
- Duyaya // 4为情感合成-度丫丫
有三个参数可以调节:
- spd , 语速,取值0-9,默认为5中语速
- pit , 音调,取值0-9,默认为5中语调
- vol , 音量,取值0-15,默认为5中音量
科大讯飞语音 API 基本参数
发音人选择
| 引擎 | 发音人 | 音色 | 语言 | 参数配置 | 
|---|---|---|---|---|
| InterPhonic | 小燕 | 青年女声 | 中英文(普通话) | vcn=xiaoyan(默认) | 
| InterPhonic | 小宇 | 青年男声 | 中英文(普通话) | vcn=xiaoyu | 
| InterPhonic | 凯瑟琳 | 青年女声 | 英语 | vcn=Catherine | 
| InterPhonic | 亨利 | 青年男声 | 英语 | vcn=henry | 
| ViviVoice | 玛丽 | 青年女声 | 英语 | vcn=vimary | 
| ViviVoice | 小研 | 青年女声 | 中英文(普通话) | vcn=vixy | 
| ViviVoice | 小琪 | 青年女声 | 中英文(普通话) | vcn=vixq | 
| ViviVoice | 小峰 | 青年男声 | 中英文(普通话) | vcn=vixf | 
| ViviVoice | 小梅 | 青年女声 | 中英文(粤语) | vcn=vixm | 
| ViviVoice | 小莉 | 青年女声 | 中英文(台普) | vcn=vixl | 
| ViviVoice | 小蓉 | 青年女声 | 汉语(四川话) | vcn=vixr | 
| ViviVoice | 小芸 | 青年女声 | 汉语(东北话) | vcn=vixyun | 
| ViviVoice | 小坤 | 青年男声 | 汉语(河南话) | vcn=vixk | 
| ViviVoice | 小强 | 青年男声 | 汉语(湖南话) | vcn=vixqa | 
| ViviVoice | 小莹 | 青年女声 | 汉语(陕西话) | vcn=vixying | 
| ViviVoice | 楠楠 | 童年女声 | 汉语(普通话) | vcn=vinn | 
| ViviVoice | 小新 | 童年男声 | 汉语(普通话) | vcn=vixx | 
| ViviVoice | 老孙 | 老年男声 | 汉语(普通话) | vcn=vils | 
| Aisound | 嘉嘉 | 青年女声 | 汉语(普通话) | vcn=jiajia | 
| 引擎 | 发音人 | 音色 | 语言 | 参数配置 | 
|---|---|---|---|---|
| MultipleTTS | 玛丽安 | 青年女声 | 法语 | vcn=Mariane | 
| MultipleTTS | 古丽 | 青年女声 | 维吾尔语 | vcn=Guli | 
| MultipleTTS | 阿拉本 | 青年女声 | 俄罗斯语 | vcn=Allabent | 
| MultipleTTS | 加芙列拉 | 青年女声 | 西班牙语 | vcn=Gabriela | 
| MultipleTTS | 艾伯哈 | 青年女声 | 印地语 | vcn=Abha | 
| MultipleTTS | 小云 | 青年女声 | 越南语 | vcn=XiaoYun | 
声音特征设置
| 语速 | 参数配置 | 
|---|---|
| 最慢 | spd = x-slow | 
| 较慢 | spd = slow | 
| 正常 | spd = medium(默认) | 
| 较快 | spd = fast | 
| 最快 | spd = x-fast | 
| 音量 | 参数配置 | 
|---|---|
| 最低 | vol = x-soft | 
| 较低 | vol = soft | 
| 正常 | vol = medium(默认) | 
| 较高 | vol = loud | 
| 最高 | vol = x-loud | 
| 背景音乐 | 参数配置 | 
|---|---|
| 无 | bgs = 0(默认) | 
| 梁祝 | bgs = 1 | 
| 数字发音 | 参数配置 | 
|---|---|
| 数值优先 | rdn = 0(默认) | 
| 完全数值 | rdn = 1 | 
| 完全字符串 | rdn = 2 | 
| 字符串优先 | rdn = 3 | 
文本类型选择
| 文本类型 | 参数配置 | 
|---|---|
| 普通文本 | ttp = text(默认) | 
| ssml | ttp = ssml | 
			本文由 机灵鹤 SmartCrane 创作
本站文章所有原创文章, 转载前请务必署名
最后编辑时间为: 2018-09-11 20:33
