MS-TTS:免费微软TTS语音合成工具(一键合成导出MP3音频)_微软tts

阿里云国内75折 回扣 微信号:monov8
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6

声明

  • 本工具是个免费工具遇到问题还请自行解决下面有文字教程B站有视频教程链接在文章末尾

  • 其次微软接口卡顿连接超时等问题下方有详细说明请仔细看一下

  • 再次强制升级是为了统一版本方便问题的收集与解决如果你能理解最好不能理解的话那建议你还是不要用了强扭的瓜不可能甜

前言

微软TTS文本转语音引擎的确是非常NB合成语音非常接近真人应该是当前同类产品中体验最好的官网有提供在线语音合成但不提供合成后的音频文件下载使用时会比较麻烦所以写成工具

目前MS-TTS工具经过N个版本更新该实现的功能都已经一点点肝出来了称它为全网最强免费TTS文本语音合成工具应该不为过所以接下来可能在很长一段时间内除去发现重大bug外应该都不会再进行大的更新了当然有什么好的意见建议可以继续留言告知提示少数人需要的特殊功能不在此范围真有需要可联系定制。

当前版本v1.9.6.3

Bug反馈

遇到问题请先更新到最新版本试试如果还是解决不了请在公众号回复加群添加Q群后提供触发Bug的具体场景以便跟踪修复感谢有你


使用说明(以下内容请仔细阅读)

1、下载的压缩包记得先解压缩再使用

2、解压后运行主程序 MS-TTS.exe(注意软件有加密保护会被部分杀毒软件和电脑管家勿报及限制操作权限建议将杀毒软件及电脑管家关闭后使用当然如果不放心可以不要使用)

3、软件界面

3.1 接口设置

左侧最上方为TTS接口选项当前软件支持 微软Edge 两大接口优缺点如下

微软Edge
角色个性化设置支持不支持
稳定性不稳定较稳定
合成速度一般
WAV格式支持不支持

接口下方代理选项专为微软接口设置原因就是因为微软TTS服务器网络非常不稳定如果一定要使用微软接口有条件的话就可以使用http代理如果没条件且又一定要使用微软接口的话建议在01:00-11:00时间段使用连接稳定性及合成速度相对会好一些

3.2 选项

合成音频保存质量选项微软接口mp3、wav两种格式都支持Edge只支持保存mp3格式

3.3 角色

语言TTS文本转语音中的文本内容所属语言一定要和合成内容的语言相对应

语音根据所先语言不同对应的语音角色也不相同要自行根据实际情况选择

风格角色的说话语气风格

角色这个角色一般是指角色的年龄段实际使用效果不明显且只有少部分角色支持

语速语音合成时的说话速度0是正常水平>0加快<0减慢

音调语音合成时的说话音调0是正常水平>0音调升高<0音调降低

添加角色可将设置好的角色添加到下方的角色列表用于文本转语音时实现多角色配音的效果不添加角色时所有语音合成直接使用上方角色及各项设置

3.4 简单模式-中小文本

主要用于合成文本内容不多的情况可以更为方便快捷的对文本内容进行各种自定义

在编辑区域点击鼠标右键会弹出右键菜单

  • 粘贴将复制好的文本内容粘贴到编辑区域

  • 清空清空编辑区域所有内容

  • 插入间隔在光标所以位置插入间隔标记后面在进行语音合成时将会在指定位置按照设置好的间隔时间进行停顿

  • 设置角色使用此功能需要在左侧列表先添加角色然后使用指定角色对选中范围文本内容进行标记进行过角色标记的内容在后面进行语音合成时将以指定的角色设置进行语音合成。

3.5 简单模式-超长文本

在表格区域点击鼠标右键会弹出右键菜单

  • 导入导入需要进行tts合成的txt文本文件

    • 导入的txt文本大小不能超过5MB超过5MB文本文件无法导入

    • 导入的txt文本文件编码格式必须为UTF-8非UTF8编码文件在导入后在状态栏会显示“编码错误”在进行tts语音合成时会直接跳过

  • 清空清空列表

  • 也可以直接选中多个txt文本文件拖动到软件界面完成导入

3.6 SSML

SSML是一种基于XML的语音合成标记语言此功能一般只用于需要深度自定义的场景使用SSML一定要按照其规定的语法及命令否则将无法合成命令语法错一个字母都不行具体可点击右上方绿色文字跳转到官方SSML文档进行学习。

SSML主体内容不能超过2500字符微软官方有限制

3.7 软件设置

  • 保存目录可自定义合成音频保存目录打开快速打开保存目录选择文件夹选择保存目标文件夹

  • 合成音频使用原始文件名命名在超长文本模式下生效勾选后最终合并音频文件名以“原始导入文本文件名_tts”进行命名

  • 合成结束打开保存目录在语音合成任务完成后打开保存目录如果保存文件夹已经有打开则不会再打开

  • 分段音频合并数量在进行超长文本合并时如果将所有音频进行完整合并最终生成的音频文件将会非常大动辙几GB于是采取了二级合并的模式可以自行根据需求按指定数量合并如果还是不能理解打个比方你的文本合成音频后有300个音频文件如果对这300个音频文件进行完整合并最终合成的文件只有一个且文件大小将会达到几GB不方便移动传输且合成时间会非常长现增加的二级合并意思就是按照指定的数量对前面生成的300个文件进行合并比如默认二级合并数量50意思就是以50个音频为一组对前面的300个音频进行分开合并这样300个音频文件合成完成后就会生成6个二级合并的音频文件每个二级合并音频文件大小就会降到几百MB

  • 合成结束删除1级音频片段1级音频片段就是最多的4位数字开头的音频片段文件

  • 合成结束删除2级音频片段2级音频片段就是按照上面指定分段音频合并数量对1级音频片段进行合并后生成的3位数字开头音频文件

  • 是否进行最终完整合并就是将所有分段音频文件合并成一个音频文件。

  • 路径检测显示YES表示路径正常可正常进行音频合并

  • 保存配置将各项设置内容保存至配置文件./Nconfig.ini

注删除音频片段时将遵循保护性逻辑即在只存在1级音频片段时即使勾选合成结束删除1级音频片段也不会执行删除在同时存在1级音频片段与2级音频片段时勾选删除1级音频片段生效而2级音频片段即使勾选删除将不会执行同理在同时存在1级、2级音频片段且进行了最终完整合并的前提下勾先删除1级、2级音频片段才会生效执行。

4、多音字

MS-TTS运行后会自动在程序目录生成“dict.txt”词典文件

将需要自动替换的内容按照 原始内容,替换内容 的格式一行一条写入“dict.txt”词典文件保存即可如下

5、试听合成

5.1 试听

提供最长不超过150字符内容的角色声音试听多角色只试听第一段内容

5.2 合成

按照设置好的角色对指定内容进行TTS语音合成

5.3 停止

停止正在进行的任务

软件报病毒

软件有加密保护会被部分杀软误报所以如果你在使用过程中遇到这样或那样的问题请尝试关闭各类杀毒软件或电脑管家后再试一下当然如果不放心请勿使用谢谢

视频教程

视频为1.9.3版本视频多数操作相同

https://www.bilibili.com/video/BV1wg411k7SH/

下载地址

前往下载

阿里云国内75折 回扣 微信号:monov8
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6

“MS-TTS:免费微软TTS语音合成工具(一键合成导出MP3音频)_微软tts” 的相关文章