来源:IT之家发表时间:2022-11-18 11:24 阅读量:14777
微软Azure神经网络文本到语音转换服务可以帮助用户将文本转换成逼真的人工智能声音适用于多种应用场景,包括智能语音助手,客服对话机器人,音频内容阅读,游戏角色语音等在过去的几个月里,微软Azure智能语音合成技术在语音自然度,声音丰富度和多语言支持方面取得了快速进步
今天微软官方为大家带来了最新的神经网络语音合成声码器HiFiNet2。
声码器是TTS中的关键部件之一,它根据输入的文本或声学特征合成音频样本目前,通过HiFiNet2声码器技术,微软已将微软Azure智能语音合成产品全面升级至48kHz声音模型,进一步为用户带来更高保真,高效率,可扩展的AI音质体验本次更新包括400多种音色,涵盖全球140多个国家和地区的语言
48kHz语音模型
在文语转换技术中,音频的保真度是衡量音质的一个重要标准高保真的声音不仅能向用户传递更丰富细腻的音质,还能最大限度地减少音色的失真和走样伴随着采样率的提高,听众可以听到更精确的细节和更真实的音色在视频配音,游戏,唱歌等需要更精细,沉浸式声音体验的复杂场景中,更高的保真度输出将为用户带来前所未有的全新感官体验
现在,伴随着Azure深度神经网络语音合成服务将全平台AI声音提升至48kHz采样率,微软在业内率先为AI声音用户带来真正的高保真声音体验。
有关Microsoft Azure智能语音合成技术的更多信息,请单击此处查看。
。郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。