(资料图片仅供参考)
IT之家 11 月 17 日消息,微软 Azure 神经网络文本转语音服务 (又称“Neural TTS”,“智能语音合成”) 能帮助用户将文本转换为逼真的人工智能声音,它适用于多种应用场景,包括智能语音助手、客服对话机器人、有声内容朗读、游戏角色语音等。在过去的几个月中,微软 Azure 智能语音合成技术在语音自然度、声音丰富度和多语言支持等方面取得了快速进展。
今天微软官方为大家带来了最新的神经网络语音合成声码器 HiFiNet2 。
声码器是 TTS 中的关键组件之一,它基于输入的文本或声学特征来合成音频样本。目前,通过 HiFiNet2 声码器技术,微软已经将微软 Azure 智能语音合成产品全面升级到 48kHz 声音模型,进一步为用户带来更高保真、高效率和可扩展的 AI 语音音质体验。这项更新包括 400 多个音色,覆盖全球超过 140 个国家和地区的语言。
48kHz 语音模型
在文本转语音技术中,音频的保真度是用来衡量音质的一项重要标准。高保真声音不但可以给用户传达更丰富、更细腻的音质,同时还可以将音色的失真和变形降至最低。随着采样率的提升,听众可以听到更精准的细节和更真实的音色。在视频配音、游戏和唱歌等需要更精细、更沉浸的声音体验的复杂场景中,更高保真度的输出(如 48kHz 采样率)将给用户带去前所未有的全新感官体验。
现在,随着 Azure 深度神经网络语音合成服务将全平台 AI 声音升级到 48kHz 采样率,微软率先在业界为 AI 声音用户带来真正高保真度的声音体验。
微软 Azure 智能语音合成技术更多信息介绍,点此查看。
天天报道:有人质疑特斯拉自动驾驶不安全,粉丝不服:征集个孩子,我试试撞不撞得上!
环球速递!国漫数据查询小程序被关停,斗破成为最大赢家,国漫之争迎来落幕
【全球播资讯】五菱杀疯了,8万块神车配智能驾驶!大疆车载:勇气我给的
当前短讯!OPPO WATCH3 Pro 手表太商务 玩了几天爱不释手
天天快看点丨为何苹果将其当前手表屏幕设计为矩形?
名爵Cyberster量产版预告 新车定位于双门两座纯电敞篷跑车
吉利ICON巧克力正式上市 新车搭载1.5T涡轮增压四缸发动机
新款领克03内饰首曝 新车保留了家族化的分体式灯组设计
红旗首款MPV HQ9开售 前排拥有全液晶仪表盘和悬浮式中控屏
今热点:推荐两款电影录音剪辑软件,让你轻松搞定音频剪辑