使用Azure Congnitive Services 技术制作AI故事机
引言
前一段时间有幸参加了微软MVP的AI方面的学习挑战赛,对于AI 这个新的领域的技术瞬间勾起了我的学习兴趣。
最近几年,不管是国内还是国外,AI都是一个异常火热的词。比如现在的自动驾驶技术,其实就是依赖 “识别”,“判断”,“人机交互”等技术。识别:就类似我们的研究,通过图像,物体识别技术车辆周围环境;“判断”:这个类似我们的大脑,也是最重要的技术,通过AI 算法对识别到的物体、图像进行判定,并且可以通过复杂计算场景的训练从而使这颗AI 大脑变得更加聪明;“人机交换”:AI 通过跟我们的不局限与 语音,文字,表情,动作等做出AI 判断,执行预设指令,类似钢铁侠和 AI 管家—–“贾维斯(J.A.R.V.I.S.)”。
学习了AI技术后,为了能将学习和实践相结合,我决定做一个AI故事机,借助Speech Studio的”Speech Studio features”,将一些童话故事制作成人声音频,然后再播放出来。接下来就是具体的实现过程了。
相关学习地址:
正文
创建Speech Studio
Azure Portal 中搜索 “Speech ”,并创建
输入Speech相关参数,并点击 “Create”
等待创建完成后,我们就需要登录到 Speech首页,选择 “Audio Content Creation” ,并选择刚刚创建好的 Congitive Services
接下来就是故事的创作了,首先我们选择创建工作目录 “Story” 保存创建的内容
进入工作目录后,创建新的文件用来保存有声内容,并命名为 “Peppa Pig”
然后,我们需要把准备好的文字内容按照段落输入到文本框中。于此同时,我们需要给当前 Peppa Pig 设置各个角色不同的声音模型,从而达到很不错的效果
充分的发挥自己的创作力,来看看最后的效果吧