×

专属 定制 语音 亲情 一路

9句话定制专属导航语音,AI让亲情一路同行

jnlyseo998998 jnlyseo998998 发表于2023-03-14 06:53:03 浏览13 评论0

抢沙发发表评论

系列报道之③

快60岁的老张最近迷上了听自己的声音。每次开车和几位老伙计出去玩,一打开导航就会跳出他的声音——“前方十字路口请直行,走左侧车道”,一车人都得“听命行事”。就连呼唤“小度小度”,问它要去哪、几点了,传出来的也是老张的声音。老伙伴们都被惊着了,纷纷凑上来问怎么弄的。一种自豪感油然而生,张大爷抽空教了教,让大家都崇拜了一把。

起初,老张并不知道什么是语音包。上个月,他坐在儿子小张的车里,突然听见百度地图导航里传来儿子的声音,问了才知道原来他制作了语音包,好奇心一下就上来了。在儿子的指导下,老张对着手机录9句话、等几分钟,一个属于自己的语音包就生成了。老张忍不住自己录了好几个语音包,玩了半天……这趟行程结束后,他兴冲冲地给儿子小张打电话:“我最近和老伙伴们出去玩可长脸了!”

越来越多个性化、有温度的声音正在百度地图上汇聚,语音技术与地图的融合,让科技力量有了温度,成为人与人之间传递温情的纽带。

录制2分钟、9句话合成语音包

展开全文

在2016年上映的电影《从你的全世界路过》中,主人公茅十八在驶往稻城亚丁的路上,用他精通的技能为心仪的女孩荔枝定制的一个导航语音包,成了浪漫而又暖心的礼物。三年后,电影的情节成为现实,普罗大众也能像茅十八一样,录制属于自己独一无二的语音包。

2019年9月,百度在行业内首次推出地图语音定制产品,将此前专注于明星名人的语音定制功能开放给普通用户群体。用户在安静的环境中,在百度地图APP上录制20句话,用20分钟左右就可以生成一个专属的完整语音包,可在导航、智能语音交互、景区智能语音导览等全部场景使用。这样一来,人人都可以是“大明星”。

过去,语音合成主要依靠拼接语音合成系统,制作地图语音包需要在专业录音棚录制上万句语料,再经过长达数月的制作才能生成,流程复杂、耗时长,让地图语音包只是“明星专属”。随着百度大脑语音技术对语音定制功能进行赋能,个性化语音包合成的定制门槛大大降低。AI技术的加持,让地图语音包生产实现了从月级别到分钟级别的突破性进展,也重新定义了语音包的生产模式。

推出三年多以来,语音定制功能已经迭代了10多个版本。伴随技术的持续突破,录制的门槛不断降低,噪声检测的标准放低,语音包录制场景、玩法也日趋丰富:2020年1月,自定义播报功能上线,用户可以在语音广场选择好“称呼”和“风格”,使用个人特色的语音包。2021年4月,用户录制的效率进一步提升——录制时长和语量分别减少到录制2分钟、9句话,即可生成语音包。现在,在极速录制模式中甚至只录3句话后退出也可以生成语音包。

作为一种声音内容产品,用户可以录制语音包给家人、朋友,可以根据自己的创意、脑洞录制方言、模仿类的语音包,用户录制的语音包也都可以选择发布到百度地图语音广场的各个分类里,供更多的用户试听和使用。

一位资深用户坦言,自己最初愿意录语音包,是带着一些猎奇的心理,“想尝试一下原本只有明星才能录的语音包,自己也能录了是什么体验,需要怎么录制、录制多久能合成、合成后效果怎么样,像不像自己的声音之类的”。后来他录得“一发不可收拾”,自发挖掘出了更多的玩法和场景,还会忍不住发动身边人一起玩。

语音包成为传递情感的“桥梁”

“语音定制”功能在百度地图有个内部代号叫“百雀灵”。据说,之所以叫“百雀灵”,主要是因为百雀是大自然中各种鸟儿的总称,这些鸟儿有各种各样悦耳的叫声,类比下来,百度地图App千千万万个用户就是“百雀”。“千人千面”的定制化语音突破了传统明星语音包的圈层限定,满足了用户个性化需求。

“语音包我太有发言权了!”一位用户忍不住感慨:“有天我照常上班打开导航,一句‘hi宝贝,今天我来给你导航’,直接吓了我一跳,听了听才发现是女朋友的声音,真的太惊喜了!感觉一路上都在拆盲盒,不知道她会突然冒出来什么话,反正刚开始导航的时候还挺甜的,但一开快了就骂我,感觉她坐在副驾一样。后来一问,才知道她偷偷给我录了个语音包,太逗了!”

越来越多用户从亲友的语音包中,感受到科技带来的温暖。陈林(化名)便是其中之一。他感慨,“现在年轻人无论是叫外卖、打车、支付几乎所有的场景都可以用手机搞定,但这些对老人来说难上加难。我爸爸也是这样。”他把地图导航等各种手机软件的使用方法教给父亲,但父亲总是记不住,出门还是绕晕了。于是,他为父亲录制了一个语音包,“这样即使走错了路,我的声音在陪伴他,他也不会那么慌张了。”

每天独自上下班的玉琳(化名)觉得,对于异地恋的人来说,语音包带来了跨越距离的陪伴感。有天,玉琳的男朋友分享给她一个“忠狗语音包”。“看到名字的时候我还在纳闷这是什么,一点开就听到了他的声音,直接就打开百度地图换了这个语音包,还用小度跟他闲聊了几天,听着他的声音我差点就哭出来了。”她说,“有了他的语音包,起码我每天上下班的路都不再寂寞了。”

有人说,地图出行工具是每天都会用的,那用户喜欢的声音也会每天陪伴用户出行,这就是一种温暖的体现。语音包是个有温度的产品,可以传递亲情、爱情、友情,已经成为人与人之间情感的“桥梁”。语音技术与地图工具的融合,也释放了科技力量,让每个人都感受到科技进步带来的改变和情怀。

现在,百度地图定制语音功能,囊括了多种录制模式:极速模式(录3-9句话)、经典模式(录20句话)、萌娃模式(更简单的短句)、专业模式(录100句)……录制语音包的用户,年龄最小的甚至只有三岁。

宝宝也可以做“导航员”。

有宝妈感慨,“萌娃模式录制很适合小宝宝,我说一句、他学一句,没几句话就录完了,试听了一下,声音奶声奶气的,太可爱了,迫不及待就发在了家族群里,家里老人都惊喜得不得了。我以后每年都要让孩子录一个,这样就不光有照片的记录,更有声音的记录了。”语音包还给了她一个意外收获:“宝宝爸爸说,堵车时候用宝宝的导航,路怒症都治好了……”

AI让语音技术创新拥有无限可能

有业内人士表示,语音定制功能还会有很多迭代空间:比如继续减少录制句数降低录制门槛;在小朋友录制中增加绘本、儿童激励(音效、动效),提升录制的趣味性;在导航中增加诸如红绿灯、车道级等更多元的个性化播报场景;个性化播报也可以应用于小度语音交互,如应答音、检索场景播报个性化等……“未来,语音包的录制成本会更低,应用场景会继续拓宽,用户自己个性化可定制的内容会更多。”

据介绍,个性化语音定制功能的背后,是基于百度独创的说话人韵律迁移技术Meitron。这一技术起到的作用集中体现在发音人音色转换,多情感朗读和韵律风格迁移三个方面,通过机器学习,AI合成模型持续优化迭代以适应不同口音、不同表达习惯的用户,最终令个性化语音合成的定制门槛大大降低。

在语音技术与地图场景融合的过程中,创新成果不断地迸发出来。根据2022年10月由国家工业信息安全发展研究中心和工业和信息化部电子知识产权中心联合发布的《中国人工智能专利分析报告(2022)》显示,百度以将近2000件智能语音相关专利在创新主体排名中位列第一。这其中,就语音包产品百度已经布局相关专利100余件,内容涵盖语音识别、语音合成、声纹认证、语音包录制、语音导航等多个核心方向,相关语音识别技术专利更是荣获第二十届中国专利奖银奖,全面印证了百度地图个性化语音定制底层强劲的技术能力,也见证着语音技术在地图创新和服务能力边界的拓展。

个人语音包录制流程。

数据显示,作为国民级智能地图平台,百度地图实现了96%的地图数据生产AI化,上线了北斗高精“真”车道级导航、室内外无缝融合的车位级导航、具备红绿灯精准倒计时功能的智能路口导航、结合20亿张全景照片的全景指路服务、虚实结合的AR实景步行导航等多项应用“北斗高精”自研技术的特色出行服务,道路覆盖里程突破1200万公里,而AI在地图的每个功能中无处不在。

例如,AI技术能够令地图的核心能力——导航变得更为精准。百度地图基于自研的AI技术推出业内首创的智能定位功能,结合高精度传感器模式识别以及航迹推算技术,可辅助驾车导航功能在卫星信号弱的时候,依旧持续工作。通过基于交通影像的AI图像识别技术,可以识别道路上的车辆密度,进一步提升路况识别准确度。

创新驱动是加快建设交通强国的重要动力,人工智能是交通运输发展的强大引擎。有分析指出,随着人工智能与出行产业的深度融合,以人、车、路、云、网、图等要素为核心的车路智行智能交通将迎来深刻变革。地图作为国家重要数字基础设施的意义将进一步凸显。在国家政策红利支持下,AI技术还将持续在智慧出行更多细分领域快速落地和赋能,进一步推动交通信息化发展,助力交通强国建设。

采写:南都记者 傅晓羚