近日,观众(zhòng)欣喜(xǐ)地看到在央视(shì)网络春晚舞台上,撒贝宁有了个虚拟孪生兄弟“小小撒”,这是AI虚拟主持人(rén)首次上岗与原型同台秀技,这(zhè)让小撒很是感(gǎn)慨——正在直面自(zì)己的未来职业危机。
portant;" />
据透露,打造这样(yàng)一个AI孪生主播,仅需(xū)约30分钟。那么,究竟其中(zhōng)有何(hé)奥(ào)妙之处?
如同原型孪生般逼真
是否见过(guò),让撒贝宁“无话(huà)可说”的主持(chí)对手(shǒu)?
只见,小小撒(sā)一出场,小撒就忍不住(zhù)说:“我的天,感觉像(xiàng)照(zhào)镜(jìng)子一样。”甚至从外貌上看,直呼简直就是(shì)“失(shī)散多(duō)年的孪生兄弟(dì)”。
而小小撒也并非花瓶摆设(shè),很能掌控现场,妙语连珠,几(jǐ)乎不留余(yú)地。以至于一旁的小撒“委屈”地插(chā)话(huà):“能(néng)给我说一句吗?”
显然,与以(yǐ)前僵(jiāng)硬、机械形(xíng)象(xiàng)的虚(xū)拟人技术相比(bǐ),引入人工智能,按(àn)真人原(yuán)型架构出的虚(xū)拟主持人,在技(jì)术上有(yǒu)了(le)相当大的提升。
“为了与真实的主持人(rén)有所区(qū)分,技术团队在形象设计上做(zuò)了一(yī)定程(chéng)度的变化。比如,这次可爱(ài)的‘小(xiǎo)小撒’个(gè)头(tóu)要(yào)高一点,更健谈些。”美国人工智(zhì)能(néng)公司偶邦(ObEN)联合创始人(rén)郑毅向科技日报记(jì)者介绍说。
当然,小小撒也(yě)并非独(dú)家打造,因为节目中除了虚拟孪生撒(sā)贝宁,其他主持人(rén)朱迅、高(gāo)博(bó)、龙洋的孪生AI主持人也都纷纷亮(liàng)相。
本世纪(jì)初,英国广播公司发(fā)布第(dì)一个虚拟主持人Anaova之后,虚拟(nǐ)主持(chí)人成了(le)一个科技研究(jiū)热(rè)点。“能闻(wén)其声,也(yě)见其人”,今年网络春晚可谓是这一技术在国内首次大规(guī)模应用。
用数据“喂(wèi)养”长大
常(cháng)言(yán)道,“台上一分钟,台下十年(nián)功”。而此次培养虚拟主持人的过程却(què)大大提速。
记(jì)者了(le)解到,打造这样一个(gè)AI虚拟(nǐ)孪生主播的技术叫作(zuò)PAI(Personal AI),在20多(duō)项专利申请技术的(de)支撑(chēng)下,只需撒贝(bèi)宁(níng)等主持人的面部(bù)扫描和半小时的录音数据(jù),即(jí)可生成形象(xiàng)和声音模(mó)型(xíng)。
“在AI语音技术的(de)基(jī)础(chǔ)上,无需主持人(rén)录(lù)入大(dà)量文本建(jiàn)立(lì)语音数(shù)据库。只需其(qí)较短的几(jǐ)十句标准原(yuán)声,通过特征参数提取,利用(yòng)迁移学习(xí)算法即可(kě)建立(lì)其独特发声模型。由此,任何输入的文字都可用主持人的声音读或(huò)唱出来,甚至能运用中日英韩四种语言(yán)。”郑毅说。
据介绍(shào),随(suí)着越来越多(duō)的数据“喂养”,小小撒在成(chéng)长中(zhōng)会掌(zhǎng)握更多技能(néng),甚至包括小撒的喜(xǐ)好、说话方式(shì)等(děng),在另一层(céng)面上与其更为相似。再加上动作捕捉训(xùn)练,以及传感(gǎn)器及运动跟(gēn)踪设备,更突(tū)显了原(yuán)型主持人的个性(xìng)化特色,大大增强(qiáng)辨识度。
“现在(zài)的深度(dù)学习(xí)和机器学习,是在原有自动(dòng)化规则上多了学习能力——自己发现(xiàn)规律。换(huàn)言之,由于人类(lèi)很难发现规律中的细(xì)节,而(ér)AI可通过大(dà)量(liàng)训练让电脑学习去发现(xiàn)内在(zài)规律及细节(jiē)。”华为人工智能算法工(gōng)程(chéng)师(shī)张侗冬(dōng)告诉记者。 在某种意(yì)义上,正如主持人朱(zhū)迅所言,“通过数据(jù)载体的(de)形式,跟真实世界亲密(mì)互(hù)动,我(wǒ)们实现(xiàn)了‘永(yǒng)生’。”
从数字(zì)世界(jiè)到人类世界(jiè)的(de)鸿沟(gōu)
未(wèi)来的世界是(shì)平(píng)行的数据世界,社(shè)会的主角(jiǎo)是人,数据世界的主(zhǔ)角是数字化的人。那么,在人(rén)工(gōng)智能时代,虚拟主持人有(yǒu)什么发展瓶(píng)颈(jǐng)?
郑毅指出,“‘情(qíng)感’是人类的专利。从语音模拟到语意模拟,虚拟主持人面临从数字世界到人类世界的鸿沟(gōu),尽管其在模仿音(yīn)色、语速、停顿时都没问题,但是知道(dào)意思、怎么回答,却不理解感情内涵,要做到抑扬顿挫目(mù)前还很难。”
据介绍,语意学习,虽然也有“兴奋(fèn)”“悲伤”“着急”等情感(gǎn)模型,但在模拟(nǐ)过程(chéng)中,虚拟主持人不能(néng)及时调(diào)动,需(xū)要人工(gōng)参与(yǔ)。虚拟人仍然像个嗷(áo)嗷待哺的婴儿,人类(lèi)如何孕(yùn)育它成长,为(wéi)其构(gòu)筑怎样的世界观,将是未来深入探索的方向(xiàng)。
郑毅表示,相(xiàng)信AI虚(xū)拟主持人不仅是一个技术产生到技术落地的(de)过程(chéng),也是一(yī)个信任交接的(de)过(guò)程。当初(chū)攻(gōng)关虚拟(nǐ)主持人技术的一大初衷,是想通过主持人、明星(xīng)这样有一定(dìng)公信力人物的带动,增加人(rén)们对人(rén)工(gōng)智能的信任。因为我(wǒ)们(men)还处于技术成长阶段,而未(wèi)来人与人工智能的(de)相处(chù)也(yě)应从(cóng)信任开(kāi)始,例(lì)如未来像公务繁杂的(de)职场人,如果拥有一个数字化(huà)的(de)另一个自己,模拟自身意愿,便可代劳成(chéng)为(wéi)贴心助手,打理日常(cháng)琐事,是不是会让生活省心很多?相信人工智能可以给我们(men)带来更多生活便利,创造更(gèng)好的生活。
有业内(nèi)人士评(píng)价说,今年网络春晚中AI应(yīng)用的一小步,可能(néng)将(jiāng)会带(dài)来(lái)掀开虚拟(nǐ)主持人时代的一大步。“当然若虚拟人上岗(gǎng),工资依然发给我们人(rén)类就好(hǎo)。”有人戏(xì)称。