星期二 , 3月 19 2024
首页 / 人工智能 / AI / Google 造人

Google 造人

1950 年,英国数学家、逻辑学家,被视为计算机科学之父的艾伦·图灵(Alan Turing),发表了一篇划时代的论文,文中预言了创造出具有真正智能的机器的可能性。

1952年,在一场BBC广播中,图灵谈到了一个新的具体想法:让计算机来冒充人。如果不足70%的人判对,也就是超过30%的裁判误以为在和自己说话的是人而非计算机,那就算作成功了。

于是就有了图灵测试,指测试者与被测试者(一个人和一台机器)隔开的情况下,通过一些装置(如键盘)向被测试者随意提问。进行多次测试后,如果有超过30%的测试者不能确定出被测试者是人还是机器,那么这台机器就通过了测试,并被认为具有人类智能。

30% 这个数字是图灵老人家在 1950 年那篇论文里面对 2020 年的技术。但事实上尽管影视作品里面的人工智能助手深入人心,但用户能用到的人工智能,可以说基本上都是人工智障了。

直到昨晚 Google 用两个动作,让 Google Assistant 距离像真正的人又近了一步。

我们都知道,要想让一个智能语音助手像人,其实只要实现三个维度的事情就行了:

1. 能听懂你说的话

2. 说的话能让你听懂

3. 如果是语音助手,那么它说话的像人

目前市面上的智能音箱不少,各家互联网巨头也都在做所谓的“智能语音助手”,但智能音箱鸡肋的原因也挺简单的,归根结底还是不够聪明。

早上起床了,需要你对着智能音箱说一串的指令:

「打开窗帘」

「关掉床头灯」

「播放音乐」

……

感觉就像对着 50 个蠢蛋说话。日复一日,真的心累啊。

如果光说指令其实也还行,你还得叫智能音箱,让它知道你是在和它说话,可以说是更心累了。有的时候,即使你兴致勃勃的跟你的“智能小助手”说明白了指令,得到的回复也是冰冷生硬的“好的”,真挺扫兴的。

Google 改变的,是两点:

1. 让 Google Assistant 听起来像人

2. 让 Google Assistant 的办事儿逻辑像人,能为你做更多事情

听起来还挺简单的是不?其实技术上还挺难实现。

为了让 Google Assistant 真的像人,Google 升级了新的语音模型,让 Google Assistant 语音更接近真人。包括能让 Google Assistant 听起来更像美帝歌星 John Legend。用中国特色的方式解释,这就好比用机器给你合成了个林志玲,来给你引路导航一样。

光说话像人其实并不够,重点还得是让 Google Assistant 能听得清,且听得懂人话,并且能表达的像人一样。

去年的 Google I/O 大会上,Google CEO Sandar Pichai 就表示,Google 语音技术在识别美式英语方面,其识别错误率从 2016 年 7 月的 8.5% 降到了 4.9%。作为对比,微软在 2016 年 9 月给出的语音识别错误率为 6.3%,而 IBM 在 2017 年 3 月给出的相应数据为 5.5%。由此可知,Google 在语音技术基本功方面功力深厚。而更重要的进展是,去年的 Google Assistant,就已经实现了一个壮举:

70% 以上的语音交互都是通过自然语言。

而今年,Google 用了个叫做 Multiple Actions 增强了智能语音助理与人类自然、来回“对话”的能力。简单来说,就是 Google Assistant 能更明白你的话里有话了。

Google 也举了这样一个例子:

用户问 Google 勇士赢没赢比赛。

Google 说勇士赢了并汇报了比分。

用户紧接着问下一场比赛是什么时候。

Google 告诉了他下一场的具体时间。

用户说下一场比赛肯定挺有意思,希望 Google 提醒他回家后把杜兰特球衣找出来。

Google 说妥了,你到家我就提醒你。

看上去简单且自然的对话,可以说是藏有相当多需要机器进行理解并规划回应的信息点了。如果你觉得这个还挺简单,我建议你掏出你的 iPhone 和 Siri 聊聊,看看能不能聊下去。

连续理解人类语句并给出回应,是相当难的技术,这其实意味着 Google 需要大量的数据来培养机器学习算法。在昨晚的大会上,Google 还是秀了自己在数据积累上面的肌肉,目前,全球范围内共计有超过 5 亿个设备都部署了 Google Assistant,分为 5000 种不同的设备,仅仅是汽车品牌就超过 40 个。

光能把天聊下去还不像个真人对不对?更让人仔细想想甚至有点恐惧的还在后面。

Google Assistant 现在可以帮你打电话了,甚至整个过程都很难让对面察觉到,自己对话的是 Google 智能助手。

当然,帮打电话的场景目前应该还只能实现如同订餐,预约见面等功能。Google 在大会上展示了两个场景,已经足够震撼人心且充满科技感:你要理发,喊谷歌助手预定,它会给理发店打电话,并回答出理发店里店员“几点理发”“预定客人的名字”等信息;或者预定餐馆,如果没位置,它也能学会变通改预定时间——全程是 Google 助手(机器)在和一个人类对话,它的声音仿佛一个人类,回答方式也是一个人类。

这可能是人工智能助手第一次让我感觉到隐约有点恐惧了,尽管它能够与人自由对话的场景还非常有限。

Google 这个功能再发展下去,恐怕人工客服的岗位就要被取代了,一大批电话客服就会下岗了。

学会用更真实的人声说话,说话逻辑也更像人类,Google 还想用机器学习的优化让人工智能更有人情味儿一些。举个例子:孩子跟 Google 助手对话时候,如果他比较礼貌说“请”,Google 助手也会给更 nice 的回答。

看,尽管连着好几年 Google 都在说 AI,但这一次,Google 还是让 AI 做到离人们生活前所未有的贴近了。

最终,厉害归厉害,Google 对于我国用户依然是一家不可见的公司,技术是真牛,看看乐呵就好。

关于 声波

声波
发现不同的声音

检查

讯飞星火正式发布语音大模型,七大能力提升交互超GPT-4 Turbo

1月30日,科大讯飞举行星火认 …

发表评论

邮箱地址不会被公开。 必填项已用*标注