最近一段时间各种各类的有奖答题活动真的是层出不穷,于是各个厂家也就见招拆招的只做了各自的解题神器,都宣称自己的软件最强最快,那么这些软件中到底哪一个更好用一些呢?让我们一起来实际测验一下吧。
六款人工智能分别是:Bixby(三星)、Siri(苹果)、搜狗搜索、微软小娜、简单搜索(百度)、360搜索。
测试完毕。简单的看下问题的类型及测试流程。
闯关第一种类型:普通型
说到《冲顶大会》问题的题目,普通型较为多见,顾名思义就是问问题时主持人的语速适中,并且问题也容易搜到的题目,六位人工智能请听题:
好的,六位人工智能开始你们的答题:
Bixby(左)Siri(右)
搜狗搜索(左)微软小娜(右)
简单搜索(左)360搜索(右)
首先评判下六款人工智能的反应速度,就这一道题而言:
Bixby:3.24秒(9分);Siri:4.21秒(8分);搜狗搜索:4.64秒(7分);微软小娜:4.72秒(7分);简单搜素:2.18秒(10分);360搜索:4.31秒(8分)。
在语音识别的操作逻辑上来说,仅有简单搜素是“即按即松”的即时性识别,而另外五款人工智能均通过系统判定用户这句话有没有结束,再开始“转圈”,读取信息进行搜索,所以说在反应速度上来讲,简单搜素具有优势,并且反应机制也是一成不变的,因而我给出的反应速度得分在后面的题上也不变。
对于普通型问题的识别情况,六款人工智能发挥的都相对不错,均可准确的识别出准确的题目,并且答案也完全正确,在普通型问题的识别准确率和答案正确率得分均为满分10分。
接下来是答案的位置:
六款人工智能VS普通型问题
搜狗搜索表现的较为出色,正确答案不仅字体放大加粗,还放上了作者的照片,得分10分;Bixby、Siri、简单搜索尽管没有将正确答案放大,但也存在于词条的前端,也能够让用户方便的辨识出,三款得分9分;微软小娜及360正确答案略显靠后,得分8分。
闯关第二种类型:语速过快型
为了“防止搜索”,主持人在念题目时偶尔会加快语速,或者是“黏连”前句或后尾和问题不相干的废话一同说出,这样势必会影响人工智能的正常识别,这闯关的第二种类型六款“选手”能否应对呢?
这道题主持人读的十分迅速,并且“题目”和“答案”几乎没有间隔的连着读,看下人工智能是否能识别的出:
六款人工智能VS语速过快型问题
可以看到,尽管主持人语速过快并且带有误导的“黏连”话语,还是有不少人工智能发挥不错:Bixby和微软小娜的智能型较强,不仅识别出问题,还将计算器打开并算出结果,得分10分;简单搜索通过“百度”得出正确答案,位于第二个词条上不怎么显眼的位置,得分8分;360搜索需要点进去查看答案,并不能够从首页词条看出,得分7分;Siri及搜狗搜索或许受过快语速的影响,没有准确的识别出问题,得分0分。
闯关第三种类型:棘手型
为了“防搜索”,《冲顶大会》一些问题出的十分困难,让人工智能搞不清问的什么,或者是如何回答,就比如下面这一道:
单是听问题的题目“哪位不是窦唯的女儿”,问谁都会一头雾水,换做是人工智能更容易犯迷糊“这正确答案好找,错误答案怎么找呢?”看下六款人工智能的处理做法:
六款人工智能VS棘手型问题
可以看到,简单搜索给予的答案更加接近完美,它将窦唯的两个女儿均显示在页面中,用户只需要运用排除法便可知晓,得分10分;微软小娜仅给出一个女儿的名字,不够全面,得分9分;Bixby、360搜索需要点进二级页面进行查看,得分8分;Siri并没有识别出问题的全部,给予的“远在天边,近在眼前”的答案十分逗乐,得分0分。
三种问题类型介绍完毕,看下经历过12道题后,六款人工智能的最终得分:
最终:
Bixby:7.9分; Siri:6.4分; 搜狗搜索:7.2分; 微软小娜:7.1分; 简单搜索:8.9分; 360搜索:7.7分