尽管计算机算法正变得越来越强大、快速和精准,但始终还是只能理解文字字面的意思,任何上下文的引申义和细微的差异往往会成为绊脚石。即便已经非常强大,但计算机算法还是无法破译人类语言的模糊性和推理的奥秘。但现在人们的要求已经大大提高,希望身边的设备更能像一个人一样提供信息。
因此,当编程专家们仍然“按部就班”地编写计算机代码时,更多的人需要加入进来做些更微妙的贡献。为了满足用户更深层次的需求,人们不得不对计算机算法的工作进行评价、编辑或校正。
我们不妨把这种行为称为新兴的机械与人工协作模式,诸如苹果语音助手Siri和IBM的沃森超级计算机在内的问答技术都属于这一范畴。在这类技术中,单纯的计算机算法是无法胜任的。
谷歌搜索的评估员
即便是在非常崇尚算法和工程的谷歌,人工对搜索结果的贡献也越来越多。几个月前,谷歌开始在知名的地点或人物的搜索结果右边栏显示摘要信息,譬如当你搜索“奥巴马”或“纽约”时,旁边就会出现简单的介绍。这些摘要介绍信息一般来自维基百科和其它数据库,经过人工编辑而成。这样一来,当谷歌的搜索算法检测到这些特殊词汇是就会调用整理好的介绍信息,而不是简单的显示连接到其它站点的链接。
在谷歌负责搜索质量的工程总监斯科特·霍夫曼(Scott Huffman)表示:“我们的思路有了转变,部分搜索结果加入了人工策划的结果。”
除了内容策划人员,还有其他人在帮助谷歌开发调整搜索算法,以应对每月超过1000亿次的搜索请求。他们通常被成为“评估员”。霍夫曼表示:“我们的工程师开发了搜索算法,但需要评估员帮助测试某一改动是否能够提升搜索质量。”
23岁的凯瑟琳·杨(Katherine Young)是一位谷歌搜索的评估员,她是谷歌签的合同工,目前还在上大学。杨的工作是检测和调整模糊的搜索结果和排序问题。譬如,针对“国王手里握的是什么”,她需要审核现有的搜索结果,给出合理的搜索结果和先后排序。譬如,一个包含“国王手握权杖”的网页会被作为合理的参考答案放在第一位。
沃森的医学老师
IBM的超级问答计算机沃森经过了很长时间的训练,试图为医生诊断提供专业的答案。不过即便如此,它也需要人工的介入。
作为“助理医生”,沃森掌握了多种医疗书籍里面的知识。此外,沃森还会接受来自医学院的临床医生们各种询问,不断修正自己的知识库。譬如,沃森可能会被问到这样的问题,“什么样的神经系统疾病是禁忌使用安非他酮的?”沃森的软件系统数据库里可能包含了安非他酮这种抗抑郁剂,但它可能会不明白禁忌是什么意思。这时就需要人工的介入,告诉机器禁忌就是不能使用的意思,然后沃森才可能给出“癫痫症不能使用安非他酮”这样的答案。