第1章
认知计算和我们的未来
——人类和机器如何锻造认知新时代

作者:Dr. John E. Kelly III

1955年,当“人工智能”这个词首次被提出来时,不出所料地点燃了公众的想象力。在接下来的60年里,我们曾被它的前景所吸引,曾担心它的潜力被滥用,也曾为它的发展缓慢而沮丧。

广告:个人专属 VPN,独立 IP,流量大,速度快,连接稳定,多机房切换,每月最低仅 10 美元

然而,正如所有孕育得过早、超越了时代的先进科技一样,人工智能遭到了广泛的误解——被好莱坞电影错误地诠释、被媒体曲解为各种各样的角色——从人类的拯救者到毁灭者,无所不有。但那些研究严肃的信息科学及其在现实商业社会中应用的人,才真正理解智能系统的巨大潜能。而认知计算这种技术(我们相信它将是“认知的”而非“人工的”)的未来与被称为 “人工智能”的技术所具备的性质截然不同,它将带来各种各样的技术、科学和社会的挑战与机遇,并对监管、政策和管理提出新的需求。

认知计算是指一种能够规模化学习、有目的推理,并与人类自然交互的系统。它们不需要事先精确地编程,而是从它们与我们之间的交互和与环境之间的互动中学习和推理。在过去半个世纪中,多个科学领域的进步使认知计算成为可能,它们与信息系统有着重要的区别。

那些信息系统是决定论的,而认知系统是概率论的。认知系统不仅能回答大量的问题,还能对更加复杂(且有意义)的数据提出假说、推理论述和建议。

此外,认知系统还能理解计算机科学家称为“非结构化”的数据,而这些数据占到了全世界数据的80%。这使得它们能够与现代世界巨量、复杂和不可预测的信息保持同步。

这些与机器的感觉能力和自主性没有任何关系。相反,它能够增强人类的能力,让我们可以理解和运作社会中复杂的系统。这种增强智能对提升我们驾驭科技的能力是十分必要的一步,让我们能追求更多知识、深化自身的专长和改善人类的境况。这就是为什么它不仅是一种新科技,更是科技、商业和社会的新纪元——认知时代——的黎明。

认知计算的成功并不以图灵测试或模拟人类的能力作为判断标准。它的成功标准更加实际,例如投资回报率、新的市场机会、治疗疾病和拯救生命。

在IBM,为建立认知计算的基础,我们已经工作了数十年,将前沿计算机科学领域的十几个学科与100多年的商业专长结合起来。现在,我们正在亲眼目睹它在改变商业、政府和社会方面的巨大潜力。

我们已经看到,它将大数据从障碍变成机会,帮助儿科医生做出早期诊断,为建设智慧城市提供创新解决方案。我们相信,这些技术展现了最好的(或许也是唯一的)机会,去处理地球所面临的一些最顽固的系统性问题,例如癌症、气候变化和复杂多变的全球经济形势。

1 计算的历史与认知的崛起

为了理解认知计算的未来,必须把它放到历史的语境中。到今天为止,我们经历过两个不同的计算时代——制表时代和编程时代。IBM在这两个时代中都扮演了中心角色。我们相信在计算演化史中,认知计算是第三个,也是最具有转折意义的时代。

阅读 ‧ 电子书库

图1.1 计算的历史与认知的崛起

制表时代(1900—1940年代)

计算机起源于一种单一计数用途的机械系统,这种系统用打孔卡来输入和存储数据,最终决定这个机器要做的事情 (虽然是以一种非常原始的方式)。这些制表机本质上是一种计算器,支持了商业和社会规模的扩大,帮助我们组织、理解以及管理从人口增长到全球经济进步等各种事情。

编程时代(1950—现在)

在二战的时候,随着军事和科学的需要,从机械制表机到电子系统的演变开始了。在战争之后,数码“计算机”经历了快速演进,逐渐进入商业和政府。它们可以根据软件中的程序来进行“如果/就”的操作以及循环。从最开始的电子管到晶体管,再到微处理器,计算机的性能得到了迅速提升,这一发展过程验证了“摩尔定律”,在60年间,处理器的容量和速度每18个月就提升一倍。所有我们知道的计算设备,从大型主机到个人电脑,再到智能手机和平板电脑,都是可编程的计算机。

认知时代(2011— )

早在1960年,J.C.R. Licklider就在他的论文《人机共生》中提出了超越可编程系统的潜在可能性。现代计算的很大部分都是基于Licklider的研究以及他的深刻见解:

“人机共生是在人类与电子计算机之间发生的共生关系,是人机关系间可以预见的发展。这种关系包含人类与电子伙伴强耦合关系。主要目的是:

1.像为解决规划难题提供便利一样,也让计算机为规划思维提供便利。

2.在不依赖于不灵活的预定义程序的情况下,让人与计算机能够协作决策,控制复杂情况。

初步分析表明,与人类单独进行智能操作相比,人机共同操作的效果更显著。”1

——J.C.R. Licklider,《人机共生》,1960年3月

Licklider知道,认知计算将是程序化计算必要的自然演化,虽然他并不知道这个目标如何实现。50年后,大规模并行计算以及浩如烟海的结构化与非结构化数据的积累,为认知计算奠定了基础。

2 世界首个认知系统

在2011年2月,Watson项目首次公开,这个由IBM开发的认知计算系统在 Jeopardy!节目中战胜了肯·詹宁斯和布拉德· 鲁特尔。这是首次面向公众展示认知计算,标志着所谓人工智能寒冬的终结。可编程系统在之前60年的演化中并未能够理解混乱的非结构化数据,因此也参加不了 Jeopardy!节目。Watson能够回答微妙、复杂、语义双关问题,显然,计算新纪元即将开启。

参加节目之后,Watson继续处理了更多的复杂数据集,在解密之外,它发展出了理解、推理以及学习的能力。认知计算的目标就是照亮以往在我们世界中不可见的部分——具体来说就是潜藏在非结构化数据中的模式和洞察——使得我们能够对更重要的事情做出更明智的决策。当机器的数据分析、统计推断能力与人类的特殊能力——比如自我引导的目标、常识和伦理价值观——结合起来时,认知时代的真正潜力就会实现。

这是Watson被赋予的使命,也是它正在尝试做的事情。银行正在分析客户要求和金融数据,帮助自己更好地做出投资决策。高度监管产业中的企业不断在系统中查询,确保自己能够跟上经常变化的监管和合规标准。 肿瘤学家在测试认知系统能否帮助他们利用专家经验和研究手段,理解癌症患者的医疗信息,找到个体化、循证的治疗方案。

这样的经历对于牵涉其中的专业人士来说意味着什么?世界知名的肿瘤学家,纪念斯隆-凯特琳癌症中心(该中心正与Watson合作帮助内科医生对患者进行个性化癌症治疗)的Larry Norton博士说:“计算机科学发展迅猛,医疗事业也会受其影响。这被称为协同进化 (coevolution)。我们要互帮互助。我预想这样的场景:病人、电脑、我的护士、我的研究生同事还有我自己都在诊室一起交流。”2

在Watson的象棋博弈前辈Deep Blue于1997年击败世界象棋冠军Garry Kasparov之后,我们首次看到这种共生的迹象。在那次演示之后,Kasparov继续参加这种新“自由式”的象棋联赛,在其中,选手们可以自由地使用任何他们喜欢的计算机程序。在这些联赛中,一些选手孤身奋战。一些完全依赖于计算机程序。但那些将计算机与他们自身的直觉和比赛天赋相结合的选手是最成功的。3

“机器与人相配合的团队甚至比最强大的计算机更具优势。人类策略上的指导与计算机战术上的敏锐结合起来是所向披靡的。我们(人类)可以集中精力于策略规划而不是把那么多时间花费在计算上。在这些情况下,人类的创造力是最重要的。”4

——加里·卡斯帕罗夫

3 前行的技术之路与何以可能的科学

当Licklider帮助认知计算形成一种哲学方法时,他几乎无法表达出前行的技术进路。随着计算机实验室之外的世界不断发展,认知计算的道路仍在被定义,且不断调整。尤其是,我们真切地意识到数据正怎样塑造着我们的未来。Gartner预计,在未来五年世界的信息将增长800%,而且80%的数据是非结构化的。其中包括人类语言记载下的每一件事 (从教科书到诗歌),图片捕捉到的每一个瞬间(CAT扫描到家庭照片)以及声音记录下来的每条信息。它是隐藏在香气、味道、文本和振动中的数据。数据来自我们的活动,来自这个布满仪器的星球。

在信息、知识和服务产生价值的全球经济和社会中,数据代表着这个世界上最丰富、最具价值、最复杂的原材料。直到现在,我们还没有方法对它进行有效开采。

可编程系统基于这样的规则:通过一系列预先设定的进程,从数据中得出结论。尽管它们强大而复杂,也是决定论的——其繁荣建立在结构化数据之上,但是无法处理定性的或不可预见的输入。而当今这个复杂而突变的世界中充斥着模糊和不确定性,死板的可编程系统难以应对这些特征。

认知系统是基于概率的,意味着它们被设计成去适应和理解非结构化语言的复杂性和不可预测性。它们可以“读”文本、“看”图像、“听”自然语音。它们解读那些信息,整理信息并提供对其意思的解释,同时伴有推论和推理过程。它们不提供最终的答案。事实上,它们并不“知道”答案。相反,它们被设计成从多个来源中去衡量信息和想法,去推理,然后提供假说以供参考。一个认知系统可以对每个可能的洞见或答案给出一个自信水平。

Watson在 Jeopardy!中犯的一个错误就是例证。在第一天的比赛将结束时, Jeopardy终局的类目是“美国城市”。线索是“它最大的机场是以某二战英雄命名的;它的第二大机场是以某二战战役为名的”。答案是芝加哥(两个机场分别是O’Hare 和 Midway)。Watson猜测,“它是多伦多?????”Watson困惑于这个问题有很多原因,包括这句话的语法结构,在伊利诺伊州有一个城市叫Toronto,而 Toronto Blue Jays在美国棒球联盟中打棒球。

结果,Watson自信水平出奇的低:14%。如果这是Jeopardy!常规线索,参赛选手必须响铃示意,但作为Jeopardy终局阶段的线索,Watson可能因为答案自信水平太低而没有响铃。Watson知道哪些事情是它不知道的,图1.2中 的五个问号暗示了这一点。

阅读 ‧ 电子书库

图1.2 Watson在Jeopardy!中犯的错误

然而,认知系统能够从错误中学习。通过大规模机器学习,认知系统能从训练和运用中不断得以改善。

消化语料库知识,根据任何给定主题接受专家训练,认知系统可以通过一系列Q&A的方式得以训练。人与系统互动,就系统反馈的正确性做出反馈将会提升机器的“知识”。

当Watson参加Jeopardy!时,它完成了一件事——以五种技术为基础的自然语言Q&A(提问和回答)。今天,Q&A只是Watson以应用程序界面方式提供的众多功能之一。从那以后,我们已经研发出多达二十多个新的应用程序界面,采用了五十多种不同的认知技术。这也是认知计算的技术方法和当前人工智能的关键区别。认知计算并不是单一的计算机科学,它结合许多学科知识,从硬件架构、算法策略、工业流程设计到行业专长。

我们每天使用的许多产品和服务——从搜索引擎广告应用,社交媒体网站面部识别到“智能”汽车、电话和电网——正在见证人工智能的方方面面。

绝大多数人工智能产品和服务都是为了实现某种功能,侧重于应用,专为某种特定服务而设。它们使用了一些认知计算的核心功能:有的使用了文本挖掘技术,有的通过机器学习进行图像识别。所有的产品和服务都局限于最初打造它们的构想。

相比之下,认知系统具备五个核心功能:

①加深人与系统的互动

人们与系统的互动更加充分,这种互动是以每个人偏好的模式、形式以及质量为基础的。认知系统充分利用搜集到的数据创造出有关个体的精细画面——比如,地理位置数据、网页互动、交易历史、钟爱节目的模式、可穿戴设备数据和电子医疗记录——并为这幅图景添加一些很难察觉的细节:语气、情绪、情感状态、环境条件以及人际关系的强弱和本质。它们从所有结构和非结构数据中进行推理,找出什么才是人际交流中重要的东西。通过不断学习,这些接触交流将传递出越来越大的价值,也会变得更加自然、有预见性,情感也会拿捏适中。

②拓展并提升专业技能

各种工业知识和专业知识正在以任何专家都难以追赶的速度迅速膨胀——期刊、新协议、新立法、新实践和崭新的领域。医疗保健行业有一个明显的例子,在 1950年,人们预测全世界医学知识翻一番需要50年时间;到了1980年,时间缩短为7年;2015年,不超过3年。与此同时,个人一生能产生100万 GB的健康数据,相当于3亿本书。

为了帮助组织机构跟上步伐,人们设计了认知系统,它能作为专家的伙伴提高他们的业绩。由于这些系统掌握了专业术语——医学、销售和烹调等术语——它们能够理解和传授复杂的专业技能。这大大缩短了从业者转变为业内专家所需的时间。另外,由于这些系统是由领先的从业人员训练的——不论是顾客服务,肿瘤诊断,还是判例法等任何行业——系统能让很多人获取这些领先人士的秘诀。

③将产品和服务与认知融合

认知技术让感受、推断和了解用户和周围世界的新一类产品和服务成为可能。持续改善和适应,增强功能以推出未曾想到的新用法,也因此成为可能。在汽车、医疗设备、器具和玩具行业,这些正在发生。物联网正在急剧拓展全球的数字产品和服务——哪里有代码和数据,哪里就有认知技术的用武之地。

④使认知流程和运营成为可能

认知还能转变公司的运营方式。融合认知能力的商业运营,能将内外资源中的数据表象化为财富。它让公司重视工作流程、上下文和环境,这有利于持续性学习、改善预测、提高运营效率,并按当今的数据生成速度做出决策。这对当今世界而言是个大好消息,想想看,一个市值平均10亿美元的公司每周要花1000个小时来管理供应商。

⑤提升探索并加速发现

最终,认知商业将具备的最强大的工具堪比“车前灯”,它可以照亮日益复杂、变化多端的未来之路。随着各行各业的领军人物争相在药物研发、复杂经济模型、材料科学、初创公司等方面加大筹码,这样的“车前灯”变得越来越重要。把认知技术运用到大数据上,领军人物就能找到模型、机会和可执行的假设,而仅仅通过传统研究或可编程系统,几乎不可能发现这些。

假如能像设想的那样实现认知计算,那么,底层平台必须足够宽广、足够灵活,以便在各行各业得到运用,它还必须支持跨行业运用。为此,研发工作必须从全局出发,旨在打造一个强健的平台,其中许多功能都可以支持来自开发者生态圈各种各样的应用。

这个平台必须涵盖机器学习、推理、自然语言处理、语音和图像识别、人机交互、对话和叙述生成等等。许多功能要求运用高性能计算、专业化的硬件架构,甚至是新的计算范例这样的专业基础设施。以上每种技术都源于各自的科技或学术领域,但是,这些技术必须和支持认知解决方案的硬件、软件、云平台及应用协同发展方能奏效。

随着Watson的迅速演化,未来可能已初见端倪。举个例子,一种分析X光、MRIs和超声波图像的认知医学图像应用,它能处理医学期刊、书本和文章的自然语言;它利用机器学习来矫正和增强理解力;它还可以开发深度知识表征和推理,有助于形成可能的诊断结果。为此,需要专业的图像处理器来支持大规模数据和人类专业知识,指导系统学习, 解读系统生成的结果。

这种新模型的威力能应用于任何领域。油气公司能把地震图像数据和对成千上万的论文、报告、时事、经济数据和天气预报的分析结合到一起,为开采提供风险回报分析。或者,通过分析测试成绩、出勤率和数字学习平台上的学生行为信息,学校能建立纵向的学生档案和个性化教育计划。

IBM正在与多个领先的癌症研究机构合作,加快临床识别,为患者提供个性化治疗方案,它被认为是短期内最有前途的认知计算应用之一。该计划旨在减少解读DNA、了解个人遗传信息,从医学文献搜集相关资料的时间从几周变为几分钟。由此产生的分析结果使医生能够针对患者特定的癌基因突变做出诊断。只需几分钟,Watson就能完成遗传物质和医学文献的审查过程,产生一份可视化数据的报告,并以循证医学为基础,综合患者个人独特的基因提供可行的药物方案。临床医生可以评估这些证据,以确定它的疗效是否会比标准方案更有针对性。

4 前沿认知科学的含义和义务

认知时代(The Cognitive Era)是应用型科学发展的下一步,它帮助人类理解自然并改善人类的生存状况。在此意义下,它是一个老故事开启的新篇章。围绕人工智能的争论只是其中一个最新的例子,是相信科学进步的人和那些害怕它的人之间古老争论的延续。与媒体和娱乐界的争论相反,在科学领域,裁决已定。追求认知未来已成为广泛共识,人们也普遍认为有必要有责任推进技术发展。

“技术创造可能性和潜力,但最终,我们的未来将取决于我们做出的选择。我命在我,不在技术。”5

——Erik Brynjolfsson,MIT(麻省理工学院,著名经济学教授)

具体而言,我们会继续塑造认知计算对工作和就业的影响。与所有技术一样,认知计算将改变人们的工作性质。它将有助于我们更快速、更准确地执行一些任务。许多处理过程会因它变得更便宜、更有效。某些事它甚至会比人类做得更好——自文明诞生以来便一直如此。事情总是这样,新技术被发现具有更高的价值,我们的社会和机制逐渐适应它并获得进一步发展。所以,我们有理由相信此时此刻的情况与以往并没有什么不同。事实上,认知时代会为人类开启一个知识、发现、机会都以指数级速度增长的世界。我们也有充分的理由相信人类的工作将变得越来越有趣,也更具有挑战性和价值。

阅读 ‧ 电子书库

图1.3 认知计算系统以类同人脑的工作方式,进行学习和处理任务

同时,社会的控制和保障也一样重要。对于智能系统的担忧再一次适用于此。从汽车、药品到手机,每一项技术的转换都会涉及个人和机构的安全问题。这些问题已经刻不容缓,也将继续与认知技术发展如影随形。这些问题已经被今天激进的技术民主化(网络和云的快速传播是背后的驱动力)以及随之而来的成本削减所点燃。

我们相信,答案不是试图限制民主化,而是要拥抱它,同时设计出融合隐私、安全和人工控制的认知系统。

5 为下一代人类的认知铺平道路

最后,所有的技术革命不仅是被发现的,而且是由商业和社会需求推动的。我们追求这些新的可能性并不只是因为我们有能力,而是因为我们有所求。

由于世界的复杂性和我们自己根深蒂固的偏见和方法,我们最初对每一项革命性的技术的理解都是有限的。然而,所有的限制必然会被发展所突破。事实上,我们一直在为不知道而付出昂贵的代价:我们不知道患者的病因出在哪里;不知道产品的消费者在哪里;不知道重要的自然资源藏在哪里;不知道每一项投资的风险在哪里。

“行为明智的最大障碍是无知,它也是恐惧的最大来源。小小的蜡烛会发出误导性的微弱光线,投射出巨大而不详的阴影。正午太阳光线明亮,不会投下一丝阴影。是时候将这整个人与机器的难题置于耀眼的正午阳光之下了。计算机永远不会剥夺人的主动权,也不会取代人类的创造性思维。计算机会把人类从低级的重复性思考中解放出来,让人类更加充分利用理性,创造更多机会。”6

——Thomas Watson Jr.(小托马斯·沃森,IBM第二代总裁)

我们相信世界上的许多难题终将得到解决,并且我们相信,认知计算正是帮助我们实现这一宏伟目标的工具。

炒作“人机大战”的戏码会让我们偏离主题,这些戏码只存在于那些激动人心却有误导性的小说里。现在的认知系统不是我们的竞争对手,将来也不会是,科学和经济学的证据都不支持这种恐惧。真正的认知系统实际上是一种深化重要关系的工具——人与世界的关系。

通过它们,我们将为下一代人的认知铺平道路。我们能用崭新而有力的方式思考和推理。认知系统是真正灵感源于人类大脑的机器。同样的,这些机器也会真正激发人的大脑,提高我们的理性能力,改变我们的学习方式。在21世纪,知道所有的答案并不能称得上智慧,但提出更好的问题才算真正的天才。

参考资料

1. Licklider, J.C.R. Man-Computer Symbiosis. IRE Transactions on Human Factors in Electronics. 1960. http://groups.csail.mit.edu/ medg/people/psz/Licklider.html

2. Kelly, John E. and Steve Hamm. Smart Machines: IBM’s Watson and the Era of Cognitive Computing. New York. Columbia University Press, 2014.

3. Kelly, Kevin. The Three Breakthroughs That Have Finally Unleashed AI on the World. Wired Magazine. October, 2014.

4. McAfee, Andrew. Did Garry Kasparov Stumble into a New Business Process Model? Harvard Business Review. February, 2010. https://hbr.org/2010/02/like-a-lot-of-people/

5. Brynjolfsson, Erik and Andrew McAfee. The Second Machine Age: Work, progress, and prosperity in a time of brilliant machines. New York. W.W. Norton & Company, 2014.

6. Watson, Thomas Jr. IBM Archives. https://www-03.ibm.com/ ibm/history/exhibits/watsonjr/watsonjr_quoted.html