我们需要学会如何与人工智能争论 - FT中文网
登录×
电子邮件/用户名
密码
记住我
请输入邮箱和密码进行绑定操作:
请输入手机号码,通过短信验证(目前仅支持中国大陆地区的手机号):
请您阅读我们的用户注册协议隐私权保护政策,点击下方按钮即视为您接受。
人工智能

我们需要学会如何与人工智能争论

明:如果人类只是一味给那些听起来权威的信息盖章背书,那将毫无意义。
00:00

{"text":[[{"start":7.33,"text":"本文作者是理论神经科学家,著有《机器人免疫》(Robot-Proof)一书"}],[{"start":12.469999999999999,"text":"从设计上说,生成式人工智能(Generative AI)就是制造一种看似能力出众却缺乏实质能力的机器。为了观察这对我们的思考能力产生何种影响,我让全班学生在使用同一个AI智能体完成同一份作业时佩戴脑电图头戴设备。从教室前排看,他们几乎一模一样:低头伏案、屏幕发光、手指敲击。然而在他们的脑中,却上演着两种截然不同的情形。"}],[{"start":40.03,"text":"在大多数学生身上,用于测量大脑活动的脑电图显示,代表认知用力的高频“伽马”振荡在使用AI智能体几分钟内就崩溃消失。他们的神经状态逐渐滑向一种更接近看电视而非解数学题的状态。"}],[{"start":56.25,"text":"然而,在极少数学生身上,伽马波却显著增强。看起来,这些学生会和机器争论,对机器自信满满的答案提出质疑,进而迫使人工智能反过来审视并批判他们的思维方式。虽然最终完成的论文在整体上可能大同小异,但在整个学期的学习过程中,正是这少数几名学生获得了显著更多的智力收益。"}],[{"start":80.06,"text":"在过去近二十年里,我一直在记录人们对科技使用反应的差异,发现在各处都出现同样的模式:两个人用同一个工具做同一件事,一个人的大脑变得更敏锐,另一个人的大脑却变得沉寂。"}],[{"start":94.01,"text":"你可以把科技使用者分成几类——复制粘贴信息的“自动人”,只寻求印证自身偏见的“验证者”,以及与机器对招的“半机器人”。不过,比起这套分类本身,更重要的是促成这种分类的内在机制。"}],[{"start":109.60000000000001,"text":"哈佛(Harvard)在2019年发表的一项研究,用一个反直觉的单一发现说明了这一点:被要求自己动脑解决问题的学生,比听传统讲座的学生学到的明显更多,但他们却说自己感觉好像学得更少。我们的大脑会把听人讲授知识时那种流畅顺滑的感觉——不论是在课堂上,还是由AI来讲授——误认为是真正学习时那种更艰难、更混乱的过程。而生成式人工智能,是人类迄今创造出的最流利的东西。"}],[{"start":140.08,"text":"要抵抗这种倾向,就必须主动选择一种有建设性的不舒服——承认自己可能错了,或者去做那种枯燥却必要的工作:反复审视一个看上去对的答案。"}],[{"start":151.42000000000002,"text":"我们大多数人并不会这么做。2012年至2016年间,我和教育研究者、同时也是我妻子的诺玛•明(Norma Ming)一起,分析了大约6万名本科生和工商管理硕士项目学生在讨论区中的发言记录。最让我印象深刻的发现是:在论坛里最常“说错话”的学生,反而是最后拿到最高分的那批人。他们不断提出看法、不断探索,经常而且公开地犯错。那些顺利通过课程的学生——占到十分之九——则很少愿意冒险提出自己无法充分论证的主张。(如果你好奇,那些不及格的学生主要在讨论周末计划,以及自家狗曾经干过的趣事。)"}],[{"start":192.65,"text":"这正是当前人工智能测评在前沿实验室公布编码、法律或医学考试接近满分成绩时所忽略的部分。测试只是在隔离环境中评估模型,而在实际应用中,人工智能是与人协同工作的——例如,放射科医生在综合参考它的影像判读结果,初级律师在核对它起草的诉状。"}],[{"start":214.13,"text":"在政策层面,同样的错误正在被大规模复制。欧盟《人工智能法案(AI Act)》第14条要求对高风险的人工智能部署实行“人工监督”,并将这一要求当作一种防御性的核对项:只要把人纳入回路,回路就是安全的。但在一个由语言流畅、极具说服力的人工智能主导的回路中加入人工操作员,几乎必然会产生自动化偏见。操作员会变成无聊的文员,对那些听起来权威却实为幻觉的输出照单全收。对大多数人来说,另一种选择——对每一个输出都积极参与、认真核查——在认知上极其耗费精力。"}],[{"start":253.07999999999998,"text":"解决之道不是加强监管。英国人工智能安全研究所(AI Security Institute)、美国的CAISI以及欧盟的人工智能办公室(AI Office)目前像实验室那样,在隔离环境中测试人工智能模型。它们应当转而评估人工智能对使用者本身的影响。我的建议是建立一个“混合智能指数”(Hybrid Intelligence Index),用来衡量人在与机器协作一段时间后,其思维变得更敏锐还是更迟钝。"}],[{"start":278.16999999999996,"text":"这就意味着要有意在设计中加入摩擦。在我进行的一组实验变体中,我让人工智能只提供提问和背景信息,而不是直接给出答案,结果高伽马脑波、主动投入的学生比例翻了一倍多。"}],[{"start":292.30999999999995,"text":"在一个愈发由人工智能产品塑造的劳动力市场中,能与自信满满的机器“争论”的人和不能做到这一点的人之间的差距将进一步拉大。那些只追求人机交互流畅度的经济体,面临的风险是:把自己真正需要的头脑也一并自动化掉。"}]],"url":"https://audio.ftcn.net.cn/album/a_1780982748_9052.mp3"}

版权声明:本文版权归FT中文网所有,未经允许任何单位或个人不得转载,复制或以任何其他方式使用本文全部或部分,侵权必究。

澳大利亚试图解决住房危机

澳大利亚总理阿尔巴尼斯正试图扭转延续数十年的税收激励措施,让年轻人买得起房。

美联储将不得不重新审视其全球角色

美国央行在帮助稳定他国的财政状况时,作出的不仅是经济决策,同时也是外交决策。

“先租后付”贷款瞄准居住成本重压下的美国人

在住房负担能力危机加剧之际,短期融资需求正在向租赁市场扩张。

在数据中心抢建狂潮中,AI“卖铲人”赚得盆满钵满

卡特彼勒与豪赫蒂夫等老牌工业股告别沉闷,在AI 热潮推动下迎来大涨。

Lex专栏:让AI承担其代价,最简单的办法是合理征税

在AI影响日益真实而混乱的当下,自由放任的时代已经过去。

SpaceX上市虽不至震垮资本市场,却将让市场雪上加霜

此次发行将进一步拉大指数成分股与指数外公司之间的估值差距。
设置字号×
最小
较小
默认
较大
最大
分享×