联名预警信发起人：一旦获得通用人工智能，人类就可能会灭绝

资讯1年前 (2023)发布腾讯新闻潜望

867 0 0

联名预警信发起人：一旦获得通用人工智能，人类就可能会灭绝 照片由AI形成

腾讯新闻《潜望》创作者张静珺只想说北京市

大半个月前，包含OpenAI CEO Sam Altman、图灵奖得主Geoffrey Hinton等在内的百余名人工智能顶级人员，联名鞋签定了一封有关AI对人类灭亡存有攻击的简洁明了申明。

这申明只有一句话——“缓解人工智能的灭亡风险应该和疫情和核战等其它社会发展经营规模风险一起变成了全球优先选择事宜。”

英国剑桥大学人工智能研究助理教授David Krueger是这个消息最早发起者之一，都是签名者。

6月9日，Krueger在出席2023北京市智源会议上期内，与腾讯新闻《潜望》进行了一次深度对话。他长期关注AI两端对齐与安全隐患，从2012年以来就逐渐焦虑人工智能针对人类灭亡潜在风险，业内将这一称之为“X-Risk”（An existential risk）。

对于AI风险，一种见解辩驳称，这类明显的焦虑可能和数百年前蒸汽发动机出现的时候人类的过多慌乱有些相似。但Krueger称，二者较大不一样是，蒸汽发动机也不会让人类灭亡，但AI会。

Krueger觉得，AI比人类比较聪明，混乱之间的竞争，及其搭建对这个世界造成更直接关系的AI系统软件——这三重要素都是会巨大提升人工智能系统软件无法控制的风险指数。“系统软件越发对外开放、越发独立、越发智能化，而且越发致力于完成长远目标，系统软件无法控制的风险也就越大。”他说道。

他认为，人工智能安全问题如同全球气候变暖难题一样，多方有分别利益，会出现众多矛盾与分歧，最后使其成为繁杂的全世界协调问题。所以必须尽快逐渐，经过多方勤奋，才可以让人类不会沦为至被AI接手的命运。

唯有如此，人类才可以生存下去。

联名预警信发起人：一旦获得通用人工智能，人类就可能会灭绝 David Krueger

以下是David Krueger的交谈精义。

《AI风险申明》联名信仅一句话，是精心打造的

腾讯新闻《潜望》：你也是《AI风险申明》（Statement on AI Risk）签定者之一，能不能告诉我们，这则申明是如何崛起的？

David Krueger：我一年多前也就有了这种想法，主要原因是人们对于AI的风险，尤其是AI可能会致使人类灭亡的风险越来越重视。此外，好多人并没公布探讨这个问题。

一个重要主要原因是历史时间原因，这一观点曾经被视作边沿念头，大家担忧公布研讨会给自己带来不良影响，进而影响职业发展前景。

好多个月前，最佳时机来啦。自打ChatGPT和GPT-4公布，人们对于AI的高度关注做到前所未有。很长一段时间，大家认可这应该是假设性未来的发展难题，但是现在为时过早。

对于这一申明是怎样所产生的，电话联系了一些朋友，包含人工智能安全管家负责人Dan Hendrycks。我跟他说我们要做这样一份申明，所以我准备尽早做。但我不知道自己是不是有足够的勇气进行。它十分应急。因此，Dan接到这一话题，促进了申明发布。

腾讯新闻《潜望》：您对这个消息的用语带来了什么意见？

David Krueger：我建议只用一句话来表现。缘故几个。

最先，如果你有很长阐述，很有可能会有人对在其中一些具体内容持不同的观点。

大家在各个月前见到，生活将来研究室（Future of Life Institute）发布号召：全部人工智能试验室马上中止练习比GPT-4更强的人工智能系统软件最少6个月。许多人对此地反应是，听起来不错，但我觉得我们不能中止人工智能的高速发展。

自然她们发布这一申明依然非常有效，因为一旦人说我们不能中止，是我们必须付诸行动的征兆。大家真的需要有实力中止一项过度风险而不是研发的技术性。

我使用这种事例就是为了表明，当你说越多，大家就越是有不同的观点。在这样的情况下，我们并没有提怎样处理这一风险，所以人们对正确方式也有不同的观点；我们也没有说为何它可能造成人类灭亡，因为不同人对于此事也有不同的观点——有一些人很担忧技术性被乱用，另一些人更担忧技术性无法控制，然而这并不是某一故意个人行为者有意所造成的结论。

不管是哪一种方法，只需很多人认可这也是极大风险，我们应该付诸行动，那么就可以了。

AI风险与蒸汽发动机有实质差别

腾讯新闻《潜望》：人们对人工智能威协的焦虑，与两三百年前人们对于蒸汽发动机未知的恐惧，较大区别有什么？

David Krueger：针对那一段历史时间，我并不是很了解。我不知道那时候是不是有人说过也会导致人类灭亡。当有人这么说过，我也不知道她们会用怎么样的论点论据，对我而言，好像不大可能。

重要区别就是大家讨论的是灭亡。大家讨论的是一种其实比人类在各类有关能力方面比较聪明、更强的技术性。

蒸汽发动机使我们可以造就比人类更优秀、更快的物理学能量。但蒸汽发动机不具备智能化，较容易操纵。即便其中一个无法控制，最糟糕的情况只不过是它出现故障，上边的人肯定会死掉或负伤。可是，如果一个智能控制系统或者一个可以自我繁殖的软件控制不住了，可能有些人会身亡，因为他能够生长并获取更多的能量，这也是重要差别。

腾讯新闻《潜望》：有的人认为公布申明只有阻拦善人，尝试让善人强化对安全隐患的高度关注、缓解产品研发速率，但是却阻止不了小人的行为。大家怎样预防恶人呢？

David Krueger：根据监督和国际交流来诚信行为。

我不太喜欢用“善人”和“恶人”来讨论这个问题，毕竟大家一直觉得自己是善人。我担忧的关键风险并不是一些恶人或故意个人行为用户对人工智能系统实现故意实际操作，反而是相近气候问题问题——本人很有可能是从点燃大量化石能源或生产制造难以掌控的更优秀系统内获取更多的权益，但每个人都应该担负一些成本。在气候问题的情形下，这时候对周围环境造成危害。在人工智能的情形下，风险是体系无法控制进而造成大灾难。

这更多的是一个鼓励难题。实际上，人类更重视自己、好朋友、亲人和小区，而非全球另一边的某一路人。因而，并不一定故意用意，只需自私自利本能反应。这也是为什么必须管控，这也是处理这种人类整体利益难题的形式。

AI两端对齐工作中有较多不解之谜

腾讯新闻《潜望》：你研究兴趣是深度神经网络、AI两端对齐与安全，可不可以用平常人听得懂的表达表述什么叫两端对齐（Alignment）？你说过的“两端对齐无疑是AI发展的核心推动力之一”，为何它如此重要？

David Krueger：我很喜欢说大家对于此事有三种不一样了解。一种是使AI系统软件依照我们自己的意向行为。但我不觉得这是一个好界定，它太广泛了，每一个技术工程师都是在试着让AI系统软件依照她们的想法行为。

还有一个更准确的概念，即“用意两端对齐”。我认为它是恰当界定，就是指让系统软件尝试依照我们自己的意向行为。在设计工具时，你想要其具有恰当的用意、动因与目标。它仍然可能不能按你的意向行为，因为他很有可能欠缺水平，也有可能不够聪明，不知道该如何完成你的想法。那如果其具有恰当的用意，也可以说这是两端对齐的。

人们对于两端对齐的最后一种含义一切降低人类灭亡风险的专业技术勤奋。有时候，也是指像我一样致力于两端对齐和安全这一领域的人所属的群体。这并不是我的最爱界定。那只是大家对于怎样解决这个问题的一个念头。但是最终，在整治、监督和国际交流层面还要进行大量工作中，比如缔结条约，这也是减轻这一风险所必须的。

腾讯新闻《潜望》：科技有限公司和科研院所在两端对齐技术层面近期获得了什么重大进展？遭遇最急切的挑战难点是啥？

David Krueger：最主要的是对于大中型语言模型的调整技术性，已经做了许多工作中更改模型个人行为。例如，GPT-3和GPT-4区别在于，系统展开了两端对齐，能更多的依照设计师的用意行为。主要通过增强学习和人类意见反馈完成，虽然细节问题并不是公布。这在一定程度上取得了不错的成绩，但是它还没有完全清除这种实体模型存在的不足。

我担心这项技术针对更强的系统软件很有可能不足以，因为他对个人行为的变化很有可能相对性表层。伴随着系统软件更优秀，这个问题很有可能越来越比较严重。

这有些像练习小动物比喻，就好比你练习一只狗不了家俱。或许如果你到场时，他在这些方面主要表现得很好，但如果你离开屋子，它仍然上家俱。此类情况可能发生在各种分析中。他们看上去有可能是两端对齐的，那如果他们觉得我们不应该留意到它们不正当行为，他们依然会主要表现欠佳。

腾讯新闻《潜望》：当AI智能化比人类聪慧许多时，人类怎样在一个智能体里进行两端对齐工作中?

David Krueger：这是一个开放式探究问题。因而，开展AI两端对齐的探索至关重要，是为了寻找这个问题的回答。

腾讯新闻《潜望》：大家怎样通过两端对齐，使AI爱惜人类而非损害人类？

David Krueger：这和前一个难题是一样的。我希望有一个答案，但是目前还不清楚。

这三大发病原因可以增加AI无法控制风险性

腾讯新闻《潜望》：你觉得，现如今这个时间段处在AI中国历史上的什么时刻？

David Krueger：大家已经是整个世界都已经意识到风险时时刻刻。我等待这个时刻来临有一段时间了。

腾讯新闻《潜望》：大家从十年前听Geoffrey Hinton教授深度学习课程后，便开始担忧AI可能造成人类灭亡。你为何在如此快的环节逐渐焦虑？

David Krueger：我在正常情况下就担心在某一个情况下会出现这样的事情，由于总有一天它要比人类比较聪明，但当看到Hinton课程内容时，我的焦虑出现了改变。深度学习的发展潜力都比我以前经常说的其他方式更高，能够产生真真正正智能。

腾讯新闻《潜望》：什么样的情况，人工智能系统会失灵？

David Krueger：第一，假如他们比我比较聪明，你可能会担忧他们细节方面无法控制时，但无法精确预测分析这样的事情会怎样产生。

第二个增加风险的因素就是，存在许多市场竞争，希望尽快开发与布署强悍的AI系统。目前国内在谷歌和微软中间看见了这类市场竞争存有。大家也害怕全球化竞争，这应该是经济发展市场竞争，也有可能是国际局势市场竞争，乃至有可能是国防市场竞争。

第三个因素是，当你已经搭建对这个世界造成更直接关系的AI系统。现阶段大家看到系统仅仅语言模型，他们仅仅生成文本。但也有一些人们在科学研究把它们与其它系统融合，比如应用他们编写代码，应用他们操纵不一样的人或事，不论是通过线上或是运用他们来调节现实世界中的人或事。给与这种系统更多管控权和管理权会增加风险。

再比较一下我们目前拥有的系统，这种系统关键仅仅练习来评估文字，这是一种比较安全的搭建系统的形式——和要求系统在某一个环境里达到目标对比，尤其是和系统在与真实世界、现实世界经常互动交流的环境里达到目标对比，这安全系数高。当系统尝试在现实世界中达到目标，他们很有可能很自然地试着获得更多的资源与权利，所以这些针对完成长远目标是很有帮助的。

因而，系统越发对外开放、越发独立、越发智能化，而且越发致力于完成长远目标，系统无法控制风险也就越大。

腾讯新闻《潜望》：如果你觉得应当制订全世界合作框架，以保证世界各国在AI发展趋势层面遵照一同的基本原则与标准，那这些实际的基本原则与标准应当有什么？

David Krueger：大家肯定必须这么做，并且需要应急下手去干。由于将会是艰难的，将需要大量交流和商谈，毕竟不同我国中间存在很多矛盾和矛盾。

有关细节问题，这也是我仍在考虑的问题。我希望保证我们有一些十分合法合规整治机构或者社会治理体系，假如在接下来的某一情况下我们都觉得必须，可以促进中止。这也是其中一个关键一部分。

在咱们正在开发和部署的系统层面，状况变得更加繁杂。我希望有一些检测、评估和财务审计体制。我们也许还要考虑到某类方式的许可证书，但是还有一些细节要解决。现阶段，我记忆里并没有完整的计划方案。这也是为什么希望我们能激发大量从业政府决策、有着政策及大国关系等多个方面专业知识人们去思考这个问题。

腾讯新闻《潜望》：在现阶段的人工智能系统中，哪几个方面必须尽快改善，为应对潜在风险和威协？

David Krueger：一是可扩展性（注：可扩展性指的是在出现异常和危险前提下系统求生的水平）。大家现阶段的系统在可扩展性上存在基本问题，里面最有吸引力的是竞技性可扩展性难题，即对键入开展细微更改（甚至是对人类而言无法发觉）可能会对系统的举动造成很大影响。这种情况已是家喻户晓的难题大概有10年多，但好像依旧没有解决方法。假如我们考虑到这些追寻某一总体目标试图提升他们对于目标的认知的系统，这是很大的难题。因为根据他们对于目标的认知，最佳的结论可能和他们所想像或用意目标有很大的不同。而我现阶段开展评估发现不了。

另一个是，大家对这种系统工作模式欠缺了解。我们确实期待能理解这种系统的工作状态，这就是我们可以预测分析他们个人行为最好的方式之一。我希望保证他们不容易进新前提下以意外和风险的形式做事。这和可扩展性难题相关。

人类灭亡间距如今漫长吗？

腾讯新闻《潜望》：目前看来，人类间距灭亡的距离遥远吗？预估会几年？

David Krueger：Jeffrey Hinton一直在说我们应该花20年或者更短期内才可以获得通用性人工智能（AGI），这是合理的时间段。这和我的观点非常类似。

我觉得在这之后没多久，人类可能灭亡，却也可能还需要很长的时间，我想这就是我想谈到的，即便这也有几十年，我们还需要尽早逐渐处理。

重新回到气候问题的对比。人们花掉了几十年时长才真真正正采取相应的行为，但依然没做充足的工作中来避免气候问题所带来的严重危害。主要是因为它是一种繁杂的全世界协调问题。人工智能也将面临类似情况。我们要尽快逐渐。

腾讯新闻《潜望》：大语言模型能够带来AGI吗？

David Krueger：许多人如今都是在有这种想法。我的观点较为复杂。我会说这不是不可能，但更可能是指必须把与别的结合在一起，乃至可能还需要开发设计一些新技术应用。

腾讯新闻《潜望》：如何看待人类与人工智能之间的关系？人类将会是智能化的衔接吗？

David Krueger：仅有时间可以告诫我们回答。希望不容易那样。但是现在，这是一个大家还有一些主导权与能力来引导、确定今后将怎样发展问题。假如我们能以智慧与融洽的形式行为，假如我们可以走好运，而作为人类，AI是不是在某一时刻接手，将在于我们自己确定。

腾讯新闻《潜望》：Hinton有一个非常有意思的见解。他说道：毛虫会获取营养物质，随后转化为彩蝶，人们已经采集了数十亿理解的营养物质，GPT-4便是人类的彩蝶。你允许这一观点吗？

David Krueger：十分诗情画意，我不觉得彻底精确，但也许它碰触了某类实质上的真知，即AI系统不一定必须重新开始、亲身经历艰难的方法学习培训一切。人类必须通过漫长演变才做到人类智能化的水准，但是现在人类形成了这所有的一切文化创意产品，包含网络上的全部文字，这对AI系统还是非常有启迪。因而，他们不一定需重新亲身经历每一个演变来实现相近智能水准。

腾讯新闻《潜望》：你是第一次来中国吗？对来中国的第一印象如何？对中国的人工智能和大模型发展趋势，是否存在一些建议？

David Krueger：这是我第一次赶到中国。我前几天早上刚进。全部访问时间都在和人会晤和沟通交流，大家非常nice，我在这具有良好感受。但我并不觉得我已真真正正体会到中国。我就是与科研人员会晤，遗憾的是，对我而言将会是一个短暂旅游，但希望离开前的最后一天至少可以仔细看看北京市。

（对中国的意见）我觉得，最重要的是思考与了解可靠性和对齐性。从他开展的对谈中可以看到，大家最少在一定程度上早已正在做这一块的工作中。

腾讯新闻《潜望》：影片《Her》中很多情景已经渐渐在大家的真实的世界中出现。人类会让人工智能也会产生情绪吗？您对你所能研发的AI实体模型是否存在精神层面的依赖？

David Krueger：我并没有，但根据我所知道，有些人有。

同样存在相似的人工智能女友聊天智能机器人，有些人已对这个关系形成了心理依赖。这也是这一技术的一个悲哀的不良影响。

92game游戏网

颜色官网