~~~雅各布专栏——专注行业第一品牌商业模式研究~~~
来源:克里斯-米德尔顿
概述:
世界经济论坛将五位人工智能巨头聚集在达沃斯的一个房间里,讨论生成式人工智能系统的未来,结果......很有趣。
(图片由Gerd Altmann 提供,来自 Pixabay )
瑞士小镇达沃斯坐落在雷蒂亚阿尔卑斯山脉之下,但是当世界经济论坛(WEF)在每年一月举行,或者乘坐私人飞机来对我们进行有关气候变化的演讲时,似乎人类的其他部分只能蜷缩在首席执行官、学者、企业家和世界领导人的山峰之下,他们就像雅各布峰一样寒冷而遥远。
在达沃斯论坛上,接受创新者采访的不是普通记者,而是媒体巨头的首席执行官。傲慢无处不在,但问责却少之又少。每个人都在说,但有人听吗?有,但只是听同行们在游戏中高谈阔论自己声誉股票的价值。
世界经济论坛自己的研究显示,人工智能生成的虚假信息是仅次于气候变化造成的极端天气的全球风险,53%的领导人都提到了这一点。随着许多国家的选举迫在眉睫,这种风险也是迫在眉睫,但我们却毫无准备。(如果说 ChatGPT 等是地震,那么接下来就是海啸)。
与此同时,国际货币基金组织发表研究报告称,发达经济体中 60% 的工作岗位都面临人工智能的挑战,其中女性和受过大学教育的工人最有可能受到这项技术的威胁,但同时也是受益最大的群体。
这个矛盾的潜台词是什么?你作为一个可雇佣的人类,未来的生存能力取决于你的老板是愿意投资于你的技能、想法和终身学习,还是更愿意为了省钱而解雇你,把你的工作交给一些机器人。
只是表面现象
因此,由于金融和 IT 行业是最容易实现自动化和人工智能增强的行业(根据世界经济论坛的数据),你会认为达沃斯的代表们都会小心翼翼地提防即将到来的代码浪潮;相反当首席执行官和教授们接受采访时,大多数人都心存敬畏,因为这些采访者的角色就像小总统候选人在采访他们学校里更酷的朋友一样。
这也许就是为什么在题为"生成式人工智能模型的扩展世界 "的会议上,人工智能的风险和益处都没有得到太多讨论的原因--这次会议的标题其实应该是 "人工智能将变得有多聪明,以及变得有多快"。
五位人工智能名人--屡获殊荣的法国计算机科学家、纽约大学数据科学、计算机科学、神经科学和电子工程银牌教授 Yann LeCun,01.AI 创始人李开复,Insitro 创始人兼首席执行官 Daphne Koller,DeepLearning.AI 创始人、"无处不在 "的 Andrew Ng,以及 Cohere 联合创始人兼首席执行官 Aidan Gomez--认为,答案是 "比你更聪明,而且很快"。
Gomez说:
到目前为止,'笨'战略一直非常奏效,我们一直在想,'让我们建造一台更大的超级计算机,用更多的数据进行扩展,我们就能获得非凡的性能'。但是,如果这种策略失效了,会发生什么呢?我们知道下一步是什么。我们需要[人工智能]上网,与现实世界互动。但现在部署这些模型的方式是,我们进行所有这些离线训练,但离线意味着没有与人的互动,没有与环境的互动。因此,当我们把它们部署到产品中时,模型是静态的,它不会学习,而是固定在那里,你所做的任何事情都不会改变这个模型或它的权重。而另一大障碍是,我们人类通过辩论来学习;我们发现新想法;我们探索真理的空间和知识的可能性。因此,这些人工智能模型也需要能够在它们之间做到这一点,这种自我游戏和自我完善的理念。
但这在现实中意味着什么呢?Gomez解释说,这将意味着让人工智能接触地球上最聪明的人,直到人工智能达到人类不再足够优秀的程度。
现在,一个主要的瓶颈--我相信大家都感觉到了--就是获取比我们的模型更智能的数据。以前,你可以随便从街上找个人,然后说:'请教我的模型如何正确说话'。这样就能改善你的模型,提高得分。但现在,他们开始变得非常非常聪明。所以,你不能再去找街上的普通人了,你需要去找数学硕士生或生物硕士生,然后再找博士生。但那又是谁呢?因此,人类及其知识是当前战略的上限,我们需要突破这一限制。
此时此刻,任何人工智能行业之外的人--或者达沃斯豪华辩论厅之外的人--可能都会问:这句话中的'我们'是谁?这个问题稍后再谈。
但首先,鉴于许多LLM和生成式人工智能制造商已经从整个网络中搜罗了大量数据来训练他们的模型,我们是否已经达到了数据高原,从而使少数几家大科技公司能够坐拥市场并主导变革的步伐?
Insitro公司的Koller说,完全不是这样:
随着时间的推移,人工智能模型可以使用的数据将越来越多,而我们才刚刚开始接触这些数据的表面。现在是我们在所有网络规模的数据上进行训练,这太神奇了,太不可思议了。但这些代理还没有 "实体化"--它们还不能与世界互动。
这意味着,来自联网设备、物联网、机器人、无人机以及大量其他专业和消费硬件的数据将真正把我们带入人工智能时代,就像Gomez所说的获得博士学位一样。
Koller解释说:
随着我们开始随身携带这些东西(人工智能),随着增强现实技术的发展,随着我们开始从自动驾驶汽车中获取更多数据,随着我们开始利用生物和医疗保健等其他数据模式,再加上目前隐藏在孤岛中的所有其他种类的数据,我认为这些模型将发展出新的能力水平,这将成为人工智能发展的主要推动力。
李开复说:
两年前,MMLU[大规模多任务语言理解能力]--大致是[大规模人工智能模型]智能的衡量[基准]--还在40多到50多级,现在是 90,还有更大的增长空间。显然,随着越来越多的企业家和大公司加入这场游戏,通过增加更多的计算和数据可以实现增长,但也有调整和改进不同方面的空间。
Andrew Ng 补充道:
[达到]天花板变得越来越难,但由于每天都有大量的创新,我们大多数人都会感觉步伐仍在加快。去年我们看到了文本[LLM]革命,但我认为今年我们将看到人工智能领域的图像处理革命--GPT-4V和[谷歌]双子座超算(Gemini Ultra)已经在这里出现了--但计算机将学会看得更清楚。我还看到了很多自主代理方面的创新,而不仅仅是提示 LLM,它就会给你一个回应。现在,你可以给 LLM 下达指令,它就能为你工作半小时,浏览网页,做大量研究,然后再返回给你[答案]。此外,我认为未来我们还将在自己的设备上运行更多的法律硕士课程。因此,有了所有这些创新载体,我很乐观地认为,今年的法律硕士课程仍将是一个巨大的飞跃。
(关于人工智能硬件,Rabbit 的 R1 口袋伴侣已于早些时候在 CES 2024 上发布。这种小型、设计简约的人工智能手持设备可以看到、听到并学习你如何使用每一个应用程序,并充当你使用所有应用程序的界面,似乎将改变游戏规则)。
对于 Cohere 公司的Gomez(想象一下韦斯-安德森设计的软件首席执行官)来说,虽然存在局限性,但今年的变革步伐可能会加快。
Gomez说:
我们今天的工作存在巨大的瓶颈。我们知道我们所使用的架构和方法的局限性,但我认为这同时也会变得更容易,因为硬件平台正变得越来越好。下一代 GPU 将比现在的 GPU 进步一大步,这将带来新的规模。因此,我非常看好未来的发展。
但是,要想让人工智能变得更聪明,需要一位资深的计算机科学家将人类本身简化为比特和字节。
LeCun 教授说:
当然,如果我们把注意力集中在当前的自回归 LLM 模型上,毫无疑问,它已经饱和了,我们正在耗尽数据--我们正在使用互联网上所有的公共数据。最新的 LLM 使用了 10 万亿个代币进行训练。每个代币大约两个字节,所以大约有 1013 个字节的训练数据。因此,我们中的大多数人需要花费 15-20 万年才能读完 [这么多数据]。现在,试着计算一下一个四岁的孩子在他或她的一生中看到了多少信息,在他或她出生后的头四年里,大约每秒有 20 兆字节的信息通过视神经,持续 16000 个清醒的小时,每小时 3600 秒。相当于 1015 个字节。这告诉你,一个四岁的孩子所看到的信息量是我们最大的 LLM 的 50 倍。而一个四岁的孩子要比我们拥有的最大的 LLM 聪明得多。积累的知识量表面上看比较少,因为它的形式不同,但实际上,这个孩子拥有关于世界如何运作的大量知识。我们只是缺少一些必要的科学和新的架构,来利用未来人工智能系统能够利用的感官输入,这需要一些科学和技术上的突破,而这些突破可能会在明年或三五年内实现。
了解世界
LeCun 认为,一旦人工智能建立了可行的世界模型,就会出现真正的突破,也许就是预言已久的奇点(他没有使用这个词)。
一旦我们能够扩大这种模型的规模,我们就会拥有能够理解世界、理解物理世界的系统--它们可以进行规划。它们能推理,能理解因果关系,因为它们会明白一个行动会产生什么影响。它们将以目标为导向,因为我们可以给它们设定目标。这就是人工智能系统的未来架构。在我看来,一旦你知道了如何让这一切运转起来,没有人会在正常情况下使用自回归[人工智能模型]。
Koller补充道:
在这一点上,我们还没有能力为这个世界创建一个内部模型,因为这个世界真的很复杂。我们(人类)有能力对世界进行实验,看看会发生什么,并从中学习,这对人类智能来说绝对至关重要。因此,如果我们想让这些机器成长,我们就需要赋予它们相互对话的能力--不仅仅是硅模型。不只是在它们自己的小宇宙中,而是真正地与世界进行实验,并生成有助于它们继续成长和发展的数据。
她这么说是什么意思?她解释到:
我们向前迈进的最大区别在于让计算机有机会设计实验--无论是简单的实验,如 "我把这支笔掉在地上会发生什么?"还是更复杂的实验,如 "我把这五种化学物质一起放入细胞中会发生什么?细胞会发生什么变化?人类又会怎样?"这些实验将让计算机了解世界的惊人复杂性,并让它真正超越人类目前所能做到的。
所以:超智能人工智能可以互相交谈、互相传授知识,并进行化学实验。在这一点上,即使是最狂热的科技布道者--从施洗约翰到大科技耶稣--也会有意识地抑制他们看过的每一部世界末日电影的记忆,并努力想着快乐的事情。(承认吧:有那么一瞬间,你的脑海中闪现出一支咧嘴大笑的钢铁大军在废墟遍布的地狱景象中前进的画面)。
那么,队友们,这一切都是为了什么?
有那么一瞬间,只有一位小组成员--Insitro公司的达芙妮-科勒(Daphne Koller)--似乎还记得达沃斯之外还有一个世界,一个远远超出行业人工智能研究实验室的世界。一个脆弱的人类世界,在 "大创意 "和 "大资金 "的雪峰之下,蜷缩在一起寻求温暖。
她[Koller]说:
我并不相信,我们目前设计人工智能系统的方式是在向我们传授有关人类智能的知识,它是在向我们传授一种智能。我们当然在学习如何构建一种智能,但我不确定建立一个 LLM 是否教会了我们关于人类如何推理的知识,这是一个值得追求的目标,但我不确定我们现在所走的路是否一定能让我们达到理解人类认知的具体目标。
然后,她终于大声说出了安静的那部分--在我们苦恼和纠结的历史上,在这个关键时刻,大多数理智的人类都在想这件事。Koller补充道:
在人工智能的世界里,人们还可以做出其他多种努力。其中之一就是解决真正艰巨、重要、令人向往的问题,而这些问题或许是人类无法单独解决的。我们无法通过复制人类的推理方式来实现这一目标。例如,生物学和健康领域的问题。实际上,人类并不擅长解决这些问题,因为他们并不擅长在大量异构、多模态数据中找到微妙的模式,而这些数据并不符合婴儿在与世界互动时学习到的自然模式。因此,你可以想象一个不同的远大目标--并不是贬低所有其他目标--就是制造出能够解决真正棘手的社会问题的计算机,无论是健康、农业还是环境--气候变化等等--这些问题都是人类无法独立解决的。
原作者的看法
想象一下:试图用人工智能解决实际问题!那么,这个概念的出现显得多么怪异和令人沮丧,它似乎是激进和跨时代的,这是主要讨论的余音。
突然间,所有那些在此之前一直在进行 "口水战 "的人都意识到,他们的个人股票--达沃斯最有价值的商品--正在下滑。达芙妮-科勒(Daphne Koller)提醒了他们,人类是存在的,并且正在无限空间的燃烧岩石上呼救,而他们却在高兴地与风险资本家打交道,计算着在滑雪板事故中致残的确切概率。
哦,是的,他们集体同意,盯着自己的鞋子。利用人工智能做一些对社会有用的事情非常非常重要,而不仅仅是把它看作一个抽象的目标--仅仅因为它的存在(JBIT!),就把它当作另一座寒冷的山峰来征服。
就这样,一屋子需要帮助的信徒们再次向他们顶礼膜拜。
达沃斯模型人工智能Koller人类发布于:上海市声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。