An image to describe post

福布斯发布了他们2024年的十个AI预测,看了一下还挺靠谱的也不长,就翻译了一下,先看一下具体的十条预测:

  • Nvidia将大幅加大努力成为云服务提供商
  • Stability AI将会倒闭
  • “大型语言模型”和“LLM”这些术语将变得不那么常见
  • 最先进的封闭模型将继续以显著优势胜过最先进的开放模型
  • 一些《财富》500强公司将设立新的C级职位:首席人工智能官
  • 另一种替代transformer架构将得到有意义的采用
  • 云服务提供商对人工智能初创公司的战略投资,以及相关的会计影响,将受到监管机构的挑战
  • 微软/Open AI的关系将开始破裂
  • 2023年从加密货币转移到人工智能的一些炒作和群体心态行为将在2024年转回加密货币
  • 至少有一家美国法院将裁定在互联网上训练的生成式人工智能模型构成侵犯版权。这一问题将开始上升至美国最高法院

1. Nvidia将大幅加大努力成为云服务提供商

大多数组织并不直接向英伟达购买GPU。相反,它们通过云服务提供商如亚马逊网络服务、微软Azure和谷歌云平台来获取GPU,而这些云服务提供商则从英伟达大量购买芯片。

但亚马逊、微软和谷歌——Nvidia最大的客户——正在迅速成为其竞争对手。认识到如今人工智能领域的价值主要集中在硅层(要证明这一点,只需看看Nvidia的股价),主要的云服务提供商都在大力投资开发自己的人工智能芯片,这将直接与Nvidia的GPU竞争。

Nvidia已经开始探索这条道路,今年早些时候推出了一个名为DGX Cloud的新云服务。我们预测Nvidia明年将大幅推进这一战略。

这可能意味着英伟达建立自己的数据中心(DGX Cloud目前设在其他云服务提供商的物理基础设施内);甚至可能意味着英伟达收购像CoreWeave这样的新兴云服务提供商,与其已有密切合作,以实现垂直整合。不管怎样,随着我们进入2024年,预计英伟达与大型云服务提供商之间的关系将变得更加复杂。

2.Stability AI将会倒闭

这是人工智能世界最糟糕的秘密之一:曾经风光无限的初创公司Stability AI在2023年大部分时间都是一场慢动作的火车失事。

Stability AI正在流失人才。最近几个月的离职包括公司的首席运营官、首席人力资源官、工程副总裁、产品副总裁、应用机器学习副总裁、传播副总裁、研究负责人、音频负责人和总法律顾问。

据报道,去年领导Stability AI公司备受关注的1亿美元融资轮的两家公司Coatue和Lightspeed最近几个月已经退出了公司董事会,因为与稳定公司CEO Emad Mostaque的纠纷。该公司今年早些时候试图但未能以40亿美元的估值筹集额外资金。

明年,我们预测这家备受困扰的公司将在不断增加的压力下彻底倒闭。

据报道,受投资者压力影响,Stability AI公司已开始寻找收购者,但目前尚未引起太大兴趣。

Stability AI有一个有利的因素:该公司最近从英特尔筹集了5000万美元,这笔资金注入将延长其现金流。对英特尔来说,这项投资似乎反映了迫切的愿望,即获得一位知名客户承诺购买其新的人工智能芯片,以期在竞争对手英伟达面前取得优势。

但是Stability AI的烧钱速度极高:据报道,英特尔在十月份投资时,稳定性每月支出800万美元,而收入只是这个数额的一小部分。以这个速度,5,000万美元的投资将无法支撑到2024年底。

3.“大型语言模型”和“LLM”这些术语将变得不那么常见

在当今人工智能领域,“大型语言模型”(及其缩写LLM)经常被用作“任何先进人工智能模型”的简称。这是可以理解的,因为许多最初崭露头角的生成式人工智能模型(例如GPT-3)都是纯文本模型。

但随着AI模型类型的增多,以及AI变得越来越多模态,这个术语将变得越来越不精确和无益。多模态AI的出现是2023年AI的定义性主题之一。如今许多领先的生成式AI模型融合了文本、图像、3D、音频、视频、音乐、物理动作等多种元素。它们远不止是语言模型。

考虑一个AI模型,它是通过已知蛋白质的氨基酸序列和分子结构进行训练,以生成全新的蛋白质治疗药物。尽管其基本架构是GPT-3等模型的延伸,但真的有必要称其为大型语言模型吗?

或者考虑在机器人技术中的基础模型:大型生成模型将视觉和语言输入与一般的互联网规模知识结合起来,以便在现实世界中采取行动,例如通过机械臂。对于这样的模型,应该并且将会存在一个比“语言模型”更丰富的术语。(“视觉-语言-行动”或VLA模型是研究人员使用的一个替代短语。)

关于DeepMind最近发布的FunSearch模型,可以提出类似的观点,作者自己称之为LLM,但它处理的是数学而不是自然语言。

到2024年,随着我们的模型变得越来越多维,我们用来描述它们的术语也会变得越来越多样化。

4. 最先进的封闭模型将继续以显著优势胜过最先进的开放模型

当今人工智能讨论中的一个重要话题是围绕开源和闭源人工智能模型的辩论。虽然大多数尖端人工智能模型开发者——如OpenAI、Google DeepMind、Anthropic、Cohere等——保留其最先进的模型的专有权,但包括Meta和备受关注的新创企业Mistral在内的少数公司选择公开其最先进的模型权重。

如今,性能最优秀的基础模型(例如OpenAI的GPT-4)是闭源的。但许多开源倡导者认为,闭源和开源模型之间的性能差距正在缩小,开源模型有望在性能上超越闭源模型,也许在明年之前。(最近这张图表广为流传。)

我们不同意。我们预测,最好的封闭模型将在2024年(以及以后)继续显著优于最好的开放模型。

基于基础模型性能的最新技术是一个快速发展的前沿。Mistral最近宣称将在2024年某个时候开源一个GPT-4级别的模型,这一说法在开源社区引起了激动。但OpenAI在2023年初就发布了GPT-4。等Mistral推出这个新模型时,很可能已经落后了一年以上。届时,OpenAI很可能已经发布了GPT-4.5甚至GPT-5,开创了全新的性能前沿。(有传言称GPT-4.5甚至可能在2023年年底之前发布。)

在许多其他领域一样,跟随者在另一组人定义了前沿之后追赶前沿要比在任何人展示可能之前建立新的前沿更容易实现。例如,OpenAI在此前未有人展示这种规模下的专家混合架构可行之前构建GPT-4是相当冒险、具有挑战性和昂贵的,而Mistral在几个月后跟随OpenAI的步伐使用自己的专家混合模型要容易得多。

有一个基本的结构性原因让人怀疑开放模型在2024年会超越封闭模型的性能。开发一个推动技术前沿的新模型所需的投资是巨大的,并且随着模型能力的每一次跨越式增长,这种投资只会不断膨胀。一些行业观察者估计OpenAI将花费大约20亿美元来开发GPT-5。

Meta是一家上市公司,最终要对股东负责。该公司似乎并不指望从其开源模型发布中获得直接收入。据报道,Llama 2的建造成本约为2000万美元;即使没有任何相关的收入增长,这种投资水平也可能是合理的,考虑到战略利益。但Meta真的会投入近20亿美元来建立一个超越现有任何其他模型的人工智能模型,然后开源它,而不指望有任何具体的投资回报吗?

像Mistral这样的新兴公司面临着类似的困境。开源基金会模式没有明确的收入模式(正如Stability AI已经吃过苦头)。例如,为托管开源模型收费最终会变成价格战,就像我们最近在Mistral的新Mixtral模型中看到的那样。因此,即使Mistral有数十亿美元来构建一个超越OpenAI的新模型,它真的会选择把该模型免费提供吗?

我们隐约感觉到,随着像Mistral这样的公司投入越来越多的资金来构建更强大的人工智能模型,他们可能会放松对开源的立场,将他们最先进的模型保留为专有,以便收费。

要明确一点:这并不是反对开源人工智能的优点的论点。这也不是说开源人工智能在未来的人工智能世界中不重要。相反,我们预计开源模型将在未来几年中在人工智能的普及中发挥关键作用。然而:我们预测,最先进的人工智能系统,那些推动人工智能可能性边界的系统,将继续是专有的。

5.一些《财富》500强公司将设立新的C级职位:首席人工智能官

人工智能已经成为今年财富500强公司的首要任务,各行各业的董事会和管理团队都在争先恐后地努力弄清楚这种强大的新技术对他们的业务意味着什么。

我们预计明年在大型企业中会更普遍采用的一种策略是任命“首席人工智能官”来领导组织的人工智能倡议。

我们在十年前云计算兴起时看到了类似的趋势,许多组织都聘请了“首席云官”来帮助他们应对云计算的战略影响。

这一趋势在企业界将会进一步加强,因为政府已经在进行类似的趋势。拜登总统最近关于人工智能的行政命令要求每个联邦政府机构任命一名首席人工智能官,这意味着未来几个月内将在美国政府中聘请超过400名新的首席人工智能官。

公司任命首席人工智能官将成为一种流行的方式,向外界表明他们对人工智能非常重视。这些角色是否会长期发挥价值是另一个问题。(今天还有多少首席云官员?)

6.另一种替代transformer架构将得到有意义的采用。

引入自2017年谷歌的一篇重要论文中,transformer架构是当今人工智能技术中的主导范式。目前存在的每个主要生成式人工智能模型和产品,如ChatGPT、Midjourney、GitHub Copilot等,都是使用transformer构建的。

但是没有技术能永远保持主导地位。

在人工智能研究界的边缘,一些团队一直在努力开发新颖的、下一代的人工智能架构,这些架构在不同方面优于transformer。

这些努力的一个关键中心是克里斯·雷在斯坦福大学的实验室。雷和他的学生们工作的中心主题是构建一个新的模型架构,其随序列长度的增长呈次平方级别(而不是像变压器那样呈平方级别)。次平方级别的扩展将使人工智能模型更少地消耗计算资源,并且相对于transformer更能够处理长序列。雷实验室近年来的显著次平方级别模型架构包括S4、Monarch Mixer和Hyena。

最近最新的次二次方架构——也许是最有前途的——是曼巴。由两位Ré的门徒于上个月刚刚发布,曼巴在人工智能研究界引起了巨大轰动,一些评论者称其为“transformer的终结”。

除了transformer架构之外,其他构建替代方案的努力还包括麻省理工学院开发的液态神经网络和由变压器共同发明者之一领导的新创企业Sakana AI。

明年,我们预测这些挑战者架构中的一个或多个将突破并赢得真正的采用,从仅仅是研究新颖性转变为可信的替代人工智能方法,用于生产。

要明确的是,我们并不指望在2024年之前就淘汰transformer。它们是一种根深蒂固的技术,是世界上最重要的人工智能系统的基础。但我们预测,2024年将是创新型transformer替代方案成为真实世界人工智能应用的可行选择的一年。

7.云服务提供商对人工智能初创公司的战略投资,以及相关的会计影响,将受到监管机构的挑战

今年,大型科技公司向人工智能初创公司注入了一股投资资金浪潮。

微软在1月份向OpenAI投资了100亿美元,然后在6月份领导了对Inflection的13亿美元融资。今年秋天,亚马逊宣布将向Anthropic投资高达40亿美元。为了不甘示弱,Alphabet在几周后宣布将向Anthropic投资高达20亿美元。与此同时,英伟达可能是今年全球最多产的人工智能投资者,向数十家使用其GPU的人工智能初创公司投入资金,包括Cohere、Inflection、Hugging Face、Mistral、CoreWeave、Inceptive、AI21 Labs和Imbue。

很容易看出,进行这些投资的动机至少部分是为了将这些高增长的人工智能初创公司作为长期的计算客户。

这样的投资可能涉及会计规则中的一个重要灰色地带。这听起来可能像一个神秘的话题,但对未来人工智能竞争格局将产生巨大影响。

云服务供应商投资1亿美元给一家人工智能初创公司,条件是该初创公司将把这1亿美元用于购买云服务。从概念上讲,这并不是云服务供应商真正独立的收入;实际上,供应商是在利用这笔投资将自己的资产转化为收入。

这类交易——通常被称为“往返交易”(因为资金出去又立刻回来)——今年引起了硅谷领袖们的关注,比如风险投资家比尔·格利。

细节决定成败。上述交易并非都必然代表真正的往返交易。例如,投资是否伴随着明确的义务,要求初创企业将资本用于投资者的产品,或者只是鼓励两家组织之间的广泛战略合作,这很重要。微软和OpenAI之间的合同,以及亚马逊和Anthropic之间的合同并不公开,因此我们无法确定它们的结构。

但至少在某些情况下,云服务提供商可能会通过这些投资认定收入,这是不应该的。

这些交易到目前为止几乎没有受到监管审查。这将在2024年发生改变。预计证券交易委员会将在明年对人工智能投资中的往返交易进行更严格的审查,并预计这类交易的数量和规模将因此急剧下降。

鉴于云服务提供商迄今为止一直是推动生成式人工智能繁荣的最大资金来源之一,这可能会对2024年整体人工智能筹资环境产生重大影响。

8.微软/OpenAI的关系将开始破裂

微软和OpenAI关系密切。到目前为止,微软已向OpenAI投入超过100亿美元。OpenAI的模型支持微软的关键产品,如必应、GitHub Copilot和Office 365 Copilot。当OpenAI的CEO Sam Altman上个月被董事会意外解雇时,微软的CEO Satya Nadella发挥了重要作用,帮助他恢复职位。

微软和OpenAI是两个不同的组织,有着不同的抱负和对未来人工智能的不同长期愿景。这种联盟目前对双方都很有利,但这只是一种权宜之计。这两个组织远非完全一致。

明年,我们预测这两个巨头之间的合作关系将开始出现裂痕。事实上,未来摩擦的迹象已经开始浮出水面。

随着OpenAI积极扩大企业业务,它将越来越频繁地与微软直接竞争客户。就微软而言,它有充分的理由超越OpenAI,成为尖端人工智能模型的供应商。例如,微软最近宣布与OpenAI竞争对手Cohere合作。面对运行OpenAI大规模模型的巨额成本,微软还投资于Phi-2等较小语言模型的内部人工智能研究工作。

随着人工智能变得越来越强大,关于人工智能安全、风险、监管和公共问责的重要问题将成为焦点。利害关系将很高。考虑到它们不同的文化、价值观和历史,似乎不可避免地两个组织在这些问题的哲学和方法上会有分歧。

微软市值2.7万亿美元,是世界第二大公司。然而,OpenAI及其富有魅力的领导人山姆·奥尔特曼的雄心可能更为远大。这两个组织目前互相合作良好。但不要指望这种情况会永远持续。

9.2023年从加密货币转移到人工智能的一些炒作和群体心态行为将在2024年转回加密货币

很难想象风险投资家和科技领袖现在会对除人工智能之外的任何事情感到兴奋。但一年的时间很长,风险投资家的“信念”可以迅速转变。

加密货币是一个周期性行业。现在不太流行,但不要误解,另一轮大牛市将到来——就像2021年那样,以及之前的2017年和2013年。如果你还没有注意到,比特币的价格在过去几个月里急剧上涨,从9月的25000美元上涨到今天的40000美元以上,而年初还不到17000美元。比特币可能正在酝酿一次重大的上涨,如果是这样的话,将会有大量的加密货币活动和炒作。

一些知名的风险投资家、企业家和技术专家,他们如今将自己定位为全力投入人工智能,而在2021-2022年的牛市期间,他们对加密货币深感兴趣。如果加密资产价格明年大幅反弹,预计其中一些人会跟随热潮,就像他们今年跟随人工智能热潮一样。

坦率地说,明年将AI过度炒作的注意力转移到其他地方将是一个受欢迎的发展。

10.至少有一家美国法院将裁定在互联网上训练的生成式人工智能模型构成侵犯版权。这一问题将开始上升至美国最高法院

当今生成人工智能领域存在一个重大而被低估的法律风险:世界领先的生成人工智能模型已经在大量受版权保护的内容上进行了训练,这一事实可能引发巨大的责任,并改变该行业的经济格局。

无论是来自GPT-4或Claude 2的诗歌,来自DALL-E 3或Midjourney的图像,还是来自Pika或Runway的视频,生成式AI模型能够产生令人惊叹的复杂输出,因为它们已经在世界大部分数字数据上进行了训练。在大多数情况下,AI公司免费从互联网上获取这些数据,并随意使用它们来开发他们的模型。

但是,实际上创造了所有这些知识产权的数百万个个体——写书的人、写诗的人、拍照的人、画画的人、拍视频的人——他们是否有权决定人工智能从中受益的方式?他们是否有权分享由人工智能模型创造的价值?

这些问题的答案将取决于法院对一个关键法律概念“合理使用”的解释。合理使用是一个发展成熟的法律原则,已存在数个世纪。但它在生成式人工智能这一新兴领域的应用,带来了复杂的理论问题,没有明确的答案。

在机器学习领域的人并不一定了解公平使用的微妙之处,同时,法院已裁定某些备受关注的现实案例并不受到公平使用的保护,然而这些案例看起来却像是人工智能所产生的内容,”斯坦福研究员彼得·亨德森说。“在这个领域,人们对诉讼结果存在不确定性。”

这些问题将如何得到解决?通过个案和法院裁决。

将公平使用原则应用于生成式人工智能将是一个复杂的任务,需要创造性思维和主观判断。在这个问题上,双方都会存在可信的论点和可辩护的结论。

因此,明年至少有一家美国法院裁定,生成式人工智能模型如GPT-4和Midjourney构成侵犯版权,并且建造这些模型的公司对模型训练所依赖的知识产权所有者负有责任,这并不奇怪。

这并不能解决问题。在其他司法管辖区,面对不同的事实情况,其他美国法院很可能会得出相反的结论:生成式人工智能模型受公平使用原则保护。

这个问题将逐渐上升到美国最高法院,最终得到一个决定性的法律解决方案。(通往国家最高法院的道路漫长而曲折;不要指望明年就能得到最高法院对这个问题的裁决。)

与此同时,将会出现大量诉讼,将会进行大量和解谈判,全球律师将忙于应对一系列案例法律。数以十亿计的美元将悬而未决。

来源:https://www.forbes.com/sites/robtoews/2023/12/21/10-ai-predictions-for-2024/?sh=286c8ab74898