科技

ChatGPT为什么没有首先出现在中国未来会有吗

近日市场对于AI的炒作可谓陷入彻底疯狂,典韦看了都害怕。券商更是喊出了:“当前核心奥义是AI仓位,相比α,“AI%”才是胜负手的”的口号。

人工智能

ChatGPT的开发关键有三个方面,其实都不存在明显卡脖子的环节:

算法模型。ChatGPT使用的基本都是开源,而且已经广泛使用了较长时间的模型和算法,例如Transformer,强化学习等;训练数据。个人觉得这一块是目前最大的困难,因为模型的训练需要海量且优质的语料,但中文的语料怎么可能被美国卡脖子?语料的整理需要时间、耐心。举一个工作中的例子,一份几千条数据的标注可能需要一周(单个标注人员可能负责多份数据标注),而由于标注标准的理解不同,中间还需要反复沟通、扯皮,最后可能标注数据还不可用。算法模型决定了效果的下限,而数据质量决定了效果的上限;算力资金。ChatGPT需要大量的GPU用于加速训练,而针对GPU的限制也是最近才有的,前些年我们甚至能看到一些新闻,例如某某明星创业公司宣传自己拥有几千块GPU等。关于资金,一方面是前期GPU的大量采购,另一方面是模型多次训练时的花费,都需要大量的资金支持。 但无论是国内大型的互联网公司还是政府研究部门,这一块只要真的想支持钱总还是够的吧。我们已经不止一次看到相关的新闻,某某落马,贪污赃款动辄上亿,或坐拥成百上千套房产。

个人觉得ChatGPT中国落后的真正原因是:

指挥官不完全相信技术真的能改变世界,并形成一种信仰。这乍一听有点玄乎,但要知道ChatGPT在出现之前没有人能确定这条路是能走通的,而且GPT前几个版本的效果并不惊艳,但耗费了大量的时间、资金。从互联网发展的历史看,国内互联网大多数时候是一个追随者,所以Copy to China的模式更容易得到信任。具体到某个项目上,已经被证明有效的才更能得到信任,给予时间、人员和资金的支持。习惯短平快,缺乏耐心。OpenAI于2015年成立,2017年推出GPT第一个版本,距今也有6年时间了。国内的公司绩效考核期一般是半年一次,个别公司甚至更短,绩效不合格可能就要面临毕业。试想一个项目搞了3年,花了几亿,但仍没有明显可用、变现的能力,会面临什么后果?ChatGPT的故事看似宏大,但具体到细节上可能都是非常乏味无聊的,例如数据的整理和标注,这些没有足够的耐心是不可能做好的。

这两点原因并非泛泛而谈,其对于ChatGPT开发的关键环节都有着深刻的影响,没有对技术的信仰就不可能持续的投入资金和时间,没有足够的耐心就不可能完成海量、高质量数据的标注。

ChatGPT的出现是AI发展的一个重要节点,是一个量变到质变的标志,近期英伟达CEO黄仁勋也在公开活动中表示,ChatGPT是人工智能领域的iPhone时刻。市场的炒作,社会的热点不是完全无厘头的,我们应该从现在就开始重视AI的发展,因为未来AI必定会对我们的生活产生很大影响,下面会针对ChatGPT的原理、对普通人的影响和相关的投资展开讨论。

ChatGPT原理及意义

本文不会深入技术细节,因为理解其原理确实需要深厚的背景知识,会尽量使用通俗的话进行解释。

ChatGPT本质是一个语言模型,这种模型其实很早就在研究,在机器翻译中已经得到了广泛应用。与早期的语言模型相比,ChatGPT模型更大,训练数据更多,通用性更强。以前的语言模型可能只是在个别领域效果尚可,例如中译英,但ChatGPT在翻译、摘要生成、文章生成等多个领域都取得了非常惊艳的效果,可以说是一个全能战士。

语言模型输出的原理其实就是一个字一个字的生成,下一个字是什么需要基于前文的内容根据一定概率选择。所以ChatGPT并非是简单的拷贝粘贴,而是真的逐字生成了结果。

我们可以把模型的训练类比一个人的学习过程,主要有以下三个阶段:

通识学习。看书、看报、看电视节目,能学习的就学习,对应技术叫做无监督训练;专项学习。完成海量知识的学习后,希望能有一些专项能力,例如按照一定的格式写信、通知,按照逻辑写代码等等,对应的技术叫有监督训练;创造性训练。前面两个阶段主要是对已有知识的学习,但无论是个人还是模型,我们都不希望其只能复述别人的话,肯定是希望具有一定的创造力。对应的技术描述是提高模型泛化能力,ChatGPT主要通过强化学习实现。

同样从模拟一个人学习的视角,我们可以看到ChatGPT出现的巨大意义。看古装剧时,我们常常会听到夸一个人学识渊博时说他饱读四书五经,例如对字圣许慎的称赞是“五经无双许叔重”。一个人阅读、掌握资料的广度与深度决定了其知识水平高低,试想如果一个人已经阅读、记忆和理解了世界上所有资料,那他将达到什么高度?ChatGPT正是具备了这种能力,而且可以持续学习。现在我们大多数人的时间被无意义的工作和不用动脑的娱乐占据,完整的阅读完一本有意义的书都要花上数天,甚至几个月的时间,与ChatGPT相比可以说是判若云泥。ChatGPT在多个人类考试科目中取得了非常好的成绩,毫无疑问,其能力已经超越了绝大多数人的知识水平,并且能以高于个人几个数量级的能力学习进化。

《三体》中有一个名词叫做“技术爆炸”,回顾人类的发展史,技术的进步并不是线性的。封建王朝上千年,其实并没有明显的进步,古代的四大发明固然伟大,但与工业后人类在各个领域取得的进步相比也是小巫见大巫。近代技术的飞速进步背后是知识学习、交流和组织效率的提升,尤其是互联网出现后。现在,我们又拥有了ChatGPT这样的超级工具。

中国版ChatGPT会有吗?

先说结论,一定会有,只是时间问题。相比于无中生有,做出已有的东西难度明显小了很多。

上文已经提到,开发ChatGPT的三个关键因素:算法模型、训练数据和算力资金都不存在明显卡脖子的障碍。

作为追随者,国内互联网的能力是的,ChatGPT已证明了大语言模型这条路是可以走通的,剩下的便是踩油门猛追了。

那么哪些公司会首先完成开发呢?就可能性而言,合理的逻辑是大公司>小公司,关联度高的公司>关联度低的公司。这个逻辑看似非常自然,但最近市场炒的很多票明显是反逻辑来的,所以市场先生总有不靠谱的时候。

大潮来临,普通人如何自处?

首先要明确,AI不是敌人,至少目前还不是。不要想着去对抗,非要问出一个问题让AI“难堪”,然后自己得意洋洋。

我们要学会使用AI提高效率,例如查询资料、生成PPT和写代码等等。

以后使用AI的能力可能是判断一个人的水平高低的重要因素。

除此之外,新技术带来的投资机会也是值得关注的,如果AI既能让我们早点下班,又能让我们赚钱岂不美哉?

关于投资

近期市场对于AI的热情极高,相当疯狂,有多天AI相关的股票成交量占据两市近一半,这种炒法,谁看了不迷糊?

稍微冷静想想,太阳底下无新鲜事,AI这种新技术的炒作不是第一次,也不会是最后一次。

Gartner每年会发布新技术成熟度曲线,基本上一项新出现技术都会经历如图所示的过程。可以看到2022年AI仍处于萌芽期,而现在已经进入期望膨胀期,位置大概在图片中的蓝色箭头位置。

Gartner 2022新技术成熟曲线

我们在中购买的股票背后都是一家家上市公司,判断其价值的最核心标准就是创造现金流的能力,但AI对于公司业绩的提升在A股目前热炒的标的中,大多数短期是看不到的,这一点基本没有疑问。

淘金客多了,卖铲子就成了一门好生意,在AI相关的投资板块中,算力绝对是绝佳的投资方向。目前算力芯片领域,英伟达基本上一家独大,国内暂时没有能打的,但股价涨的比英伟达猛多了。

模型方面,百度在AI方面的积累以及与AI的关联度上,明显要比某圆周公司更强,但股价的表现却相形见绌。近日,公司老大的事情也引起了广泛关注,董秘更是在朋友圈怒喷,真是热闹啊。

来源:360董秘朋友圈

去年的小甜甜-新能源,今年一下子变成了牛夫人。假以时日,AI会不会也有如此历程呢?股票的走势全世界都没有人能准确预测,而相比于预测底部,预测顶部更难。因为底部还能有一些明显的信号,例如成交量长期低迷,股价长期横盘。但顶部神仙来了也预测不了,伟大如牛顿炒股也遭受了巨额亏损,曾感叹到:“我能计算出天体运行的轨迹,却难以预料到人们的疯狂”。

当前位置,AI的风险明显要大于收益,但怎么选择还是看个人偏好。假设有20%的概率赚20%,80%的概率亏50%(风险与收益并不一定总是成正比的),一个人仍然愿意承担高风险去赚取低收益,那也没问题。赚钱嘛,不寒碜,各凭本事,不后悔就行。

炒股赚钱的终极秘诀说简单也很简单,就是低买高卖,但做起来很难,现实中我们更喜欢追涨杀跌。AI投资机会是长期的,等周期来到泡沫化谷底,小甜甜熬成了牛夫人,可能更适合投入资金去买一个梦想。