5000天后的世界-读书笔记
K.K.预测未来将会是一切都与AI相连的世界,他将其称为镜像世界(Mirror-world)。K.K.在书中提到,未来5000天,世界上至少有95%的事物还会维持原样,他的焦点一直放在这不到5%的变化上。
未来5000天,互联网、技术领域、社会形态、教育方式、金融领域等方方面面都可能发生变化,同时也意味着超越我们想象的机遇。那么未来5000天会发生什么?世界将如何被AI技术重塑?
认识AI
在未来的50年里,AI能够与自动化和产业革命相提并论,甚至是影响更为深远的趋势。那么什么是AI?什么是ChatGPT?
人工智能的起源
1950年,计算机科学之父图灵,他写的一篇文章《机器它能思考吗》,提出了著名的图灵测试:如果这个机器可以和人对话超过5分钟,并且不被人类发现它是机器,那么它就具备了智能。
1956年,达特茅斯会议上正式提出了AI的概念,AI就是Artificial Intelligence这两个单词的首字母缩写。AI领域的科学家就是研究如何才能让计算机去做只有人才能做的智能工作。
两种AI风格
旧时代AI,在很长时间里也没有特别亮眼的发展。
比如,我们购物的时候AI客服。它会说:“欢迎光临,请问你需要什么样的服务?”
你问它:”我的袜子买的是紫色,为什么发的是蓝色。“它就回答说:“请问您的问题,是属于下面这10个问题吗?”
有的时候,它还会出现一些故障,好不容易得到想要的答案了,结果它卡了,界面显示客服重新连接中,连上之后它又跟你说“欢迎光临”,这就进入死循环了。很多智能音箱,被问的多了以后,它就会被你绕晕。
以前的AI缺乏常识,它不会举一反三地去理解这个世界的基本知识。但以后的AI不会这样,作者说,真正的智能不是用大数据堆积出来的,如果AI要读完10万本书才能明白道理,那这条路就走弯了。AI真正有效的发展方向是用小数据来做大任务。
比如,AI读懂了所有的围棋棋谱,学会了下围棋,可是如果让它去下跳棋,它就不会了。而“小数据大任务”是就是靠有限的数据所反映出来的逻辑和知识。它应该要会举一反三,明白事物背后隐藏的知识是什么。可以说老AI是归纳逻辑,而未来的AI应该是演绎逻辑。
ChatGPT与Open AI
老AI在很长时间里停滞不前,后来出现了一个叫作Open AI(开放式人工智能)的人工智能公司,它就是发明ChatGPT的公司。
2015年7月份,在美国加州门洛帕克有个饭局,参加者都是科技创业者和投资人。酒过三巡,话过五味,大家就谈到了一个担忧,就是瑞典哲学家尼克·博斯特伦在《超级智能》里面的担忧:AI会不会碾压人类?AI要是被坏人掌握了该怎么办呢? 埃隆·马斯克和Y孵化器的总裁阿尔特曼也都在这个饭局上。马斯克大家应该都已经很熟悉了,这个Y孵化器是美国著名创业孵化器,它孵化了硅谷的一系列独角兽公司,比如爱彼迎(Airbnb)。他们俩就觉得还是要发展一个能够对抗这种暗黑风险的AI,所以就起名叫Open AI(开放式人工智能)。
而ChatGPT作为生成式AI的核心就是,要利用历史上文本中的语言规律来生成新的文本。换而言之,想要理解ChatGPT的原理,记住核心的一点就可以了:它是逐字地去预测下一个字该说什么。因为模型会根据上一次生成的文本和上下文的信息去计算出,在当前这个位置上每个可能出现的词语的概率,然后选择概率最大的词作为当前位置的输出。 这个概率是怎么得来的呢?这就需要在以前的预训练中,通过Transformer模型来计算概率。
比如,你对ChatGPT说:到中午十二点了,咱们去楼下餐厅__ __。那ChatGPT会判断出餐厅后面的字,很大概率应该填写“吃”这个字。因为“餐厅”和“吃”强关联。所以,ChatGPT就会生成下一个字“吃”,这句话就变成:到中午十二点了,咱们去楼下餐厅吃__。接下来ChatGPT会继续判断“吃”的后面接什么词语,它的算法计算出概率最大是吃“饭”,吃面或者吃其它的概率小一点,于是它就生成下一个字是“饭“,这句话就变成:到中午十二点了,咱们去楼下餐厅吃饭。
生成式AI和传统AI是不一样的。传统的AI只是个搬运工,它听见你说一个单词,就去数据库里找关联的文字照搬过来,它不能生成新内容。生成式AI会通过你说的话,来推理接下来会是什么,它会举一反三。
那么,以上这三点中涉及的能力都是逐步积累出来的,从GPT-1,到GPT-2,到GPT-3,GPT的模型每升级一代,它的参数就会扩大十倍,甚至百倍,而扩大的参数越多,这个深度学习的神经网络的复杂度就会指数级增加。到了GPT-3.5出来之后,这个模型一下子就发生了重大突破。
这个重大突破,学界称之为涌现,涌现就是说它突然出现了惊人的进步。因为,GPT模型更新不是一个线性发展的过程,这个过程也是不可预测的。
那么这个ChatGPT中的chat又是什么意思呢?chat这个单词含有对话、聊天的意思。增加了交流的属性的GPT就变成了ChatGPT。增加chat的属性不仅是让AI学会与人类对话,还需要把AI的输出训练到符合人类的习惯和价值观,这一步叫强化学习。
ChatGPT你教它东西,它可能会理解内在逻辑。因为后者的能力上限和应用空间比起前者大百倍都不止,所以巨头们,比如谷歌、微软、百度、华为,它们都全部都激动起来了。
这个Open AI的商业模式也是不断发展变化的。虽然它刚起步的时候有十亿美元,但AI研发太烧钱了,它本来是非盈利的组织,后来为了吸引投资,就成立了商业化的公司。它的入股模式也很创新,当投资人的盈利率达到一个数字,比如说赚了10倍以后,股权就要下降到以前的一半,赚到15倍的时候就要退出。退出以后,这部分股权要交给一个非盈利的基金。
凯文·凯利指出,计算机正在构建一个镜像世界。他说:科学家你们吵啥呢?人类的智能也不具有通用性,人的智能也不过是完成求生存、求繁殖的那点东西而已,也是局限的智能。人的身体也不是通用的,只是在地球的这个气候条件下,进化出来的特定功能。他说:“如果我们可以研究全宇宙的智能物种,我们肯定会发现灿若繁星的各种智能。”
算法、算力和数据
AI需要什么呢?——算法、算力和数据。
算法就是GPT。GPT系列的算法变得越来越庞大,GPT-1有1.2亿参数,GPT-2有15亿参数,GPT-3有1750亿参数,训练数据达到了45TB,相当于470万套四大名著的文字量。也就是说每过一代,它的参数都扩大了十倍,甚至百倍。最新发表的GPT-4,有1.6万亿个参数。
那么算力就是AI计算的能力。现在一个GPT训练一次需要2000张A100的GPU卡。通常,算上一周就可以迭代一次,那么这一次迭代就要8000万人民币。有新闻报道说,中国要有10000枚A100芯片可能才能够做好一个大模型,可是能拥有10000枚A100芯片的企业可能只有一家。
第三就是数据。大数据是我国高度重视的方面,在去年年底,财政部专门发表了新的会计准则办法,允许数据资产进入企业的资产负债表,可以作为无形资产。
AI对人类工作与生活的影响
接下来,我们要思考的是 AI对我们的生活会产生哪些重大的影响呢?
工作方式的改变
首先,是生产力革命,譬如教育、传媒、科技等,一切内容生产行业都在被颠覆。而厨子、快递员、育儿嫂的需求现在还无法被撼动,除非相对应的机器人被发明了出来。
那ChatGPT具体可以干什么呢?
第一,可以成为你的创意助手。比如,你对它说:“帮我写一篇文章,要包含运动、节食、欲望这三个词,它就会根据这三个词生成一篇文章。
第二,让它帮你完成简单的工作任务。比如,让它帮你写代码、写程序。
总的来说,它最大的影响就是帮助人类重新定义工作,我们将要把追求效率、追求生产力的事交给机器,把枯燥的事留给AI,把需要创造力的事留给自己。
新职业的出现
随着AI的发展,国内也出现了一批新的职业。比如数据标注师。数据标注就是给训练AI的内容打标签,在数据中标注这个是汽车,这个是美食,便于AI辨认。
AI训练师正式成为了新职业,纳入国家职业分类目录,其中数据标注员是主要工种之一。《中国数字经济发展白皮书》显示,当前数据标注行业需求极大,入场门槛低,带动了大量农村小城镇的就业机会。
目前,数据标注岗位主要集中在人力成本低的地区,比如山西、河南、河北、内蒙等地都形成了若干的数据标注村,有效解决了剩余劳动力的就业问题。
如果AI能进化得这么强大,那么肯定会大事不妙,AI会不会把我们都取代了呢?Open AI曾明确地说:“GPT和后续的AI模型,会用有益的和有害的方式对社会产生重大影响。”
那么有害的方式会是什么呢?AI到底是帮助我们工作,还是取代我们的工作?根据统计发现,在美国80%的职业会被影响,20%的工作会减少一半的工作量,尤其是像翻译、写作、传媒、金融、税务这些工作。而不会被取代的是运动员、厨师、木匠这些职业。
那么AI何时会产生自主意识吗?是否会出现超越人类,取代人类的非人类思维?人类是否会失去对文明的控制?AI武器化人类该怎么办?
通用AI可以做人类能做的一切事情,包括产生自己的目标。这是AI 更加高阶的阶段,它已经具有了自我意识。但是,如果它的目标与意识和人类的利益是冲突的,我们该怎么办?我们是否应该阻止这种高阶AI的发展?
在2023年3月底,一些科学家发布了联名公开信,呼吁由于最近的AI实验陷入了失控的竞赛,只有当我们确立AI大模型的风险可控时,才可以再去开发新的AI模型。这封公开信吸引了包括图灵奖获得者约书亚、特斯拉创始人马斯克、苹果联合创始人沃兹尼亚克,以及《人类简史》的作者尤瓦尔·赫拉利,等等上千名科技大佬和学者的联合签名。
各国政府也迅速出台了对AI的监管。当AI开始建立自己的目标时,它可能就会意识到获得更多的控制权,但是,这种假设它需要超级算力和算法的支持,而人类目前还提供不了。恰恰是人类在AI研发上的“无能”,成为了保护人类安全的最后屏障。