吴晓波跨年演讲:大模型的12个月
2023年人工智能快速发展,在12月30日举办的预见2024吴晓波工厂年终秀上,吴晓波在演讲中场,用30分钟分享了一个主题:在过去的12个月里,生成式人工智能到底发生了什么,跟我们每个普通人有什么关系。
整个事情的起点是2022年11月。
当时有一家硅谷的企业OpenAI,创始人叫作山姆·奥特曼,1985年出生的。11月30日,OpenAI上线了一款实验性产品——ChatGPT3.5。当时包括我在内,可能现场99.9%的人都不知道有一家叫作OpenAI的公司做了一款叫作ChatGPT3.5的产品。
但仅仅两个月后,2023年1月,ChatGPT的全球月活用户超过了1亿。在此之前,这一纪录的保持者是TikTok,用了9个月的时间。同月,OpenAI推出了ChatGPT Plus,开启了商业化运营。
那个月还发生了一件事。有人测试ChatGPT,在美国执业医师资格考试中获得了合格成绩。要知道在美国,最难考出执照的两个职业,分别是医生和律师。
ChatGPT横空出世,比尔·盖茨对此表示:“ChatGPT诞生的重要意义,不亚于PC或互联网的诞生。”英伟达CEO黄仁勋则把ChatGPT比作十多年前乔布斯推出的iPhone。“ChatGPT是人工智能的‘iPhone时刻’。”
2月,OpenAI推出了ChatGPT的API。API指的是一个编程接口,你只要接上API接口,就能够做自己的原生应用,甚至可以搭建一个自己的大模型。
由于API的开放,中国开启了“大模型之战”。也正是在这个月,复旦大学发布中国第一个类ChatGPT模型,百度、阿里云、网易等企业相继宣布要研发类ChatGPT产品。面对AIGC的火热态势,苹果CEO库克评论道:“AIGC是不可思议的,它几乎可以影响我们所做的一切,包括我们拥有的每款产品和每项服务。”
ChatGPT上线的第四个月,中国的百度在3月16日发布了自己的大模型——文心一言。截至吴晓波年终秀演讲时,文心一言一年的调用量已是全中国其他200多个大模型调用量的总和。所以在科技领域里,先行一天,早走一步,有多么地重要。
3月27日,百度智能云发布面向企业用户的千帆大模型平台。吴晓波甚至做了尝试:今年是他的第九场年终秀,他在千帆平台里面把之前八场年终秀的内容全部输进去,就会生成一个叫“吴晓波年终秀”的应用。然后就可以调取过去八年所有年终秀内容中的某一个数据,比如“2015年,我对中国制造业的整体描述是什么样的”,应用就会检索并作答。
之前,公司需要专门的技术开发人员;今天,在这个平台上只需要花10分钟,就能实现无代码开发。
就在文心一言发布的前一天,OpenAI发布了千亿级参数的多模态版本——GPT4。不过更让人震惊的是美国AI绘图工具Midjourney发布了第五版。
有一张由Midjourney生成的照片让我们很多人第一次见识到什么是生成式人工智能。
换言之,你不需要拥有绘图技能,只需有提问的能力,你只要在对话框里输入:两个年轻人,坐在天台上,1980年代的城区背景,旁边几张废纸,一瓶可乐等文本,Midjourney就会生成出这张照片:
吴晓波和他的一位摄影师朋友说:“你帮我对对,你拍的照片和它有什么区别?”当时,唯一的BUG是手指稍长了一点。
我们终于见识到了一种新的技术,挑战或者说超出我们的能力。
然而,OpenAI的天使投资人埃隆·马斯克却联合1100多名专家发表公开信,要求所有人工智能实验室立即暂停6个月。这封公开信发表的时候,距离OpenAI发布ChatGPT3.5仅仅过了4个多月。
OpenAI是一种工具。法国解构主义哲学家斯蒂格勒,在其著作《技术与时间》中提出一个概念,叫作“技术伦理”。他认为,从钻木取火开始,人类发展的过程,是一个被工具不断迭代的过程。任何一种工具,特别是革命性技术所推动的工具变革,它除了会产生生产力的大爆发以外,也会产生新的文化和新的意识形态。
你还记得原子弹所引发的文化和意识形态的讨论吗?你还记得克隆人所引发的伦理讨论吗?无非这一次人工智能所带来的变化和克隆人、原子弹相比,它离我们每个人更近,离应用、职业、公司运营、组织变革更加贴近。所以刚刚过去的12个月,是一个正在被革命性技术改变的12个月。这一切才刚刚开始。
今年4月,人工智能科学家陆奇做了一场长演讲,吴晓波对生成式人工智能的扫盲正是从这场演讲开始的。陆奇曾经担任微软执行副总裁,微软的搜索引擎必应,他是最早的负责人。在演讲中,陆奇说:“OpenAI未来肯定比Google大,只不过大1倍、5倍还是10倍。”
也正是ChatGPT所带来的颠覆性变革,愚人节那一天,意大利政府下令封锁ChatGPT;三星电子的员工通过ChatGPT,把公司信息上传,造成了公司机密的泄露——它反映了ChatGPT的背阴面。于是,350名全球人工智能专家签署公开信,警告道:“AI可能给人类带来灭绝性的风险。”
革命性的事物总是在争议中不断前行。到了5月,华为云盘古气象大模型,提前10天预测了台风“玛娃”的未来路径;阿里云正式发布大语言模型“通义千问”,谷歌发布大语言模型PaLM2。
这个月吴晓波还调研了两家企业。其中有一家企业在杭州,很多年来一直做服装设计师的开放平台,那个月它上线了一个AIGC产品,你只要输入你的需求,它就能够迅速设计出无数服装款式,并告诉你今年服装的流行款式是什么。
另外他还去上海参加了一家跨境电商公司的活动。很多中国公司到海外去投广告,原来有一个非常重要的岗位叫“投手”,他会根据数据进行不断的调控。“投手”的能力决定了广告投发的效率和效果。
而这家上海公司开发了一个人工智能产品,它通过数据模型和深度学习,可以比人投得更准确,投放的效率也更高。这是我第一次在公司层面看到人工智能的应用。
6月,ChatGPT的应用程序分别上线了微软的必应和苹果iPad;日本地方政府率先尝试ChatGPT办公;中国科学院自动化研究所发布紫东太初2.0。
我们也看到,两位美国作家起诉OpenAI,这是全球第一起ChatGPT版权侵权诉讼案。知识产权和人工智能的进步出现了一个大的错位。
这个月,吴晓波频道还发布了第一个用Midjourney生成的图文作品,叫作《我非常非常非常渴望活下去》,是黄仁勋的人物小传。以往吴晓波频道如果要做这么一篇推文,大概要请一个绘图师,绘图师需要一周的时间画10至12张图,大概需要支付6000到1万元的费用,才能够做出这么一篇10万+的文章。而当使用AI工具的时候,一个文字编辑只需花三个小时。
同样是这个月,凯文·凯利出了一本新书叫作《5000天后的世界》,一本特别薄的对话体的书,但书中有一句话给人留下了特别深刻的印象。凯文·凯利说:“面对AI,人类更需要提问的能力和想象力。”
00后的孩子们、10后的孩子们,20后的孩子们,面向未来,需要的能力是什么?考试的能力或许不再重要,未来最需要的是会提问,同时要对这个世界要充满好奇心和保持想象力。
接着来到了7月,Facebook的母公司META发布700亿参数规模的开源大模型基座Llama2;Android版的ChatGPT在美国、印度、巴西等国家推出;京东推出了它的“言犀大模型”。
7月,在全球文献上有两个产品。第一个和“作弊”有关。斯坦福大学的创业者发明了一副眼镜,然后他去参加考试,可以把圆周率背到1982位;只要花15秒,就可以滔滔不绝地说出康德和黑格尔在辩证法上的相同点和差异点。这副眼镜现在卖1万多美元。
还有一家芬兰公司开发了一个“船员机器人”。这家公司找了200个船员,捕捉他们的脸部表情和瞳孔——船员在出海的时候,发生海浪,第一个应急反应就是脸部发生变化。公司把这200个船员的脸部表情和瞳孔整合成一个大数据模型并进行深度训练,然后喂给一个机器人。当这个机器人出海的时候,它对船舶的控制能力比一个有20年经验的资深船员还要优秀。
8月,OpenAI推出了ChatGPT Enterprise,即企业版;百度“文心一言”向公众开放服务;腾讯“混元大模型”进入应用内测;智谱华章上线首款生成式AI助手“智谱清言”。越来越多的企业卷入到这个行业。一组数据显示:超过80%的财富世界500强公司团队已经采用ChatGPT产品。
9月,阿里云的“通义千问”大模型正式向公众开放;OpenAI发布多模态功能。到这个月的时候,除了文生文以外,增加了图片对话、语音对话和语音模拟合成。
也是在9月份,百度云智大会召开,会上宣布使用千帆大模型平台的企业用户月活达到2万。一个企业级的产品,月活能够超过2万,是一个了不起的纪录,尤其是这个平台只上线了5个月。
而此时,中国的大模型超过了100个。
李彦宏讲过一句话,他说:“我们需要100万量级的AI原生应用,但是不需要100个大模型。”
中国人最大的能力就是搞基建,我们把“造房子”的思维应用到了大模型上,我们不需要大量的重复建设,我们需要的是大模型上的原生应用。
千帆提供了两个案例。有一家企业叫作中天钢铁,它基于百度智能云千帆大模型平台Agent能力,做了一个工业调度中枢。什么意思呢?很多设备都装了传感器,装了图像抓取系统。原来这些传感器和抓取系统的设备维护靠工程师,现在所有的数据通过AI就可以检测到,这套设备可能有问题,需要进行维修。
每天工厂生产结束后,需要采集大量的数据,然后通过技术员的人工分析,最后形成一份生产报告。而今天利用千帆,报告会自动生成。而且数据喂得越多,它所生成的报告的准确度就越高。
还有一家企业叫作考试宝,它的主营业务和执业考试相关,比如律师考试、税务师考试。考试宝也利用千帆干了一件事:出题目、分析答题、打分等等。这些工作原来需要人来做,有了大模型以后,就可以做到千人千面。
一家钢铁厂、一家互联网的教育企业,通过大模型,完成了自己技术能力的迭代。
10月,OpenAI推出新功能,为用户提供识图、上网、画图、数据分析等功能的一条龙服务。从2022年的11月开始,潘多拉的盒子被打开以后,这个叫作生成式人工智能的“魔鬼”一直在快速地迭代。
META推出生成式人工智能广告服务,AI文案、AI制图,自动投放。意味着什么?当平台推出这个的时候,意味着上海这家公司的技术能力需要在它的能力基础上继续迭代,否则就会被“嵌入式”地淘汰。所以在这快速变革的时代,跑得早很重要,迭代的能力同为重要。
而此时,中国的大模型已经有238个了。
11月7日,OpenAI举办首届开发者日,推出GPT Store,并正式公布自定义GPT—GPTs,全球开发者突破200万。然后仅仅11天后,那位80后的天才创业者山姆·奥特曼被董事会罢免。48小时后,他又回到了OpenAI。
这起戏剧性的事件意味着,即使在公司内部,技术伦理前提下的创新路径,仍然存在着重大的讨论,甚至这个讨论并没有随着这场风波结束,它在未来仍然会不断拷问我们的文化、我们的组织、我们的世界观、我们的意识形态。
11月的时候,比尔·盖茨发表了一篇文章,他说:“在五年内,每个人都将拥有自己的AI私人助理,它将彻底改变我们的生活方式。”看到这句话的时候,吴晓波想,可能不需要五年。
11月22日,字节旗下的企业服务软件,也是这几年增长最快的一个办公协同软件——飞书,推出了一个产品,叫作“智能伙伴”。
“智能伙伴”的应用场景是什么呢?比如吴晓波公司的一个员工,他可以在自己的飞书平台上生成一个智能伙伴,给它起一个名字叫“王一bó”。他每天可以叫“王一bó”去报销、安排一个会议、生成一份分析、给客户做一个报告等等。随着你和它的交互越来越深入,它会越来越了解你,慢慢地成为了你的伙伴。
吴晓波和飞书CEO交流的时候,有一句话特别愿意分享给大家,叫作“AI ready”。一个时代已经到来了,它正在改变我们每一个人的生活和工作,甚至社会角色。
AI ready是什么?对个人来讲,我们要知道正在发生这样的变化,这也是今年年终秀他用30分钟的时间和大家分享《大模型的12个月》的初衷。
对于企业来说,怎么拥抱这个变化?
首先,整个企业的SOP需要数字化,整个企业必须已经是一个在线学习型组织,只有这样,你做好了ready,然后等待工具来和你握手,来提高生产效率。所以我觉得,对每一家企业,每一个人而言,AI ready是特别重要的事情。
一个月后,我们看到,谷歌发布了它的Gemini双子座,这个产品在“大规模多任务语言理解”测试中首次超越人类专家。同时,阿里云“通义千问”开源大模型“Qwen-72B”在全球预训练模型中排名第一。
我们看到,中国公司在大数据的能力和原生应用能力上在不断地往前跑。
日本软银创始人孙正义曾作出预言:“AIGC(生成式人工智能)正进入广泛应用领域;AGI(通用人工智能)将在十年内成为现实,比人类聪明十倍;ASI(超级人工智能)将在二十年内实现,比人类聪明一万倍。”
如果孙正义讲的是对的,在2023年即将结束、2024年即将到来的时候,我们要问自己一个问题:生成式人工智能、通用人工智能、超级人工智能,对于我们每一个人意味着什么?它背后的技术伦理是什么?它的文化、生活方式和对意识形态的突破是什么?人类有没有可能毁于这个我们自己生出来的孩子?
所以中场最后,吴晓波用康德为自己撰写的墓志铭,来结束演讲。康德说:“有两样东西,我越去思考,越觉敬畏。它们便是头顶的星空和心中的道德律。”面对变革,我们要对技术、对天空的星辰保持极大的敬畏,同时我们要坚定地相信人类的道德所在。