《重生之AI教父》转载请注明来源:369小说网(369book.cc)
从模式上说,Gpt显然要强很多酷很多。
因为bERt的模式需要对特定的任务做大量的调整工作,仍旧无法摆脱现有人工智能技术的困境。
它更像是一个特定任务上的工具,而非是一个智能。
不过直到chatGpt出现之前,几乎没有多少人相信过Gpt的模式真的能够更强。
因为一直以来,Gpt的性能效果都要比bERt方法差了不少。
“即便我将两个方法都做出来之后选择支持Gpt,恐怕也不会有多少人跟随我的脚步吧...他们大概只会觉得,我为了完成当年视频中的宣传效果,已经开始不尊重事实,无法正确看待自己的技术了。”
开源了t方法之后,孟繁岐所有的精力就完全扑在了一件事情上,那就是确立t方法后续路线的两种范式,bERt和Gpt上。
不过这一次,他倒没有着急着手写代码和论文,而是花了很多时间与辛顿师徒以及其他谷歌大脑的同事讨论其中的模式和原理。
“首先,你的这两个路线,肯定都是基于预训练大语言模型的,只是针对后续具体任务的方式不大一样。”
辛顿还是那么擅长把复杂的问题和区别迅速地归纳总结。
所谓的预训练,并不是什么难懂的概念。
所有的模型都是由大量的参数组成的,最初的模型,所有的参数都是依照一些简易的模式随机生成的,这个模型不具备什么能力。
利用这样白纸一张的模型进行人工智能任务的学习,叫做从头训练。
载入已经学到了知识的参数模型,而不是随机产生的参数,就叫做使用【预训练模型】。
比如孟繁岐最开始参赛千分类任务,就是从头训练。
在语言领域当中,模型通常很大,所需要的文本数据也非常之多。
不是每一个都像孟繁岐这样,拥有成百上千张的泰坦Z来做实验的。
倘若现在有一个人,想使用最新的t方法,在自己的任务上使用,比如他想要一个可以辨别哪些语句说了脏话的t方法模型。
那么他就有两个选择,一是随机生成参数,从头训练一个t方法模型。
二,他可以直接载入孟繁岐开源出来的模型参数,然后在自己的数据和任务上做一些细微的调整,俗称基于【预训练模型】的【微调】。
很显然,后者的效果要比前者要好太多太多。
因为前者是从一个什么都不会什么都不知道的模型,从零开始,t方法可不是什么容易训练的模型。
而后者,则是已经在非常庞大的语言数据上学过语言的一般性规律和知识的聪慧模型。
站在巨人的肩膀上,模型学起新东西来,事半功倍。使用少很多的成本就能够取得成效。
“没错,在预训练阶段,我们可以使用大量没有人工打过标签的文本数据,避免了对大量标注数据的依赖。预训练的模型能够抽取出更丰富的语义信息,提高模型在各种自然语言处理任务中的性能。”
这是不论在图像领域、文本领域还是语音领域都已经成为基础的模式。孟繁岐觉得这点没有什么值得讨论的,毫无争议。
“其中的区别就是,究竟是使用特定数据去【微调】模型,还是使用【指令】去提示模型。”孟繁岐如此说道,这两点,就是bERt和Gpt技术最大的区别所在了。
“通常来说,我们都会觉得应该
本章未完,请点击下一页继续阅读!
关于从行星总督开始:帝国的疆域囊括了无尽的繁星,在这黑暗恐怖的遥远未来,只有无尽的战争。……当上行星总督的顾航,成为一颗废土行星的主人。他之前的三任总督都因为无法按时缴纳帝国税而被处决。变异怪物和废能风暴肆虐、幸存者势力勾心斗角内讧不断、科技落后、生产力低下、邪神复苏、绿皮生根发芽……“先别慌,让我看下面板。”【兵牌】、【英雄】、【科技】、【事件】……从行星总督开始,打造纵横星海的军团与舰队,镇
游戏 133万字 4天前
关于穿越成反派炮灰,我被迫征战沙场:从末世穿越而来的叶娇,成为了宋国武将叶家的团宠小娇娇。有着大将军父亲,武将一家的大哥,二哥,温柔且飒爽的军师母亲,青梅竹马的小侯爷。母亲是当朝皇帝的妹妹,皇帝舅舅全部生的都是儿子,所以对叶娇娇特别喜爱。温馨且美好的生活本以为是上天给自己重活一生的补偿,却没想到是穿越到一本书里。长到三岁的叶娇娇才知道,原来自己穿越到一本书里。自己一家子都是反派,还是反派炮灰的那
其他 38万字 1天前
关于在古代做个小县官:论在古代做个小县官是什么感受?架空/种田/基建/无CP孟长青穿越古代,为保家产,自幼女扮男装。又因殴打太子得罪后妃,被发配至最北地做个小官。皇帝因为不得不做的处罚,愧疚到难以入眠。孟长青却高兴到连夜收拾东西,天不亮就出了京。太好了,真是太好了!在京都当了十三年孙子,总算解放了!从今以后她孟长青自由了!她要到北山县做个土皇帝!但是在马车进到县城的那一刻,她傻了。什么情况?这里
玄幻 43万字 1天前
关于蝙蝠侠能有什么坏心思:陈韬万万没有想到,自己穿越了就算了,居然穿越成了蝙蝠侠本人。众所周知,蝙蝠侠聪明绝顶,智慧超群,格斗水平超凡入圣,但是——这一切和我这个穿越者有啥关系呢?哦!没事,我能继承蝙蝠侠的力量和记忆……?!?等等,为什么都是平行宇宙版本的?—————大都会,正义联盟在黑暗君主达克赛德面前躺了一地。【警告!已检测到“超人破碎的披风”“神奇女侠的烂盾牌”“绿灯侠损坏的绿灯戒”……】
武侠 168万字 6天前
关于天宇奇幻:(末世+升级+无系统+慢热+势力+主角不犯花痴)人类的大脑为何无法完全开发?危机时刻爆发出的潜能平时又在哪里?灵魂究竟是什么?到底灵魂是我,还是肉体是我?随着人类赖以生存的星球步入宇宙中一片高强度的能量带,一切都变了。残酷的环境铸就真正的强者,人类即将复苏,往日的荣光即将重现……
游戏 29万字 2天前
关于扮演岩王帝君多年后,我穿回来了:无cp我遇到个打算创世的神,祂捡了些湮灭世界的碎片练手。但搓出来的部分世界,总有重要人物刷新不出。祂打算请人来扮演,并承诺,只要完成扮演,就能获得扮演人物的能力。我跟被下了降智光环似的,甚至没问要扮演谁、扮演多长时间,二话不说就和祂签订了劳动合同。祂被我感动的泪流满面,说要不是自己化身太多,已经分不动。底下员工掰成两半,人手还不够,也不会出此下策。并给了我一个
游戏 108万字 4天前