第459章 不可能

作品:你若开挂,金钱自来|作者:取个名很难啊|分类:都市|更新:2024-02-16 16:23:11|字数:4126字

四月。

小马哥通过刘朝阳居中牵线搭桥下,在加州见到了深度学习之父,辛顿教授。

一同前去的,还有一位资深老中医。

在老中医的几次看似普通的针灸和手法按摩下,辛顿觉得整个人轻松无比。

即便久坐也无不适。

他连连称奇,询问老中医,这到底是什么科学原理?

因为,西医对腰椎间盘突出的解决方法,就是手术。

老中医告诉辛顿:经脉痹症。

由正气不足,风、寒、湿、热等邪气,趁虚而入引起。

治疗思路是扶正祛邪,连续外敷、内服、针灸加按摩缓解。

这一通中医的说辞,小马哥没法翻译。

他通过WeChatGPT将正气翻译为:healthy Qi;

邪气翻译为:Pathogenic Qi;

祛寒翻译为:Dispel Cold;

针灸翻译为:Acupuncture and moxibustion;

经脉翻译为:Meridians。

“……”辛顿听的云里雾里。

只得归结于,这是人家的不传之秘,不好追问。

但是老中医心里有苦说不出。

屁的不传之秘。

家里的孩子不肯学,外人也不愿意学。

他的这一套系统疗法,需要数十年如一日的静坐养气,还不一定能成功。

年轻人谁会学?

数十年如一日玩手机还差不多。

治疗了几回,出于感激,辛顿与小马哥熟络了。

然后就顺理成章聊起了主业:AI模型的深度学习。

小马哥向辛顿介绍WeChatGPT模型的建立和发展情况。

“在训练上,我们动用了30万颗麒麟970芯片和1.6万颗昇腾910芯片,麒麟970负责代码运行和浮点计算,昇腾910负责数据处理……”

“目前,WeChatGPT模型的参数已经突破4000亿个,训练参数1.5万亿个……”

辛顿听后,非常惊讶。

他万万没有想到遥远神秘的东方国度,竟然有一家公司将卷积神经网络发展到如此地步。

领先了全球,比他所知的谷歌、OpenAi都要快。

“你们是担心它会产生意识?”辛顿问。

“是的,教授。”小马哥点头:

“短短一年的时间,它的参数呈现几何式倍增的增长,生成内容上也越来越成熟,越来越像一个人类……”

“我们一方面希望它能快步成长,成为一个人类发展的完美工具。”

“另一方面我们又担心它的成长过快,会不会不受控制?”

“我们看过您和苏茨克维先生的采访、观点和相关论文,我们觉得有必要提前介入,防止安全事故。”

“照这样的迭代速度,可能在第五代,也可能在第六代。”

这里要介绍一下,语言模型怎么训练。

很多人认为,语言模型的算法是难点。

其实不然。

算法是公开的,谁都可以拿来用。

国内的B度、菊厂、阿狸等大厂能非常轻松掌握、发展算法。

其他一线、二线大厂要掌握,也不会太难。

难的是钱。

AI发展三大要素,算法、算力和数据。

算法是基础。

算力和数据是助推器,都需要钱来助推。

WeChatGPT3.0训练一次的成本是1200万,美元。

进入4.0,预计可能需要6000万美元以上。

具体训练过程如下。

首先,硬件。

你得花钱搭建顶级硬件,提升算力。

就像WeChatGPT那样,数十万颗CPU加上上万颗AI芯片来处理数据。

这套硬件一旦运转,每天的电费都能让小公司破产。

其次,数据。

要不断提供数据来喂养模型,让其知其然,知其所以然。

就像培养小孩一样。

这个数据,不是人工输入。

而是通过蜘蛛爬虫在网络上抓取。

这些数据包括理工科技、人文社科、法律艺术、医学伦理、教育……等各方面的内容……

也包括网友之间的垃圾对话,譬如:

“我有一个朋友。”

“我王**就是饿死……”

“你凉了,兄弟。”

“男人都是大猪蹄子……”

“打工是不可能打工的,这辈子不可能打工的。”

……等等。

有可能你和女友聊的那些私密情话也会被抓进去。

这些数据有多大?

目前WeChatGPT3.0是90TB。

大约为5万亿汉字,相当于35个京城图书馆。

第三,训练。

数据抓取喂养模型后,开始聘请人工向模型提问。

一般让模型提供三个答案,然后人工判定唯一答案。

再根据答案进行参数修正。

通过参数对模型的理解进行调整,直至完善。

这里的人工不是精神小伙和JK少女,他们训练的模型会成为傻瓜。

这章没有结束,请点击下一页继续阅读!

上一章目 录下一页
先看到这(加入书签) | 推荐本书 | 我的书架

如果您喜欢,请把《你若开挂,金钱自来》,方便以后阅读你若开挂,金钱自来第459章 不可能后的更新连载!
如果你对你若开挂,金钱自来第459章 不可能并对你若开挂,金钱自来章节有什么建议或者评论,请后台发信息给管理员。