将本站设为首页
收藏开心官网,记住:www.happyvege.net
账号:
密码:

开心书阁:看啥都有、更新最快

开心书阁:www.happyvege.net

如果你觉得好,恳请收藏

您当前的位置:开心书阁 -> 重生之AI教父 -> 436. 新的冲击 DeepSeek

436. 新的冲击 DeepSeek

加入书签 上一章章节列表 我的书架

温馨提示:如果本章属于内容错误等情况,请点击下面的按钮发送报告,我们会在一分钟内纠正,谢谢

%。

也就是说,当你使用万卡集群的时候,想让每一张卡都能顺顺利利地把工作给完成了,这个可能性只有可怜的三分之一。

而只要一张卡出现了问题,就势必会对整个集群产生影响,中止训练。

为了避免这种一卡罢工,万卡围观的情况发生,孟繁岐投入了大量的资源和时间。

可GPT4o,以及具有推理功能的o1之上,使用旧有办法继续提升性能的空间并不太大了。

孟繁岐这边收效甚微,便给了追赶者们极大的机会。

原本性能差了closeai许多的诸多大厂们,都在过去的这段时间里大大缩短了大模型性能之间的差距。

“从根本上来看,硬件设备对我的限制其实远超软件算法。”孟繁岐此前一直认为自己失去先知优势后,无法继续软件上的突破将会是最大的问题。

如今看来并非如此,随着与孟繁岐关系亲近的那个男人下台,拜老登政府限制英伟达的计算设备出口中国。

这让一心想要走在算法技术最前沿倍感压力。

虽然以他和老黄以及英伟达的关系,可以通过诸多方式绕开此禁令。可不论如何,这都称得上是巨大的困扰。

倍感无奈的孟繁岐开始向内寻求算法突破,以期待能够降低自己对显卡设备的需求。

可原本孟繁岐比较看好的两个技术方向,都没有取得预期的成功。

其一,孟繁岐很早就意识到,早期深度学习模型大多依赖于FP32(32位浮点数)的高精度计算,虽然结果准确,但计算量和存储需求巨大。

根据前世的经验,孟繁岐早早就推动了FP16(16位浮点数)训练和推理。这种格式可以节约一半的计算资源,虽然会稍稍影响模型的性能,但在针对性的优化下几乎可以忽略不计,这也是前世的主流训练模式。

如今,被计算设备所限制的孟繁岐被迫探索准确度更差的FP8(8位浮点数)。

前世的通识是,该模式计算效率极高,但精度损失更大,适用范围非常有限。

往往是在训练完成之后,进行FP8的格式转换,以节约模型的推理使用成本。直接在训练的时候采用这种格式是从未被证实过的。

为此,黄仁勋甚至在显卡的硬件设计上对FP8提供了一定的优化可支持,但半年的时间过去了,孟繁岐并没有看到自己预期的效果。

另一方面上,孟繁岐同时在寻求“稀疏”这一概


  本章未完,请点击下一页继续阅读!
加入书签 上一章章节列表 我的书架

看了《重生之AI教父》的书友还喜欢看

人在东京,朋友很少
作者:傲娇的牛奶麦片i
简介: 重生东京,成为黄毛学生,觉醒系统。可他朋友很少,不仅周围同学躲着他,风纪委员见他也要...
更新时间:2025-02-04 20:11:00
最新章节:011 不平静的雨夜
怂包美人在恐怖片被厉鬼宠爱
作者:里lili里
简介: 【怂包娇软美人+单男主+无限流+片场逃生+惊悚+甜宠】\n沈别枝被选中为灵异演员,需...
更新时间:2025-02-04 20:27:09
最新章节:第405章 异度空间(三)16
重生后,我成了市委书记的女婿
作者:提笔放牛
简介: 【天眼异能+刑侦破案+超爽推理+高冷女主+呆萌女配】重生2006年,成了市长家的上门...
更新时间:2025-02-04 20:21:24
最新章节:第480张 身边的凶手(12)
大佬十代单传,我为他一胎生四宝
作者:白生米
简介: 六年前,唐暖宁意外失身,薄宴沉说她不守妇道,一纸离婚协议书将她扫地出门,净身出户。<...
更新时间:2025-02-04 20:22:03
最新章节:第915章 周影到底经历了什么?
我们还没毕业,辍学的你成战神了
作者:发奋涂墙
简介: 陈凡穿越到灵气复苏,凶兽肆虐的世界,这里武道盛行,武者集万千光环于一身。
<...
更新时间:2025-02-04 20:30:49
最新章节:第一卷 第925章 不装了,狄更斯
贾二虎的妖孽人生
作者:已知天命
简介: 不是猛龙不过江!24年前的弃婴王者归来,神挡杀神,魔挡除魔,大佬跪求放过,仇人闻风而...
更新时间:2025-02-04 20:00:28
最新章节:第2615章 时机非常重要