来源:亚当特烦恼(公众号ID:heyi-506)
在群体性狂欢欣喜的氛围中,提出一些逆耳忠言,可能会招致攻击和谩骂。然而,我仍欲指出,不应因deepseek在特定领域的技术突破,而迷失了AI产业发展的战略方向。
受短期因素影响,英伟达股价一度出现下跌。此现象源于人们对deepseek算法优化的关注,以及对人工智能发展,是否需要如此巨大硬件投入的质疑。
对此,我想提出几个问题进行探讨。首先,需明确deepseek实际使用了多少算力。其次,deepseek是否需要更优质的算力资源。第三,未来是否需要更多算力投入,取决于国家AI战略的发展方向。第四,最终能够挑战英伟达的,将是国产GPU的崛起而非仅凭deepseek的算法优化。最后,中国AI产业后续将面临严峻的封锁挑战。
第一个问题,必须弄清楚deepseek究竟使用了多少算力。
deepseek构建了如此级别的模型,仅使用了2400余块H80 GPU,这一成果确实令人瞩目。
然而,目前所知的算力使用数据,仅来自deepseek自己的报告。这些数据的准确性如何验证,需要得到确凿的证据。训练日志中未计入的数据蒸馏能耗、知识迁移损耗等"暗物质算力",据斯坦福AI指数报告显示,这类隐性成本最高可达标称值的40%。
同时,行业尚未建立第三方算力审计标准,企业自证数据如同运动员自测兴奋剂。算法优化的光环下,需要建立更透明的算力计量体系。
我想说的是,对于普通民众而言,deepseek使用的算力多少或许无关紧要,但对于行业和政府决策却至关重要。
DeepSeek公布的算力数据的准确性,不仅关系企业技术路线,更直接影响国家层面的算力基础设施投资决策。若DeepSeek的算力数据存在统计行性的偏差,可能会给决策和判断带来不良后果。
一方面,政府可能误判“小算力办大事”的可行性,在AI政策制定上受到影响,对AI算力基础设施的投入认识不足。另一方面,“小算力办大事”的观念,可能影响对技术攻关,特别是对半导体硬件技术攻关的重视和投入强度的提高。
若将特例视为常态,可能重演日本"第五代计算机"的悲剧——80年代因过度追求软件优化,导致硬件生态的落后与坍塌。
我在文章中曾多次强调,中美AI产业竞争的焦点,最终将集中在半导体和能源领域。若半导体产业无法解决瓶颈问题,无法实现核心硬件和基础设施的自我保障,要想实现中国AI产业与美国并驾齐驱,并非一件易事。
第二个问题,假设deepseek的算力资源属实,那么若使用更先进的算力资源,其表现是否更佳。
如目前信息表明那样,deepseek即便使用性能受限的GPU,也能训练出如此水平的大模型(暂不讨论数据蒸馏问题)。那么我们可以推测,若deepseek使用更先进的GPU,模型的性能是否将更加出色?接下来的一个问题是,若后续缺乏更强大的算力支持,deepseek能否持续保持领先的地位。
实际上,这里还存在一个问题。那就是,deepseek作为开源项目,若国外AI巨头借鉴其算法和经验,并拥有更先进的算力资源,那么软硬件结合的优势是否将进一步超越我们的AI。
个人认为,若DeepSeek长期受限于现有算力水平,其技术路线是否将面临系统性风险,如模型规模受限、迭代速度减缓等问题,是否还可以得心应手,包括应对前沿技术的研发挑战。当然了,这些问题在其他人眼里都是杞人忧天,但是我对此报以谨慎和思辨态度。
第三个问题,所需算力取决于AI的战略方向和进度。
近期,以英伟达为首的科技股正承受巨大压力,市场将DeepSeek视为对美国科技主导地位和AI革命的重大威胁,并且认为美国靠推算力发展AI的Chaney之路,是不科学和不可持续之路。
尽管DeepSeek的模型令人印象深刻,并将产生连锁反应,但我们必须明确的问题是,人工智能的发展方向和进度是什么?
语言模型仅是人工智能的初级分支,未来的终极目标是AGI,即发展通用人工智能,涵盖天地一体、万物交互、自动驾驶、具身智能机器人等领域。以我个人有限的认知而言,AGI终极目标对GPU芯片和算力的需求是不可避免的。因此,我们看到的现实情况是,美国科技公司正专注于AGI的终极发展,并积极构建AI基础设施和生态系统。
DeepSeek的定位是AGI,但是它更需要面对的问题是,在算法优化上的成功,能否改变AI基础设施建设的需求和趋势?个人认为,这种可能性应该不大。
针对消费者推出具有竞争力的大模型是一回事,但推出更广泛、更深入的AI模型则是另一回事。DeepSeek的局部突破如同精妙的战术穿插,但尚未完全改变中美两国在AGI战场上的战略态势。
面对AGI的广阔前景,中国AI产业不仅需要追赶者的思维,更需要重塑规则的思维,需要生态系统思维。只有在半导体、量子计算等领域构建新的技术壁垒,形成更有利的产业生态,才能彻底突破美国的技术围剿,开辟AI产业发展的坦途。
DeepSeek现有的算力,能否支撑更前沿的技术布局和探索,从语言模型跨入AGI的征途?中国的AI产业的生态和基础,能否支持DeepSeek继续突破,继续实现单点突破?这些问题,需要我们思考和回答,以确保不误判下一代的AI技术范式和产业框架。
第四个问题,能够干翻英伟达的,显然不是deepseek。
对于英伟达股价的下跌,也不应过于乐观。英伟达股价的下跌,实质上是估值、增速以及竞争问题的反映。
然而,认为deepseek一个模型,就能击溃英伟达的产品需求和股价,显然有些夸大其词。硅谷对deepseek的看法不一,但英伟达自己最近的态度,似乎并不那么迫切和焦虑,表明他们并不担忧股价下跌。
这表明事情可能并不是简单,英伟达作为局中人可能清楚背后的情况,每个GPU都有云上信息标记,英伟达对算力的运行位置应该是掌握的,这些无需赘述。或许英伟达对deepseek的冲击乐见其成,因为让美国政府认为GPU对中国AI的发展不那么重要,这才是英伟达所期望的结果。但是,这也仅仅是一种一厢情愿。
很多老百姓尤其是股民,都在为英伟达的股票下跌兴高采烈,但英伟达公司自己似乎并不慌张。
因为英伟达可能更清楚背后的故事,更清楚自己。决定英伟达股价的,是估值,增速、预期和竞争对手等综合因素,尤其是中国能否成长出强劲的竞争对手。
因此,要想挑战英伟达,改变AI产业的话语权,绝非仅靠deepseek就可以实现,而是需要依靠中国的英伟达站起来,也就是中国的算力产业必须按照既定目标,最终实现了反“围剿”的成功。
第五个问题,因为deepseek的出现,中国的AI产业发展将面临更严峻的封锁境地。
deepseek模型的横空出世,似乎上演了挑战硅谷、背刺英伟达的精彩大戏,全国上下为之振奋,认为我们已经冲破了算力铁幕,打碎了算力霸权。我在感到振奋的同时,也感到一些忧虑,即预感中美AI竞争将更加残酷,美国对我们的技术封锁将更加严酷。
业界一直在讨论deepseek是否进行了数据蒸馏。无论这个答案是否明确,可以预见的是,deepseek亮相之后,美国的AI巨头将在模型发布上提高警惕,对国内企业采取更加严密的防范措施。这一点,对于算法优化的deepseek后续发展的影响如何,我们需要拭目以待。当然希望在大模型的工程化和算法优化上,deepseek已经走出了不依赖外部资源的独立自主道路。
与此同时,Deepseek惊艳亮相之后,将引来全面的调查和分析,特朗普都亲自表态要应对竞争。美国方面肯定会在短时间内弄清楚问题所在,接下来美国将对中国AI产业实施更加严厉的封锁。
因此,Deepseek宣称对算力资源的大幅节约,不但不会让美国放松对GPU的管制,反而会全面提高对各类GPU的管制。带来的冲击是,国内对于英伟达GPU更是一芯难求。这里我们不得不要考虑,国内大厂和其他AI友军,囤积的GPU是否能满足后续研发的需求,去年已订购的GPU,是否还能顺利到货。
有思考和忧虑,不代表不看好。我想说,无论怎样,确实值得为deepseek喝彩,也应为AI产业加油。但是我们需要看到,在AI产业全面突围之前,必将面临更加严厉的封锁和更大挑战。
中国从不缺乏天才和智慧,在AI领域我们缺少的是正向博弈的生态系统,因此如何加快构建一个良好的产业生态,可能比单纯的技术突破更为重要,任务更为艰巨!
结束语
或许,要不了多久,就会看到英伟达的股价,会逐渐恢复失地。股价的变化并不重要,但是它变化的背后存在需要深思的问题,那就是算法优化和技术突破,是不是足以改变整个AI产业的技术路线,我们局部的技术弯道超车,是不是足以全面超越美国AI产业的比较优势。
在AI这场人类史无前例的技术革命当中,在这场攸关两国国运的技术竞争中,需要看到星辰大海,用冷峻和深邃的目光去看待问题,用理性的光芒去照耀眼前的现象。