2016年,黄仁勋展示了英伟达发布的第一款深度学习超级计算机DGX-1。黄仁勋把这台DGX-1捐给了一家初创企业,这家企业将在7年后震惊全球,它正是开发了ChatGPT的Open AI,而马斯克正是Open AI的联合创始人。当年的这样一台DGX-1,价值12.9万美元。
而7年后,英伟达A100芯片被抢到断货,23年5月底,其市值一度突破万亿美金,成为美国第五大市值的公司,相当于1.8个台积电、2.6个腾讯、4.9个阿里,远超英特尔和AMD的一两千亿。
要知道数年前英伟达还是游戏圈里卖卡的,币圈里挖矿的,升级像挤牙膏,民间称其老黄刀法,现在怎么就摇身成为业界龙头,AI能源、老美贸易管制下的科技发展基石,大国博弈棋子了。
今天就来聊聊芯片之王英伟达,从图形处理器到游戏显卡,从比特币到AI算力,英伟达为何总能踩中风口,黄仁勋9岁到美国,怎样建立起芯片帝国,GPU为何是ai时代的宠儿,英伟达是否无可替代,它对全球来说到底意味着什么。
英伟达
1933年,中国正式接入国际互联网,标志着中国互联网的诞生。
那年,诺基亚刚开始迈向中国,央视里多了一套节目东方时空。这年在美国还没有有线电视跟MTV,IBM和苹果的麦金塔刚刚开启个人电脑革命,英特尔和AMD风光无两划时代的奔腾CPU是最先进的产物。
这一年,已在芯片行业干了10年的黄仁勋刚刚30,他在AMD干过芯片设计,在LSILogic做过图形经处理,技术管理兼备,销售还干得风生水起,打工打成了全能战士,自然有了日益膨胀的野心。
而这一年,对于黄仁勋来说,还有一个更为特殊的意义。1963年,黄仁勋在台北出生,9岁那年被他爹送到华盛顿州的舅舅家,成为留美幼童。经济困难的舅舅把他安排到乡村寄宿学校读书,不过更像是少年教研院。
黄仁勋又发扬了华人优良的学霸基因,顺利考入俄勒冈州立大学,读自己热爱的电子专业,也就是在这的实验室里,他对自己的第一位女友Lori吹牛,承诺要在30岁时拥有一家自己的公司。所以到了1993年,也是黄仁勋兑现诺言的一年,于是他就薅走了曾经合作过的两位技术伙伴,一起创立英伟达,出任CEO,且有意将第一天上班的日子定在了生日那天。他们决定专注于研发图形处理芯片,以适应当时PC带火的电子游戏和多媒体。只是初出茅庐的第一站,现实就给了他们一击。
1995年,英伟达推出了首款面向游戏主机的多媒体加速器NV1,并俘获日本游戏公司世嘉的芳心。世嘉给了英伟达一笔700万美元的合约,资助英伟达继续研发NV2,并用在自家的下一代游戏机上。
黄仁勋
同年,微软推出Windows95及direct3D,使游戏主流平台从游戏机转向PC,图形芯片主流市场亦转变。英伟达重金研发的NV2不兼容Windows标准,面临两难:不完成合约拿不到资金会破产,继续推进又意义不大,如同员工完成方案后老板换主题般棘手。
然后就在这进退两难之中,老黄心一狠,做出了一个违背祖宗的决定。跟世嘉承认自己选错路线,必须马上叫停。
英伟达绝处逢生,背水一战,1997年推出了新款图形加速芯片Riva128,专供个人电脑市场,且凭借超高的性价比,开售后4个月内出货量就超过了100万台。
英伟达也从此开始逆袭,目标就是当时显卡市场龙头3DFX,当时3DFX占了3D加速器市场80%到85%的市场份额,是当之无愧的业界老大哥。
于是黄仁勋开始化身卷王,搞了个3团队两季度的研发模式,这让公司可以每6个月推出一次新产品,领先市场一到两个研发周期,卷死对手,引领市场需求。
他提出黄氏定律对标摩尔定律,称英伟达每6个月升级性能便翻一倍。1998年,英伟达推出更强的RivaTNT,可与3DFX竞争。
而除了自卷外,英伟达还做了两次关键性的选择,第一次是抱紧了微软这条大腿,因为当年图形处理器市场群雄乱战,各家有各家的标准和技术路线,像3DFX在微软的direct差之外就有引以为傲的独家API glad。
英伟达从Riva128开始就跟着微软的旗帜前进,并在GPU这条路上一路走到黑,倒是3DFX守着自家的图形API固步自封。第二,英伟达还选对了另一个盟友台积电,两家一个专注设计,一个专注生产,强联合就能生产出比3DFX工艺性能更好、成本更低的芯片。
当年台积电财务长张孝威赴美跟英伟达聊聊账期的时候,黄仁勋甚至极度自信地说,请你们不要这样对我们,因为将来我们会是你们最大的客户。
今天来看老黄吹过的牛,真不是牛,只是没想到,1999年仅一年后,英伟达就迎来了丰收。
这年英伟达成功上市,并率先提出了GPU的概念,它的全球首款GPUG FORCE256带来空前的性能提升,打得对手不知所措,也开始让显卡成为PC中的核心硬件。
显卡
这年英伟达的市场份额首次超越3DFX,而第二年它就直接收购了3DFX,荣升显卡一哥,然后它将开始翻越另一座大山,A卡。
A卡时代
收购3DFX后,英伟达放眼市场只剩一个对手,那就是老牌显卡巨头ATI创始人,同样是华裔,出生于广东的何国源,今天我们说的A卡,在当时指的正是ATI两千年,面对英伟达开创性的Geforce256,ATI也拿出了自家的首款Radion显卡,Radion256都是256,到底谁更6,其实ATI的Radion256是要6于Geforce256的,甚至比后来的Geforce2GTES也丝毫不差,所以黄仁勋眼前是一段很长的拉锯战。
2003年中国超越日本成为全球第二大电脑市场。
当年10月,ATI在国内发布了当时世界上最顶级的显卡Radeon 9800XT,引爆了一众在网吧打传奇的游戏玩家。而老黄秉承着有ATI的地方必有英伟达,仅过4天就拿出了最新的Geforce FX5900显卡。于是,神仙打架打得越狠,我们越爱。
当年可不兴挤牙膏,只是在显卡大战最激烈的时候,ATI创始人何国源遭遇财政丑闻,退居幕后,失去主心骨的ATI开始走下坡路。
何国源
随后的几轮新产品推出中,英伟达总能力压ATI一头,再加上双方互卷将显卡价格不断压低,而英伟达则牢牢占据着中低端市场的主要利润,所以面对英伟达的步步紧逼,05年ATI利润大幅下滑,股价大跌,已无力独自一战。
2006年ATI被CPU巨头AMD收购,虽然头上还是带个A,但AMD因为收购也负债累累,连Intel在CPU领域的鏖战也自顾不暇,所以后来A卡发布延期,市场份额下滑,AN争霸最终以英伟达的胜利告终。此后英伟达在桌面独显的市占率上都一直压制AMD,到今年已经占了八成以上的市场份额。
英伟达此时就像诺基亚柯达一样,能打败它的只剩时代,而如何不败于下一个时代,肯定不能只给网瘾少年卖卡,它得找到下一个风口。
黄仁勋曾在采访中说,也许是我们公司成立六七年后,我们得出的结论是做单一功能的图像处理器在未来不会成为一个可持续的生意。为啥不可持续呢?简单来说就是因为GPU用途太单一了,像CPU可以通过多线程技术被所有计算机应用共享,但GPU只能搞3D图形渲染,还经常处于闲置状态,非常不经济。
2006年,英伟达首席科学家DavidKirk就建议让原本只做3D渲染的GPU技术通用化,即GPGPU,让GPU可以编程,释放它的潜力。
天生爱卷的黄仁勋自然就同意了,只是董事会却是100个不愿意。然而老黄的反驳是我们相信,我们所相信的,假如我们不建造它,别人就不会来。
英伟达财务预测
于是英伟达还是做了他开发了后来大名鼎鼎的CUDA平台,想让自家的每一颗GPU都支持这套程序。英伟达也为此付出了代价,不仅是每年5亿美元的研发成本带来的资金压力,还有因为在芯片设计中增加了CUDA相关的逻辑电路,导致了芯片面积增大、散热增加、故障率增高的品控危机。
而且关键跟汽车一样,不需要全景天窗、自动泊车、换挡拨片、手势指令,你非给我加上,然后多收我5万块钱。这套编程功能我不用,我就打个游戏,所以客户并不愿意溢价购买芯片。
英伟达在那段时间利润大降,股价低迷,一直延续了5年的颓势,不得不说,这也是英伟达历史上最大的赌局,而它也并不是没赌输过。
在2008年,智能手机崛起,英伟达曾推出Tegra系列芯片进攻手机市场,但因为高通靠着基带技术的垄断,而自己又迟迟没能完成处理器和基带技术的整合,英伟达基本上错失良机,所以后来黄仁勋壮士断腕,放弃了手机市场。
幸运的是英伟达还是赢了,因为很快他们就看到了CUDA是有用的,而且是史诗级的威力。
谁是大富翁
2012年深度学习三巨头之一Geoffrey Hinton和学生Alex用两块GTX 580显卡花了6天时间训练出深度神经网络Alexnet,然后就带着它去参加了Imagenet大规模视觉识别挑战赛,这是计算机视觉领域最受关注的赛事,来的都是全国顶级的人工智能团队,而Alexnet在Imagenet竞赛中一鸣惊人,靠着比第二名低了10.8%的错误率夺得冠军。
李飞飞创建 imagenet
那这款GTX580显卡是啥水平呢,我大致查了下,当年在国内大约卖4000块,算一款高端游戏显卡的,但再高端居然只用两块就能吊打一众AI好手,属实超乎预期。后来因Alexnet的问世,大家开始意识到GPU在深度学习上的巨大威力。
按照Hinton的说法,如果没有英伟达,Alexnet就不会出现,而没有Alexnet,英伟达也不会那么快拥抱AI时代。
那ChatGPT怎么出来的,是纯靠上万颗英伟达A100训练出来的,以致今天所有的大模型公司都在抢显卡,准确说是抢英伟达显卡。我们分两个层面来说,首先为什么GPU跑AI最佳,GPU和CPU虽然都是芯片,但在运算方式、功能上却有巨大的差异。
CPU是电脑的,大脑要通用和多功能,它要支持复杂通用的逻辑判断,所以每个核心的内部结构异常复杂,而核心数最多也就二十几个。
GPU最早是设计给图像渲染用的,每个像素点独立计算,所以需要几千个核心并行处理任务,但是每个核心结构更简单,CPU是几个大学教授,能做高数题,也能做加减法。GPU就像几千个小学生不会高数题,但是加减法可比教授快多了,毕竟双拳难敌千手。
ai巨头英伟达狂飙,业绩暴增10倍
而人工智能高度依赖数据处理,既然Alphago不是靠研究围棋里的势等专业知识去下赢人类的,它是靠观察棋盘上的361个点,每个点黑白空三种可能性,然后简单粗暴地统计分析下应的这种工作人不擅长CPU也不擅长多核心的GPU更擅长。
这就说到前面的那次豪赌CUDA,其实不管你N卡、A卡,在CUDA之前这都只是游戏显卡,即便有并行计算的潜力,但没有一个平台能把它释放出来,CUDA就不管你是工程师、科学家,还是游戏制作人、艺术家,都能用简单的编程调度、GPU算力,解决更复杂的计算问题。
AI大神吴达说过这么一句话,在CUDA出现之前,全球能用GPU编程的可能不超过100人。有CUDA之后,使用GPU就变成一件非常轻松的事,所以英伟达搭建了一整套软硬件生态标准,在我们的生态内搞开发,效率倍增,离开我这个生态或者自己搞生态,你就寸草难生,这样苹果有全家桶,华为有鸿蒙。
那后来AMD也学着搞了个RCM平台,但足足比CUDA晚了10年。于是英伟达也就可以肆无忌惮地统治未来。
比如今天小企业买云计算,经常会看到特斯拉V100显卡,这不是造车的那个特斯拉哈,而是英伟达推出的一系列数据中心GPU。然后15年左右自动驾驶火了一把。而自动驾驶本质上也依赖AI计算,所以2016年英伟达又搞了个drive系列,主打自动驾驶市场。
再就是17年比特币大火,挖矿热又给英伟达带来了一波破天的富贵,英伟达甚至推出了挖矿专用卡,“卖铲子”卖成了最大赢家。再后面21年的元宇宙,22年的ChatGPT,这些大家都很熟悉了。
总之,目前英伟达的产业布局,上线有人工智能挖矿老板开路,下线有游戏玩家兜底,甚至已经渗透到了航空航天生物科学研究、机械流体模拟,只要涉及计算相关的领域,都逃不出英伟达的体系。
不能说英伟达直接起飞,只能说它简直是数字时代的水电煤。而英伟达能接住这一切,起因还是06年黄仁勋力排众议打造的CUDA。回到2006年,英伟达从一个做游戏显卡的变身AI算力霸主,到底凭的是远见还是运气。
游戏显卡
2020年,谷歌大脑的研究员SaraHooker就发文说道,英伟达的成功就像中了彩票,这次很大程度上取决于硬件方面的进展与建模方面进展之间的对齐。
2016年,黄仁勋在接受福布斯采访时则说,自己一直都知道英伟达图形芯片的潜力不止于为最新的视频游戏提供动力,但他也没想到会转向深度学习,只能说大富翁的游戏100%会有赢家。
但是谁也不能肯定那个赢家是自己,尤其是需要大量研发投入,且研发周期长,还得依赖市场在适当的时候,成熟的行业,谁也不知道前方是哪,不论是英伟达、allin做CUDA,还是神经网络选中了GPU,都难免有运气成分。
那么很多人会有一个疑问,为什么人工智能没有诞生于中国,黄仁勋在中国能不能做出英伟达,或许我们很难给出答案,但遗憾的是,只有伟大的技术变革才能产生颠覆性的消费市场,而伟大的技术变革又必须承担99%失败的风险。
一个成熟的企业家不会拿着运气当筹码上牌桌,只有梦想家会去赌。如果只看供需,只看盈利,只看研发周期,只看实用,只看眼前和脚下,永远无法创造出变革性的技术。
从2023年11月17日起,英伟达4090显卡将不再向中国大陆出口。而事实上,早在2022年7月,美商务部就限制了英伟达人工智能芯片A100和H100对中国大陆的出口。
今天国内的大模型厂商面临算力不够,这事华为早就很熟,中国今天难以自主生产高端芯片,也不仅是通信的问题,不仅是5G的问题,更是AI的问题,未来的问题。
英伟达在未来或成数字时代的能源,而中国也需要我们自己的英伟达。
#英伟达#\u0002#芯片#\u0002#科技#\u0002#5G#\u0002
文本来源@阿泰(阿Test正经比比)的视频内容
本财经资讯由顶点财经发布,版权来源于原作者,不代表顶点财经立场和观点,如有标注错误或侵犯利益请联系我们。