亚洲第一网色综合久久红第一,娜娜的yin荡生涯h全文

Brandcenter品牌中心

LONGSUN MAGAZINE 首頁>品牌中心>隆生刊物

DeepSeek這把火，為何燒疼了硅谷？◎劉潤

DeepSeek實在是太火了?；鸬绞裁闯潭饶?？美國的一把山林大火，幾個星期燒掉了加州2500億美元。而DeepSeek橫空出世，納斯達克大跌3%，瞬間燒掉了5000多億。如果把這5000多億換成百元美刀，用飛機來運到焚燒廠去燒，需要87架滿載的空客380。美國人嚇壞了?？墒?，DeepSeek這把火，為何燒疼了硅谷？DeepSeek到底厲害在什么地方？有人指責(zé)DeepSeek“偷竊”，是真的嗎？今天我們就來聊聊這件事。從哪里開始呢？就從美國人為什么這么怕開始。這種怕，源于心中的一根刺，一根針不能碰，一碰就疼的針。這根刺的名字叫：斯普特尼克時刻。

斯普特尼克時刻

1957年10月的一天，很多美國人走出家門，驚恐地望向天空。他們聽說，（前）蘇聯(lián)人發(fā)了一顆“籃球”上天，繞著地球飛行，時速29000公里。他們試著用肉眼，尋找這顆不斷在他們頭頂上繞圈的“籃球”。這顆“籃球”的名字，就叫斯普特尼克（sputnik）。

它當(dāng)然不是籃球，它是人類歷史上第一顆人造衛(wèi)星。這“居然”不是自己發(fā)射的，美國人很難接受。你能想象嗎？這就像連續(xù)三年的全年級第一，突然發(fā)現(xiàn)清華唯一提前錄取的不是自己。斯普特尼克號衛(wèi)星，就像一根刺一樣，扎痛了那一代美國人。然后，美國正式成立了NASA（美國航天局），并舉國之力完成了登月，這才拔掉了心頭那根叫“斯普特尼克”的刺。68年后的今天，DeepSeek讓美國人看到了另一個“斯普特尼克”時刻。

大模型屆的拼多多

你試過DeepSeek了嗎？趕快去試試，真不錯。推理能力直逼OpenAI的ChatGPT o1。而且不用翻墻，不用美國信用卡，也不用擔(dān)心，因為不慎被發(fā)現(xiàn)是中國用戶，而被系統(tǒng)“歧視性”封號，太揚眉吐氣了。但這都不是最重要的，最重要的是：DeepSeek實在是太太太便宜了。ChatGPT o1完成一次訓(xùn)練的成本，據(jù)說要上億美金，而DeepSeek，只需要不到600萬美金。1/20，便宜到不敢相信。就像有人指著一臺20萬的新能源車，說1萬賣給你，便宜到難以置信。你忍不住問，這臺是不是只會唱：爸爸的爸爸是爺爺？美國科技界迅速對DeepSeek做了各種評測，然后震驚了，這個“大模型屆的拼多多”，推理能力真和ChatGPT o1非常接近。隨即英偉達股票大跌17%。原來訓(xùn)練一個模型，并不需要像你們說的那么多GPU。DeepSeek，居然做到了所有硅谷科技巨頭都沒做到的事。那么DeepSeek，到底是怎么做到的呢？被“逼”的，被“年級第一”的“小院高墻”策略逼的。

小院高墻

2018年，美國首次提出對華科技防御策略：小院高墻。關(guān)系到美國國家安全的“小院”（半導(dǎo)體和微電子，量子信息技術(shù)，和人工智能等等），對中國建設(shè)“高墻”（出口管制，限制簽證，和審查投資等等）。

隨后，2022年，美國開始禁止英偉達對中國出口高端GPU。這些GPU，對訓(xùn)練AI大模型至關(guān)重要。為什么？公平競爭，共謀發(fā)展。有必要這么藏著掖著防著嗎？

哎，你不理解“年級第一”的心態(tài)。在一個班里，倒數(shù)第一和倒數(shù)第二，一般都是鐵哥們。但是正數(shù)第一和正數(shù)第二，基本都是死對頭。以前我?guī)湍爿o導(dǎo)作業(yè)，因為你是后進，你進步我很高興?？墒侨f萬沒想到，你居然不識好歹，才幫了幾天你就想取代我的“年級第一”，這怎么行。橡皮是我的，GPU也是我的。以后再也不借給你了。這就是“年級第一”的心態(tài)。那怎么辦？就這么認輸嗎？沒有GPU，怎么訓(xùn)練AI模型？創(chuàng)新。資源無限的時候，不需要創(chuàng)新。真正的創(chuàng)新，都發(fā)生在匱乏的時候。比如：混合專家系統(tǒng)。

混合專家系統(tǒng)

混合專家系統(tǒng)，也就是Mixure of Experts。我們?nèi)メt(yī)院看病，醫(yī)院50個醫(yī)生，每個都是最好的全科醫(yī)生。內(nèi)科、外科、兒科、心血管科、腦科、甚至婦科，什么都懂，什么都能治。這當(dāng)然最好，但成本實在太高了。因為每個醫(yī)生可能都要30年才能畢業(yè)。這就像大模型。一個模型，有50個博士學(xué)位，能回答所有問題。這當(dāng)然好，但實在是太燒GPU了。

可是，GPU都在美國的小院里，我沒有，怎么辦呢？也許你可以把醫(yī)院分成不同科室，內(nèi)科的只管內(nèi)科，外科的只管外科。這樣，“訓(xùn)練”醫(yī)生難度就降低了。用50個便宜的?？漆t(yī)生，取代一個昂貴的全科醫(yī)生，再設(shè)一個導(dǎo)診臺，根據(jù)病情，把患者分配不同的醫(yī)生，問題不就解決了嗎？這就是混合專家系統(tǒng)?；旌蠈＜蚁到y(tǒng)，大大降低了AI的訓(xùn)練成本。

強化學(xué)習(xí)訓(xùn)練大模型還有一項重要的成本，是人工打標簽。這張照片，是只小狗。那張照片，是只小貓。清楚標記出來，人工智能才不會學(xué)錯。用人工標簽，監(jiān)督AI的學(xué)習(xí)過程。這就是“監(jiān)督學(xué)習(xí)”（Surpervised Learning）?！氨O(jiān)督學(xué)習(xí)”，給很多第三世界國家，創(chuàng)造了大量工作崗位。所以有句開玩笑的話：有多少“人工”，就有多少“智能”。

那這個成本，能不能也省了呢？孩子學(xué)習(xí)走路的時候，可沒有用什么打標簽的照片，這個姿勢是正確的，那個姿勢是錯誤的。那孩子是怎么走路的？就是只管走就好了，摔倒了屁股會疼，走好了媽媽會抱。孩子會根據(jù)這種懲罰和獎勵的反饋，不斷自動調(diào)整姿勢，終于在一個瞬間，就突然會走路了。這就是：強化學(xué)習(xí)。Reinforcement Learning，簡稱RL。用激勵函數(shù)，而不是打標簽的數(shù)據(jù)來學(xué)習(xí)，從而大大降低訓(xùn)練成本。MoE+RL，真不容易。為什么美國人沒有先做出來？因為他們不缺GPU啊。很多創(chuàng)新，都是被“逼”出來的。DeepSeek還有一個獨特之處，那就是：開源。

開源有一個挺諷刺的事， OpenAI，其實并不Open。

ChatGPT 2.0之前，OpenAI是開源的，模型的代碼和權(quán)重對所有人公開。但從ChatGPT 3.0開始，OpenAI選擇了閉源?！癘penAI”變?yōu)榱恕癈loseAI”。其實這也可以理解，訓(xùn)練大模型實在是太燒錢了。逐漸大家也開始接受了：想要高質(zhì)量的模型，就要選擇閉源，直到，DeepSeek R1出現(xiàn)，并且開源。

可就算你成本很低，只有OpenAI的1/20，也沒必要開源吧？畢竟你也要活下去。開源圖什么？圖：生態(tài)。我只有200個工程師，就算他們?nèi)潜贝?、清華畢業(yè)，也只有200人。這點人手根本無法和微軟、谷歌、OpenAI比。那就團結(jié)整個開發(fā)者生態(tài)，把所有的研究成果，模型代碼和權(quán)重，都免費公開給全世界。這樣就會吸引大量開發(fā)者來使用、測試、改進我的模型。代碼很重要，但是生態(tài)更重要。用代碼換取整個生態(tài)的幫助，可能才是對抗巨頭們的唯一方法。明白了。可是，那你怎么活下去呢？別擔(dān)心。開源大模型，也能賺錢。

開源也能賺錢開源大模型，至少有三種賺錢的辦法。第一種，是“雙代碼模式”。免費公開的基礎(chǔ)代碼，這對大部分人來說夠用了，但是對于一些大型企業(yè)來說，他們希望有權(quán)限管理、分級管理等各種“高級能力”，可以收費。第二種，是“保險費模式”。是代碼，就會出問題，大公司對服務(wù)的穩(wěn)定性、響應(yīng)的及時性要求很高。所以，大公司很可能會購買“保險”服務(wù)，確保遇到問題會有人處理。第三種，是“云服務(wù)模式”。對中小企業(yè)和個人，可以像用水和用電一樣，直接調(diào)用DeepSeek的API，使用DeepSeek的云端“智能資源”，然后按“度”（百萬token）付費。不管是開源，還是閉源，只要創(chuàng)造了價值，都能賺到錢。所以，不用為DeepSeek擔(dān)心，也不用為英偉達擔(dān)心。

杰文斯悖論

DeepSeek這個“大模型屆的拼多多”橫空出世，英偉達股票當(dāng)天暴跌17%，投資人擔(dān)心大家不再需要那么多GPU。其實，不用太擔(dān)心。1776年，瓦特改良了蒸汽機，比老式蒸汽機節(jié)省2/3的煤炭。于是人們歡呼：煤炭消耗將從此大大減少。但實際情況恰恰相反，英國經(jīng)濟學(xué)家杰文斯發(fā)現(xiàn)，蒸汽機效率提高10倍的同時，煤炭消耗量不但沒有下降，反而上升了100倍。因為蒸汽機效率提升后，原來用不起煤炭的人，覺得自己用得起了，于是紛紛辦廠。工廠數(shù)量激增，反而引起煤炭用量的劇烈反彈。這就是著名的“杰文斯悖論”。

英偉達的顯卡同理。DeepSeek大大提升了GPU的使用效率。這在短期內(nèi)，可能會導(dǎo)致GPU的用量下降。但很快，就會有更多人因此加入模型訓(xùn)練陣營，從而導(dǎo)致顯卡的需求激增。果然。懵了的納斯達克，第二天就清醒了過來。英偉達股票回漲了8%?；剡^神來后，在一片贊嘆聲中，也逐漸出現(xiàn)了各種質(zhì)疑和批評。比如：蒸餾。

蒸餾美國白宮顧問David Sacks公開表示，有“實質(zhì)性證據(jù)”證明，中國AI公司DeepSeek“蒸餾”（distill）了OpenAI模型。他把這種“蒸餾”行為，比作“偷竊”。嗯……打不過，就誣陷嗎？“蒸餾”這個指控，很嚴重啊。首先解釋一下，什么是“蒸餾”？有兩個模型。一個老師模型（teacher model），一個學(xué)生模型（student model）。學(xué)生不斷向老師提問，并把“問題-答案”記錄下來。然后用這些“問題-答案”的數(shù)據(jù)，來訓(xùn)練學(xué)生，從而讓學(xué)生擁有和老師非常接近的知識和能力。這就叫：蒸餾。

學(xué)生向老師學(xué)習(xí)，也沒什么問題吧？是的，學(xué)習(xí)是沒什么問題。但是，ChatGPT的用戶協(xié)議明確寫著，不允許用我的模型，來訓(xùn)練新的模型，尤其是訓(xùn)練用來和我競爭的模型。也就是說，禁止蒸餾。用ChatGPT，就要遵守ChatGPT的使用協(xié)議，這是誠信問題。另外，牛頓花30年創(chuàng)造了萬有引力定律，我花3天學(xué)會了萬有引力定律。雖然結(jié)果是，我們都懂了萬有引力定律，但我不能用我的3天，去嘲笑牛頓的30年。所以，David的這個“蒸餾”指控，還是挺重的。那么，你相信DeepSeek蒸餾了ChatGPT的模型嗎？我確實不知道，我希望沒有。因為如果真有，那這篇文章前面所有文字，可能都白寫了。

曼哈頓計劃 2.0

DeepSeek這把火，為何燒疼了硅谷？用游戲科學(xué)的創(chuàng)始人馮驥的話來說：因為這是一個“國運級”的機會。為什么？因為AI不是一項普通的技術(shù)。它是一門能改變幾乎所有其他技術(shù)的技術(shù)。哪個國家能率先實現(xiàn)通用人工智能（AGI），也許誰就能率先解決材料科學(xué)問題（武器更先進），率先解決蛋白質(zhì)問題（醫(yī)療更先進），率先解決可控核聚變問題（能源更先進），以及其他很多問題。這也是為什么，美國人把AI稱作曼哈頓計劃 2.0。上個世紀，美國人發(fā)誓，一定要比德國人先研發(fā)出原子彈。這項計劃，就叫做作：曼哈頓計劃。現(xiàn)在，他們把一定要比中國人先實現(xiàn)通用人工智能。甚至不惜各種封鎖。一起發(fā)展不好嗎？必須對中國封鎖嗎？我用這個問題問AI，中國的DeepSeek給我的回答是：

否。技術(shù)競合催生共贏，封鎖反噬創(chuàng)新生態(tài)。

而ChatGPT給我的回答是：否。但出于競爭與安全考量，美國可能選擇部分領(lǐng)域封鎖以維護技術(shù)優(yōu)勢。

嗯，果然是美國的GPT。

劉潤，著名商業(yè)咨詢顧問，潤米咨詢創(chuàng)始人

男男受被攻做到腿发颤高h漫画,伊人久久大香线蕉AV影院,亚洲精品国产精品国自产观看,奶水美人双性h美人多汁