男男受被攻做到腿发颤高h漫画,伊人久久大香线蕉AV影院,亚洲精品国产精品国自产观看,奶水美人双性h美人多汁

Brandcenter
品牌中心
LONGSUN MAGAZINE
首頁>品牌中心>隆生刊物
DeepSeek這把火,為何燒疼了硅谷?◎劉潤

DeepSeek實在是太火了?;鸬绞裁闯潭饶??美國的一把山林大火,幾個星期燒掉了加州2500億美元。而DeepSeek橫空出世,納斯達克大跌3%,瞬間燒掉了5000多億。如果把這5000多億換成百元美刀,用飛機來運到焚燒廠去燒,需要87架滿載的空客380。美國人嚇壞了??墒?,DeepSeek這把火,為何燒疼了硅谷?DeepSeek到底厲害在什么地方?有人指責(zé)DeepSeek“偷竊”,是真的嗎?今天我們就來聊聊這件事。從哪里開始呢?就從美國人為什么這么怕開始。這種怕,源于心中的一根刺,一根針不能碰,一碰就疼的針。這根刺的名字叫:斯普特尼克時刻。

斯普特尼克時刻

1957年10月的一天,很多美國人走出家門,驚恐地望向天空。他們聽說,(前)蘇聯(lián)人發(fā)了一顆“籃球”上天,繞著地球飛行,時速29000公里。他們試著用肉眼,尋找這顆不斷在他們頭頂上繞圈的“籃球”。這顆“籃球”的名字,就叫斯普特尼克(sputnik)。

它當(dāng)然不是籃球,它是人類歷史上第一顆人造衛(wèi)星。這“居然”不是自己發(fā)射的,美國人很難接受。你能想象嗎?這就像連續(xù)三年的全年級第一,突然發(fā)現(xiàn)清華唯一提前錄取的不是自己。斯普特尼克號衛(wèi)星,就像一根刺一樣,扎痛了那一代美國人。然后,美國正式成立了NASA(美國航天局),并舉國之力完成了登月,這才拔掉了心頭那根叫“斯普特尼克”的刺。68年后的今天,DeepSeek讓美國人看到了另一個“斯普特尼克”時刻。

大模型屆的拼多多

你試過DeepSeek了嗎?趕快去試試,真不錯。推理能力直逼OpenAI的ChatGPT o1。而且不用翻墻,不用美國信用卡,也不用擔(dān)心,因為不慎被發(fā)現(xiàn)是中國用戶,而被系統(tǒng)“歧視性”封號,太揚眉吐氣了。但這都不是最重要的,最重要的是:DeepSeek實在是太太太便宜了。ChatGPT o1完成一次訓(xùn)練的成本,據(jù)說要上億美金,而DeepSeek,只需要不到600萬美金。1/20,便宜到不敢相信。就像有人指著一臺20萬的新能源車,說1萬賣給你,便宜到難以置信。你忍不住問,這臺是不是只會唱:爸爸的爸爸是爺爺?美國科技界迅速對DeepSeek做了各種評測,然后震驚了,這個“大模型屆的拼多多”,推理能力真和ChatGPT o1非常接近。隨即英偉達股票大跌17%。原來訓(xùn)練一個模型,并不需要像你們說的那么多GPU。DeepSeek,居然做到了所有硅谷科技巨頭都沒做到的事。那么DeepSeek,到底是怎么做到的呢?被“逼”的,被“年級第一”的“小院高墻”策略逼的。

小院高墻

2018年,美國首次提出對華科技防御策略:小院高墻。關(guān)系到美國國家安全的“小院”(半導(dǎo)體和微電子,量子信息技術(shù),和人工智能等等),對中國建設(shè)“高墻”(出口管制,限制簽證,和審查投資等等)。

隨后,2022年,美國開始禁止英偉達對中國出口高端GPU。這些GPU,對訓(xùn)練AI大模型至關(guān)重要。為什么?公平競爭,共謀發(fā)展。有必要這么藏著掖著防著嗎?

哎,你不理解“年級第一”的心態(tài)。在一個班里,倒數(shù)第一和倒數(shù)第二,一般都是鐵哥們。但是正數(shù)第一和正數(shù)第二,基本都是死對頭。以前我?guī)湍爿o導(dǎo)作業(yè),因為你是后進,你進步我很高興??墒侨f萬沒想到,你居然不識好歹,才幫了幾天你就想取代我的“年級第一”,這怎么行。橡皮是我的,GPU也是我的。以后再也不借給你了。這就是“年級第一”的心態(tài)。那怎么辦?就這么認輸嗎?沒有GPU,怎么訓(xùn)練AI模型?創(chuàng)新。資源無限的時候,不需要創(chuàng)新。真正的創(chuàng)新,都發(fā)生在匱乏的時候。比如:混合專家系統(tǒng)。

混合專家系統(tǒng)

混合專家系統(tǒng),也就是Mixure of Experts。我們?nèi)メt(yī)院看病,醫(yī)院50個醫(yī)生,每個都是最好的全科醫(yī)生。內(nèi)科、外科、兒科、心血管科、腦科、甚至婦科,什么都懂,什么都能治。這當(dāng)然最好,但成本實在太高了。因為每個醫(yī)生可能都要30年才能畢業(yè)。這就像大模型。一個模型,有50個博士學(xué)位,能回答所有問題。這當(dāng)然好,但實在是太燒GPU了。

可是,GPU都在美國的小院里,我沒有,怎么辦呢?也許你可以把醫(yī)院分成不同科室,內(nèi)科的只管內(nèi)科,外科的只管外科。這樣,“訓(xùn)練”醫(yī)生難度就降低了。用50個便宜的??漆t(yī)生,取代一個昂貴的全科醫(yī)生,再設(shè)一個導(dǎo)診臺,根據(jù)病情,把患者分配不同的醫(yī)生,問題不就解決了嗎?這就是混合專家系統(tǒng)?;旌蠈<蚁到y(tǒng),大大降低了AI的訓(xùn)練成本。

強化學(xué)習(xí)訓(xùn)練大模型還有一項重要的成本,是人工打標簽。這張照片,是只小狗。那張照片,是只小貓。清楚標記出來,人工智能才不會學(xué)錯。用人工標簽,監(jiān)督AI的學(xué)習(xí)過程。這就是“監(jiān)督學(xué)習(xí)”(Surpervised Learning)?!氨O(jiān)督學(xué)習(xí)”,給很多第三世界國家,創(chuàng)造了大量工作崗位。所以有句開玩笑的話:有多少“人工”,就有多少“智能”。

那這個成本,能不能也省了呢?孩子學(xué)習(xí)走路的時候,可沒有用什么打標簽的照片,這個姿勢是正確的,那個姿勢是錯誤的。那孩子是怎么走路的?就是只管走就好了,摔倒了屁股會疼,走好了媽媽會抱。孩子會根據(jù)這種懲罰和獎勵的反饋,不斷自動調(diào)整姿勢,終于在一個瞬間,就突然會走路了。這就是:強化學(xué)習(xí)。Reinforcement Learning,簡稱RL。用激勵函數(shù),而不是打標簽的數(shù)據(jù)來學(xué)習(xí),從而大大降低訓(xùn)練成本。MoE+RL,真不容易。為什么美國人沒有先做出來?因為他們不缺GPU啊。很多創(chuàng)新,都是被“逼”出來的。DeepSeek還有一個獨特之處,那就是:開源。

開源有一個挺諷刺的事, OpenAI,其實并不Open。

ChatGPT 2.0之前,OpenAI是開源的,模型的代碼和權(quán)重對所有人公開。但從ChatGPT 3.0開始,OpenAI選擇了閉源?!癘penAI”變?yōu)榱恕癈loseAI”。其實這也可以理解,訓(xùn)練大模型實在是太燒錢了。逐漸大家也開始接受了:想要高質(zhì)量的模型,就要選擇閉源,直到,DeepSeek R1出現(xiàn),并且開源。

可就算你成本很低,只有OpenAI的1/20,也沒必要開源吧?畢竟你也要活下去。開源圖什么?圖:生態(tài)。我只有200個工程師,就算他們?nèi)潜贝?、清華畢業(yè),也只有200人。這點人手根本無法和微軟、谷歌、OpenAI比。那就團結(jié)整個開發(fā)者生態(tài),把所有的研究成果,模型代碼和權(quán)重,都免費公開給全世界。這樣就會吸引大量開發(fā)者來使用、測試、改進我的模型。代碼很重要,但是生態(tài)更重要。用代碼換取整個生態(tài)的幫助,可能才是對抗巨頭們的唯一方法。明白了。可是,那你怎么活下去呢?別擔(dān)心。開源大模型,也能賺錢。

開源也能賺錢開源大模型,至少有三種賺錢的辦法。第一種,是“雙代碼模式”。免費公開的基礎(chǔ)代碼,這對大部分人來說夠用了,但是對于一些大型企業(yè)來說,他們希望有權(quán)限管理、分級管理等各種“高級能力”,可以收費。第二種,是“保險費模式”。是代碼,就會出問題,大公司對服務(wù)的穩(wěn)定性、響應(yīng)的及時性要求很高。所以,大公司很可能會購買“保險”服務(wù),確保遇到問題會有人處理。第三種,是“云服務(wù)模式”。對中小企業(yè)和個人,可以像用水和用電一樣,直接調(diào)用DeepSeek的API,使用DeepSeek的云端“智能資源”,然后按“度”(百萬token)付費。不管是開源,還是閉源,只要創(chuàng)造了價值,都能賺到錢。所以,不用為DeepSeek擔(dān)心,也不用為英偉達擔(dān)心。

杰文斯悖論

DeepSeek這個“大模型屆的拼多多”橫空出世,英偉達股票當(dāng)天暴跌17%,投資人擔(dān)心大家不再需要那么多GPU。其實,不用太擔(dān)心。1776年,瓦特改良了蒸汽機,比老式蒸汽機節(jié)省2/3的煤炭。于是人們歡呼:煤炭消耗將從此大大減少。但實際情況恰恰相反,英國經(jīng)濟學(xué)家杰文斯發(fā)現(xiàn),蒸汽機效率提高10倍的同時,煤炭消耗量不但沒有下降,反而上升了100倍。因為蒸汽機效率提升后,原來用不起煤炭的人,覺得自己用得起了,于是紛紛辦廠。工廠數(shù)量激增,反而引起煤炭用量的劇烈反彈。這就是著名的“杰文斯悖論”。

英偉達的顯卡同理。DeepSeek大大提升了GPU的使用效率。這在短期內(nèi),可能會導(dǎo)致GPU的用量下降。但很快,就會有更多人因此加入模型訓(xùn)練陣營,從而導(dǎo)致顯卡的需求激增。果然。懵了的納斯達克,第二天就清醒了過來。英偉達股票回漲了8%?;剡^神來后,在一片贊嘆聲中,也逐漸出現(xiàn)了各種質(zhì)疑和批評。比如:蒸餾。

蒸餾美國白宮顧問David Sacks公開表示,有“實質(zhì)性證據(jù)”證明,中國AI公司DeepSeek“蒸餾”(distill)了OpenAI模型。他把這種“蒸餾”行為,比作“偷竊”。嗯……打不過,就誣陷嗎?“蒸餾”這個指控,很嚴重啊。首先解釋一下,什么是“蒸餾”?有兩個模型。一個老師模型(teacher model),一個學(xué)生模型(student model)。學(xué)生不斷向老師提問,并把“問題-答案”記錄下來。然后用這些“問題-答案”的數(shù)據(jù),來訓(xùn)練學(xué)生,從而讓學(xué)生擁有和老師非常接近的知識和能力。這就叫:蒸餾。

學(xué)生向老師學(xué)習(xí),也沒什么問題吧?是的,學(xué)習(xí)是沒什么問題。但是,ChatGPT的用戶協(xié)議明確寫著,不允許用我的模型,來訓(xùn)練新的模型,尤其是訓(xùn)練用來和我競爭的模型。也就是說,禁止蒸餾。用ChatGPT,就要遵守ChatGPT的使用協(xié)議,這是誠信問題。另外,牛頓花30年創(chuàng)造了萬有引力定律,我花3天學(xué)會了萬有引力定律。雖然結(jié)果是,我們都懂了萬有引力定律,但我不能用我的3天,去嘲笑牛頓的30年。所以,David的這個“蒸餾”指控,還是挺重的。那么,你相信DeepSeek蒸餾了ChatGPT的模型嗎?我確實不知道,我希望沒有。因為如果真有,那這篇文章前面所有文字,可能都白寫了。

曼哈頓計劃 2.0

DeepSeek這把火,為何燒疼了硅谷?用游戲科學(xué)的創(chuàng)始人馮驥的話來說:因為這是一個“國運級”的機會。為什么?因為AI不是一項普通的技術(shù)。它是一門能改變幾乎所有其他技術(shù)的技術(shù)。哪個國家能率先實現(xiàn)通用人工智能(AGI),也許誰就能率先解決材料科學(xué)問題(武器更先進),率先解決蛋白質(zhì)問題(醫(yī)療更先進),率先解決可控核聚變問題(能源更先進),以及其他很多問題。這也是為什么,美國人把AI稱作曼哈頓計劃 2.0。上個世紀,美國人發(fā)誓,一定要比德國人先研發(fā)出原子彈。這項計劃,就叫做作:曼哈頓計劃。現(xiàn)在,他們把一定要比中國人先實現(xiàn)通用人工智能。甚至不惜各種封鎖。一起發(fā)展不好嗎?必須對中國封鎖嗎?我用這個問題問AI,中國的DeepSeek給我的回答是:

否。技術(shù)競合催生共贏,封鎖反噬創(chuàng)新生態(tài)。

而ChatGPT給我的回答是:否。但出于競爭與安全考量,美國可能選擇部分領(lǐng)域封鎖以維護技術(shù)優(yōu)勢。

嗯,果然是美國的GPT。


劉潤,著名商業(yè)咨詢顧問,潤米咨詢創(chuàng)始人


 


2009-2025 隆生企業(yè)版權(quán)所有 粵ICP備05072500號
5566视频一区二区三区| 在野外自慰和陌生人做了| 强睡邻居人妻中文字幕| 韩国年轻漂亮岳每4乱理| 国产成人a亚洲精v品无码| 老师黑色双开真丝旗袍恩施视频| 熟妇高潮喷沈阳45熟妇高潮喷| 色喜国模私密浓毛私拍人体图片| 国语熟妇乱人乱a片久久| 村长用力挺进她的花苞啥电视| 女人高潮叫床污话| 夜躁狠狠综合亚洲色噜噜狠狠| 久久精品国产99国产精品导航| 高潮时粗俗不堪入耳的话| 亚洲精品久久久久一区二区三区| porno日本| 花火视频影视大全免费观看| 99re6热在线精品视频播放| 精品无码久久久久久国产| 国产精品久久777777| 樱桃视频影院在线播放| 啊灬啊灬啊灬免费毛片| 美国色情巜肉欲横流| 欧美18videosex极品| 实拍各种胸走光见奶头| 丰满多毛的大隂户乱| 阿娇跪下吃j8图片| 欧美在线香蕉在线视频| 小少妇bbbbbbbbbbbb| 国产粉嫩小泬在线观看泬| 性夜影院爽黄a爽免费看不卡| 苍井空波多野结衣aa片| 亚洲精品无码一区二区三区网雨| 男生女生向前冲第六季| 亚洲av无码一区二区三区在线观看| 妻子年轻出轨老了老公要离婚| 久久夜色精品国产噜噜亚洲av| 国产成人精品一区二区三区不卡| 亚洲视频一区| 美女18禁一区二区三区视频| 上司人妻互换hd无码中文字幕|