深度求索(DeepSeek)創始人梁文鋒。圖片來源央視網
“真沒想到,這幾天火遍全網的DeepSeek創始人梁文鋒,來自咱們湛江吳川!”1月27日,家住吳川梅菉的陳先生在朋友圈這樣說。
近日,中共中央政治局常委、國務院總理李強主持召開專家、企業家和教科文衛體等領域代表座談會,聽取對《政府工作報告(征求意見稿)》的意見建議。其中,來自湛江吳川的AI初創公司深度求索(DeepSeek)創始人梁文鋒出席座談會,并現場發言。
此前的2024年12月,梁文鋒和團隊開發的大模型“DeepSeek-V3”發布,這款大模型以低成本、高性能以及開源模式迅速轟動硅谷、震驚全球,被海外稱作“來自東方的神秘力量”。
刷屏湛江人朋友圈的梁文鋒,有著怎樣的成長經歷?1月27日,記者到吳川進行了深入尋訪。
“他自小成績優異,對科技懷有濃厚興趣”
“梁文鋒的小學時光是在吳川城區梅菉小學度過的,這里也是他科技夢想起航的地方。”據曾在梅菉小學任教并擔任過梁文鋒班主任的李先生講述,梁文鋒的父母均為小學教師,他的父親在梅菉小學執教。“我記得梁文鋒在梅菉小學六(3)班擔任學習委員,成績在班上名列前茅。”李先生說,1996年,梁文鋒以優異的成績從梅菉小學直升至吳川一中,成為當時整個梅菉小學僅有的4名直升生之一。
李先生回憶說,梁文鋒在學習上有幾大特點:一是課堂高度專注,他總能聚精會神地聆聽老師的每一句話,生怕錯過任何一個知識點;二是積極回答問題,每當老師拋出問題,他總是第一個舉手回答;三是喜歡挑戰難題,具有刻苦鉆研的精神;四是善于總結學習方法,他總能迅速歸納老師的授課內容,形成自己的知識體系。
李先生說,除了學業上的優異表現,梁文鋒還展現出了對科技的濃厚興趣。課后,他積極參與科技小活動,熱衷于制作航空、航海模型,動手實踐的能力比較強。印象中,梁文鋒在小學三、四年級的時候就愛好集郵,他集郵有一個特點是“以郵養郵”,就是收到郵票后拿去賣,賣后又集回,基本不用花父親的錢。
梁文鋒初中和高中階段均就讀于吳川一中,一直是學校里的“尖子生”,并在數學學科表現出極大天賦,初中時期就學完了高中數學,甚至開始學大學的數學,數學思維能力很強。據梁文鋒的一位初三老師回憶,初中時期的梁文鋒性格很文靜,但不是書呆子,他在學習上很有自己的“一套方法”,很注重勞逸結合,像是很輕易就可以學好每一個學科。
2002年,17歲的梁文鋒參加全國普通高考,以理科816分、吳川市第一中學“高考狀元”的成績考上浙江大學本科電子信息工程專業,于2007年考上浙江大學信息與通信工程專業研究生。在大學期間,梁文鋒就與同學一起開始積累市場行情數據和探索全自動量化交易。
“他很有前瞻的眼光,完全是白手起家”
“讀書的時候,梁文鋒就經常做課題實驗,學習刻苦,也熱愛足球。”據梁文鋒的一位高中同學兼好友陳先生介紹,大學時期,梁文鋒讀的AI工程專業前景并不明朗,但他很有前瞻的眼光。他說,梁文鋒完全是白手起家,創業以來還做過全自動繡花機等產品,不斷探索總結溯源。
陳先生還表示,梁文鋒的衣著打扮和為人處世都非常低調,淳樸有善心,此前以個人名義捐了很多錢。
記者查詢官方信息了解到,DeepSeek,全稱“杭州深度求索人工智能基礎技術研究有限公司”,成立于2023年7月,由知名量化資管巨頭幻方量化創立。在硅谷,DeepSeek很早就被稱作“來自東方的神秘力量”,也是網上熱議的“杭州六小龍”之一。
真正讓DeepSeek火出圈的是2024年12月26日,這家公司宣布上線并同步開源的DeepSeek-V3模型,并公布了長達53頁的訓練和技術細節。它以1/11的算力、僅2000個GPU芯片訓練出性能超越GPT-4o的大模型。其總訓練成本只有557.6萬美元,而GPT-4o的約為1億美元,使用25000個GPU芯片。雙方的成本至少是10倍的差距。
在性能上,DeepSeek-V3在數學、代碼能力和中文知識問答方面還超過了ChatGPT-4o。國外獨立測評機構Artificial Analysis測試后,發出了“超越了迄今為止所有開源模型”的驚嘆;Meta科學家田淵棟感慨:“這是非常偉大的工作。”“性價比”是商業社會中的制勝法寶之一,DeepSeek也因創新的模型架構和史無前例的性價比被稱為“大模型界的拼多多”,引發字節、阿里、百度等大廠的大模型價格大戰。
另據悉,早在2015年,30歲的梁文鋒和朋友一起創辦了杭州幻方科技有限公司,立志成為世界頂級的量化對沖基金。2016年10月,幻方量化推出第一個AI模型,第一份由深度學習生成的交易倉位上線執行。到2017年底,幾乎所有的量化策略都采用AI模型計算。2023年5月,38歲的梁文鋒宣布做通用人工智能(AGI)。同年7月,他正式創辦杭州深度求索人工智能基礎技術研究有限公司,就是DeepSeek公司,專注于AI大模型的研究和開發。從公開的工作經歷和職業生涯來看,梁文鋒在量化投資和高性能計算領域具有深厚的背景和豐富的經驗,創業范疇橫跨金融和人工智能領域。
梁文鋒此前接受采訪時曾表示,回望過去30多年IT浪潮,中國基本沒有參與到真正的技術創新里。被外界視為理想主義者的梁文鋒稱,“我們覺得現在最重要的是參與到全球創新的浪潮里去。”他說,“過去很多年,中國公司習慣了別人做技術創新,我們拿過來做應用變現,但這并非一種理所當然。這一波浪潮里,我們的出發點,就不是趁機賺一筆,而是走到技術的前沿,去推動整個生態發展。”