久久精品九九_久久中文精品_欧美日韩中出_精品视频一区二区三区免费

登錄湛江云媒賬號

火遍全網的DeepSeek創始人梁文鋒來自吳川!更多細節披露

2025-01-28 10:49 來源:湛江云媒 作者:文/記者林明聰

深度求索(DeepSeek)創始人梁文鋒。圖片來源央視網

“真沒想到,這幾天火遍全網的DeepSeek創始人梁文鋒,來自咱們湛江吳川!”1月27日,家住吳川梅菉的陳先生在朋友圈這樣說。

近日,中共中央政治局常委、國務院總理李強主持召開專家、企業家和教科文衛體等領域代表座談會,聽取對《政府工作報告(征求意見稿)》的意見建議。其中,來自湛江吳川的AI初創公司深度求索(DeepSeek)創始人梁文鋒出席座談會,并現場發言。

此前的2024年12月,梁文鋒和團隊開發的大模型“DeepSeek-V3”發布,這款大模型以低成本、高性能以及開源模式迅速轟動硅谷、震驚全球,被海外稱作“來自東方的神秘力量”。

刷屏湛江人朋友圈的梁文鋒,有著怎樣的成長經歷?1月27日,記者到吳川進行了深入尋訪。

“他自小成績優異,對科技懷有濃厚興趣”

“梁文鋒的小學時光是在吳川城區梅菉小學度過的,這里也是他科技夢想起航的地方。”據曾在梅菉小學任教并擔任過梁文鋒班主任的李先生講述,梁文鋒的父母均為小學教師,他的父親在梅菉小學執教。“我記得梁文鋒在梅菉小學六(3)班擔任學習委員,成績在班上名列前茅。”李先生說,1996年,梁文鋒以優異的成績從梅菉小學直升至吳川一中,成為當時整個梅菉小學僅有的4名直升生之一。

李先生回憶說,梁文鋒在學習上有幾大特點:一是課堂高度專注,他總能聚精會神地聆聽老師的每一句話,生怕錯過任何一個知識點;二是積極回答問題,每當老師拋出問題,他總是第一個舉手回答;三是喜歡挑戰難題,具有刻苦鉆研的精神;四是善于總結學習方法,他總能迅速歸納老師的授課內容,形成自己的知識體系。

李先生說,除了學業上的優異表現,梁文鋒還展現出了對科技的濃厚興趣。課后,他積極參與科技小活動,熱衷于制作航空、航海模型,動手實踐的能力比較強。印象中,梁文鋒在小學三、四年級的時候就愛好集郵,他集郵有一個特點是“以郵養郵”,就是收到郵票后拿去賣,賣后又集回,基本不用花父親的錢。

梁文鋒初中和高中階段均就讀于吳川一中,一直是學校里的“尖子生”,并在數學學科表現出極大天賦,初中時期就學完了高中數學,甚至開始學大學的數學,數學思維能力很強。據梁文鋒的一位初三老師回憶,初中時期的梁文鋒性格很文靜,但不是書呆子,他在學習上很有自己的“一套方法”,很注重勞逸結合,像是很輕易就可以學好每一個學科。

2002年,17歲的梁文鋒參加全國普通高考,以理科816分、吳川市第一中學“高考狀元”的成績考上浙江大學本科電子信息工程專業,于2007年考上浙江大學信息與通信工程專業研究生。在大學期間,梁文鋒就與同學一起開始積累市場行情數據和探索全自動量化交易。

“他很有前瞻的眼光,完全是白手起家”

“讀書的時候,梁文鋒就經常做課題實驗,學習刻苦,也熱愛足球。”據梁文鋒的一位高中同學兼好友陳先生介紹,大學時期,梁文鋒讀的AI工程專業前景并不明朗,但他很有前瞻的眼光。他說,梁文鋒完全是白手起家,創業以來還做過全自動繡花機等產品,不斷探索總結溯源。

陳先生還表示,梁文鋒的衣著打扮和為人處世都非常低調,淳樸有善心,此前以個人名義捐了很多錢。

記者查詢官方信息了解到,DeepSeek,全稱“杭州深度求索人工智能基礎技術研究有限公司”,成立于2023年7月,由知名量化資管巨頭幻方量化創立。在硅谷,DeepSeek很早就被稱作“來自東方的神秘力量”,也是網上熱議的“杭州六小龍”之一。

真正讓DeepSeek火出圈的是2024年12月26日,這家公司宣布上線并同步開源的DeepSeek-V3模型,并公布了長達53頁的訓練和技術細節。它以1/11的算力、僅2000個GPU芯片訓練出性能超越GPT-4o的大模型。其總訓練成本只有557.6萬美元,而GPT-4o的約為1億美元,使用25000個GPU芯片。雙方的成本至少是10倍的差距。

在性能上,DeepSeek-V3在數學、代碼能力和中文知識問答方面還超過了ChatGPT-4o。國外獨立測評機構Artificial Analysis測試后,發出了“超越了迄今為止所有開源模型”的驚嘆;Meta科學家田淵棟感慨:“這是非常偉大的工作。”“性價比”是商業社會中的制勝法寶之一,DeepSeek也因創新的模型架構和史無前例的性價比被稱為“大模型界的拼多多”,引發字節、阿里、百度等大廠的大模型價格大戰。

另據悉,早在2015年,30歲的梁文鋒和朋友一起創辦了杭州幻方科技有限公司,立志成為世界頂級的量化對沖基金。2016年10月,幻方量化推出第一個AI模型,第一份由深度學習生成的交易倉位上線執行。到2017年底,幾乎所有的量化策略都采用AI模型計算。2023年5月,38歲的梁文鋒宣布做通用人工智能(AGI)。同年7月,他正式創辦杭州深度求索人工智能基礎技術研究有限公司,就是DeepSeek公司,專注于AI大模型的研究和開發。從公開的工作經歷和職業生涯來看,梁文鋒在量化投資和高性能計算領域具有深厚的背景和豐富的經驗,創業范疇橫跨金融和人工智能領域。

梁文鋒此前接受采訪時曾表示,回望過去30多年IT浪潮,中國基本沒有參與到真正的技術創新里。被外界視為理想主義者的梁文鋒稱,“我們覺得現在最重要的是參與到全球創新的浪潮里去。”他說,“過去很多年,中國公司習慣了別人做技術創新,我們拿過來做應用變現,但這并非一種理所當然。這一波浪潮里,我們的出發點,就不是趁機賺一筆,而是走到技術的前沿,去推動整個生態發展。”

編輯:王聞聞
值班主任:蘇碧銀
值班編委:林小軍
評論一下
評論 0人參與,0條評論
還沒有評論,快來搶沙發吧!
最熱評論
最新評論
已有0人參與,點擊查看更多精彩評論

湛圖片

  • 湛江西站迎來節前春運客流高峰
  • “蛇年迎春花展”已上線  市區公園花綻放、年味濃
  • 雷劇節目精彩亮相!《粵港澳大灣區春節晚會》在廣東衛視播出
  • 村民住上“新農房” 歡歡喜喜迎新年
  • 新春走基層丨祖國大陸最南端的海警故事
  • 蛇年春節漸近,霞山觀海長廊年花市場熱鬧非凡
    熱點新聞排行
  • 月點擊
  • 周點擊
  • 日點擊
  •   
數字報