如果讓你說出今年人工智能領域最轟動的一件事情,那大部分人的答案應該是DeepSeek的橫空出世。今年2月初,DeepSeek在140個國家和地區(qū)的應用市場下載排行榜同時登頂,并以開源策略充分展現(xiàn)其技術自信。
開源大模型是指由研究機構或公司開發(fā)并公開發(fā)布的大規(guī)模預訓練模型,其源代碼、參數(shù)權重甚至是訓練數(shù)據(jù)(或數(shù)據(jù)生成方法)都開放透明,任何人都可以訪問、使用、修改和分發(fā)。
“DeepSeek是一款完完全全的開源模型,將各個環(huán)節(jié)包括數(shù)據(jù)、代碼、權重、推理鏈的運行思路、工程構建方法都開放出來,讓更多人愿意參與進去?!辟惖涎芯吭盒跑浰浖a(chǎn)業(yè)研究室副主任黃文鴻解釋,就好比建造一所房子,真正的開源不僅公開圖紙、材料、房屋結構,還會清晰地告訴你,每一步應該建什么,有了這些信息你就可以1比1還原房子。由此可見,DeepSeek開放程度之高前所未有,這也是其一經(jīng)發(fā)布就產(chǎn)生巨大影響的原因之一。
降低生態(tài)構建成本
DeepSeek對于我國人工智能產(chǎn)業(yè)發(fā)展最大的意義在于,其構建了基于自主研發(fā)基座大模型的開發(fā)生態(tài),從軟硬件的適配到應用推廣甚至產(chǎn)品宣傳,都是全球廠商和開發(fā)者共同完成的,極大降低了生態(tài)建設成本。例如,微軟、英偉達、亞馬遜、英特爾、AMD等全球科技巨頭相繼宣布上線了DeepSeek開源模型推理服務,國內廠商諸如騰訊云、阿里云均支持DeepSeek的一鍵部署和調用。
“這就像安卓操作系統(tǒng)是開源軟件一樣,因為開源具有良好的適配性,手機、芯片、智能家居等各類廠商紛紛接入,讓安卓成為移動互聯(lián)網(wǎng)時代能夠與蘋果IOS系統(tǒng)并駕齊驅的通用技術底座?!秉S文鴻告訴記者,互聯(lián)網(wǎng)企業(yè)、車企、三大運營商等紛紛接入DeepSeek,后續(xù)會讓很多具體應用部署在DeepSeek基座模型上,將迅速提高其用戶數(shù)量和市占率。
除DeepSeek以外,我國還有不少開源模型在業(yè)界引起廣泛關注。就在DeepSeek-R1發(fā)布前,上海AI創(chuàng)業(yè)公司MiniMax發(fā)布了其開源模型MiniMax-01,首次采用線性注意力機制,實現(xiàn)了技術突破;阿里巴巴最新開源的通義千問QwQ-32B推理模型,在數(shù)學、代碼及通用能力的多項權威評測集中表現(xiàn)良好,穩(wěn)居全球最大AI開源社區(qū)Hugging Face趨勢榜榜首,成為當下最受歡迎的開源大模型之一。
“這些都彰顯了開源對技術生態(tài)的推動作用,吸引了業(yè)內各方支持,形成良好的技術分享氛圍?!秉S文鴻認為,信息技術領域具有強者恒強的發(fā)展規(guī)律,我國在開源模型上是有先發(fā)優(yōu)勢的,必須進一步筑牢技術“護城河”。但目前各行各業(yè)真正懂開源模型的人才并不多,基于開源大模型的下游企業(yè),以及做工程優(yōu)化、模型調優(yōu)的研發(fā)人員相對較少,高校應該培養(yǎng)更多相關人才,共同促成“創(chuàng)新—共享—再創(chuàng)新”,助力產(chǎn)業(yè)生態(tài)更加完備。
阿里云高級總監(jiān)朱迅垚認為,開源理念在產(chǎn)業(yè)界還沒有形成廣泛共識,但DeepSeek和通義千問的成功會讓大家逐步認識到,開源模型將成為推動我國人工智能發(fā)展最強勁的引擎。下一步,建議從國家到地方再到企業(yè),以更加積極的態(tài)度擁抱開源,同時在布局智能算力、構建高質量數(shù)據(jù)集、上云用云等方面加快創(chuàng)新步伐,緊跟世界先進水平。
推動應用落地
DeepSeek發(fā)布以來,各行各業(yè)都在探索將其融入自身業(yè)務場景?!伴_源模型憑借其低成本、高性能、高開放度的技術優(yōu)勢,加速了人工智能在行業(yè)的普及速度。”黃文鴻說。
今年2月,恒生電子大模型應用全面接入DeepSeek,在金融投研、合規(guī)、運營、投行等業(yè)務場景中取得較好效果。例如,在投行業(yè)務中,利用DeepSeek-R1理解能力,可自動解析招股書、盡調報告等復雜文檔,實現(xiàn)財務數(shù)據(jù)校驗、合規(guī)風險提示的秒級響應。
通義千問開源模型Qwen系列更是憑借其多模態(tài)、全尺寸的技術能力,以及由數(shù)量龐大的開發(fā)者和中小企業(yè)匯聚起的良好生態(tài),加快賦能千行百業(yè)。截至目前,阿里已開源200多款模型,包括文本生成模型、視覺理解/生成模型、語音理解/生成模型、文生圖及視頻模型等多模態(tài),覆蓋從0.5B到110B參數(shù)的各類尺寸。
去年4月,中國科學院國家天文臺人工智能工作組發(fā)布了基于Qwen打造的新一代天文大模型“星語3.0”。目前已成功接入國家天文臺興隆觀測站望遠鏡陣列Mini“司天”,可實現(xiàn)自主控制望遠鏡進行觀測、分析觀測結果,智能地給出下一步觀測建議,這是大模型在天文觀測領域的首次應用?!皬念A測蛋白質結構到合成靶向藥物,再到發(fā)現(xiàn)新的病毒種類,大模型與科研相結合帶來了許多突破性成果?!敝煅笀愓f。
DeepSeek也好,通義千問也罷,我國開源模型正以其寬松的開發(fā)許可和低成本的訓練方式,提升人工智能在行業(yè)的應用廣度。
商業(yè)模式仍需明晰
以ChatGPT為代表的閉源模型,其商業(yè)模式被稱為“token(令牌)經(jīng)濟”,即通過向用戶提供API服務,基于token用量計價,然后來賺取利潤。那么,開源模型又是如何盈利的?
對此,黃文鴻向記者分享了幾個案例。Meta公司推出的Llama大模型通過開源可以吸引更多企業(yè)和開發(fā)者加入其生態(tài),為后續(xù)廣告收入創(chuàng)造機會。
市場上還出現(xiàn)了開源閉源并行的模型產(chǎn)品。具體而言,首先開放出來相對基礎的能力,培養(yǎng)用戶使用習慣,而更高性能的模型則需付費使用。還有的開源模型會與云服務綁定售賣,相當于模型是免費的,收取的只是算力費用?!斑@種模式就好比你想用IOS系統(tǒng)就必須配備蘋果手機。再有更相似的案例是,谷歌通過安卓系統(tǒng)吸引用戶,再通過售賣谷歌郵箱、谷歌地圖等增值服務收取費用?!秉S文鴻補充道。
在朱迅垚看來,很多做開源模型的企業(yè)具有濃厚的技術理想主義色彩,他們的初衷未必完全是奔著商業(yè)化去的。“通義千問大模型在全球擁有超過10萬個衍生模型和上億次下載量,這些都是免費提供給用戶的。但正因為開源,大量開發(fā)者被吸引過來,阿里云的模型服務和配套算力服務得到更多開發(fā)者青睞,開發(fā)者跟廠商形成一個‘開源—應用—反饋’的良性循環(huán)?!?/p>
開源模型的發(fā)展仍處于初期階段,如何形成健康成熟的商業(yè)模式業(yè)界仍在探索中?!捌髽I(yè)做開源模型肯定是想盈利的,要摸索出一條正向循環(huán)發(fā)展路徑,在技術普惠和商業(yè)變現(xiàn)間尋找到平衡點,讓產(chǎn)業(yè)鏈上各個環(huán)節(jié)的參與者都能受益,確保開源模式持續(xù)穩(wěn)定運轉下去?!秉S文鴻建議。(李芃達)
(責任編輯:蔡文斌)