您現(xiàn)在的位置是:知識(shí) >>正文
轻量化小模型兴起,中小企业也能搭上AI“快车”
知識(shí)854人已圍觀
簡(jiǎn)介
低成本、上線快、易調(diào)試,可在特定任務(wù)上反超通用大模型
輕量化小模型興起,中小企業(yè)也能搭上AI“快車(chē)”
閱讀提示
隨著人工智能快速發(fā)展迭代,一些企業(yè)開(kāi)始押注小模型。相較大模型,低成本、上線快、易調(diào)試的小模型,以更高的性?xún)r(jià)比為中小企業(yè)和個(gè)人用戶提供了打開(kāi)人工智能大門(mén)的鑰匙。
近兩年,人工智能快速發(fā)展迭代,大語(yǔ)言模型如雨后春筍般涌現(xiàn),文本生成、文生圖、語(yǔ)音處理、代碼處理、視頻處理等生成式人工智能走進(jìn)人們的生活。同時(shí),一些企業(yè)開(kāi)始發(fā)力研發(fā)可在電腦、手機(jī)端訓(xùn)練的輕量化小模型。
“我們需要高鐵、飛機(jī)、游輪等大型交通工具,也需要私家轎車(chē)、公交車(chē),以及摩托車(chē)、自行車(chē)等小型交通工具。因?yàn)樵诓煌瑘?chǎng)景下,不同人群有不同需求。”在青島自然語(yǔ)義公司聯(lián)合創(chuàng)始人、首席架構(gòu)師孫燕群看來(lái),滿足特定市場(chǎng)的需求,是專(zhuān)而精的小模型興起的重要原因及其存在的價(jià)值。
今年3月,自然語(yǔ)義研發(fā)的Euler模型通過(guò)中央網(wǎng)信辦生成式人工智能服務(wù)備案。不同于大模型動(dòng)輒千億級(jí)的參數(shù)量,Euler的參數(shù)量只有2.5B(25億),是典型的輕量化小模型。相較于大模型,小模型有何特點(diǎn)?應(yīng)用前景如何?記者對(duì)此進(jìn)行了采訪。
低成本、易調(diào)試的端側(cè)小模型興起
關(guān)于小模型,目前并沒(méi)有明確定義。孫燕群表示,在行業(yè)內(nèi),參數(shù)量低于100B的模型就算比較小的模型。在實(shí)際應(yīng)用時(shí),要想在筆記本電腦端實(shí)現(xiàn)微調(diào),模型參數(shù)量一般在3B左右。
相較大模型,小模型在算力消耗、使用成本方面更具優(yōu)勢(shì)。具體來(lái)說(shuō),一是訓(xùn)練和推理所需的硬件資源較少,使得成本較低;二是使用更便捷,可在手機(jī)、電腦、物聯(lián)網(wǎng)設(shè)備等計(jì)算場(chǎng)景中實(shí)時(shí)運(yùn)行;三是結(jié)構(gòu)簡(jiǎn)單,開(kāi)發(fā)者能快速定位問(wèn)題,易于調(diào)試。
記者了解到,隨著大模型的比拼日益激烈,一些企業(yè)開(kāi)始押注小模型。2024年8月,微軟和英偉達(dá)就相繼發(fā)布過(guò)小型語(yǔ)言模型。國(guó)內(nèi)不少企業(yè)也開(kāi)始研發(fā)在“斷網(wǎng)、弱網(wǎng)”環(huán)境下,讓各種智能終端具備自主思考能力的端側(cè)小模型。例如,在今年3月舉辦的中關(guān)村論壇年會(huì)期間,北京的面壁智能公司就發(fā)布了應(yīng)用于汽車(chē)智能座艙的純端側(cè)超級(jí)智能助手。今年1月,廣東佛山移動(dòng)牽頭聯(lián)合40家單位成立佛山市AI小模型產(chǎn)業(yè)聯(lián)合體,致力于通過(guò)人工智能小模型提供個(gè)性化服務(wù),助力企業(yè)完成智能化升級(jí)。
“小模型讓我們實(shí)現(xiàn)了與科技巨頭們的錯(cuò)位競(jìng)爭(zhēng)。”提到小模型的具體應(yīng)用場(chǎng)景,孫燕群舉例說(shuō),Euler通過(guò)備案后,已經(jīng)開(kāi)始面向中小企業(yè)和個(gè)人用戶提供服務(wù)。如與山東某市級(jí)檔案館合作,上線了檔案模型;與青島當(dāng)?shù)匾患覂x器儀表設(shè)備公司合作,開(kāi)發(fā)了內(nèi)網(wǎng)技術(shù)相關(guān)的模型。
退而求其次后的“主動(dòng)作為”
“客觀來(lái)說(shuō),大模型的能力強(qiáng)于小模型,一個(gè)參數(shù)量2.5B的模型無(wú)論如何都不可能超過(guò)200B模型的算力。”孫燕群直言,這也是大公司都在做千億級(jí)模型的原因。模型小,神經(jīng)網(wǎng)絡(luò)參數(shù)就少,容納的知識(shí)量不夠,“體現(xiàn)在文本生成上,就是容易出現(xiàn)上下文不連貫的情況”。
自然語(yǔ)義最初的目標(biāo)并不是小模型。2019年底,該公司考慮要做大模型,但由于發(fā)展方向不明朗,同時(shí)在購(gòu)買(mǎi)高算力GPU上面臨資金和貨源壓力,因此未能實(shí)施。
“沒(méi)想到,僅過(guò)了兩年時(shí)間,國(guó)外的大模型就發(fā)布了。”孫燕群回憶說(shuō),后來(lái)隨著越來(lái)越多大企業(yè)涌入大模型賽道,作為基礎(chǔ)硬件的高算力GPU價(jià)格水漲船高。“那段時(shí)間,聽(tīng)說(shuō)哪里有GPU,我們就坐飛機(jī)去買(mǎi),常常是提前交了定金也不一定能買(mǎi)到。”最終,公司用10多臺(tái)設(shè)備組成一個(gè)算力集群,能支撐做出7B參數(shù)的模型。
為了在現(xiàn)有設(shè)備基礎(chǔ)上盡可能提高參數(shù),自然語(yǔ)義公司工程師經(jīng)過(guò)頭腦風(fēng)暴,想出了新的分詞方式,以及將向量計(jì)算從實(shí)數(shù)空間轉(zhuǎn)換到復(fù)空間等各種辦法。“經(jīng)過(guò)模型訓(xùn)練,這些技術(shù)都達(dá)到了比較好的效果,能讓一個(gè)3B參數(shù)的模型,達(dá)到了150B參數(shù)模型60%左右的能力。”孫燕群表示。
中國(guó)信息通信研究院人工智能研究所副總工程師王蘊(yùn)韜告訴記者,小模型之所以能在“瘦身”后仍保持可觀性能,得益于一系列成熟的模型壓縮與高效架構(gòu)技術(shù),包括剪枝、量化、知識(shí)蒸餾、設(shè)計(jì)先天高效的網(wǎng)絡(luò)架構(gòu)等。
讓“小身材”跑出“大能量”
“小模型發(fā)展大有可為。”在王蘊(yùn)韜看來(lái),未來(lái)面向特定應(yīng)用場(chǎng)景的小模型,潛力將會(huì)進(jìn)一步釋放。以AI終端為代表的應(yīng)用形態(tài)及產(chǎn)品服務(wù),將成為小模型釋放大能力的主戰(zhàn)場(chǎng)。
關(guān)于小模型的應(yīng)用前景,王蘊(yùn)韜進(jìn)一步解釋?zhuān)皇菫殡x線辦公、文檔摘要、私密對(duì)話等場(chǎng)景鋪平道路;二是隨著處理器架構(gòu)和神經(jīng)處理單元技術(shù)的應(yīng)用,手機(jī)、車(chē)載和物聯(lián)網(wǎng)設(shè)備將成為小模型的天然舞臺(tái);三是在垂直領(lǐng)域與“專(zhuān)精特新”行業(yè),如金融、醫(yī)療、法律、教育等已出現(xiàn)6B及以下參數(shù)的定制模型,成本低、上線快,可在特定任務(wù)上反超通用大模型。
“市場(chǎng)關(guān)心的是能否解決實(shí)際問(wèn)題,不關(guān)心背后模型細(xì)節(jié),能夠與場(chǎng)景深度結(jié)合,擁有行業(yè)知識(shí),尤其是可信的小模型至關(guān)重要。”王蘊(yùn)韜說(shuō)。
從用戶端來(lái)看,在實(shí)際應(yīng)用中,小模型的性?xún)r(jià)比優(yōu)勢(shì)也十分明顯。北京某互聯(lián)網(wǎng)公司算法工程師張先生向記者表示,在現(xiàn)有技術(shù)條件下,想要在本地部署大模型存在一定難度。“專(zhuān)業(yè)GPU芯片價(jià)格太高,無(wú)法應(yīng)用到低價(jià)格的終端上,如手機(jī)、機(jī)器人等配備的芯片就無(wú)法撐起大模型。另外,這些終端所配備的電池,往往也支撐不了高性能芯片的耗電等。”張先生表示,這些硬件性能有限的終端,更適合小模型施展。
王蘊(yùn)韜分析認(rèn)為,未來(lái)將是大小模型混合的系統(tǒng)范式。“云端大模型負(fù)責(zé)通用推理,端側(cè)小模型承擔(dān)即時(shí)響應(yīng)與私域數(shù)據(jù)處理。”他還強(qiáng)調(diào),小模型并非“大模型的低配版”,而是面向資源受限環(huán)境與專(zhuān)用任務(wù)的高性?xún)r(jià)比解法。通過(guò)配合端云混合部署和行業(yè)數(shù)據(jù)精調(diào),企業(yè)完全可以讓“小身材”跑出“大能量”,在AI商業(yè)落地的下一程中獲得確定性收益。(工人日?qǐng)?bào) 記者 陶穩(wěn)) 【編輯:惠小東】 ...
Tags:
相關(guān)文章
哪吒GT,17.88萬(wàn)元,圓你的超跑夢(mèng)
知識(shí)...
【知識(shí)】
閱讀更多事故率太高 自動(dòng)駕駛Cruise公司:減少無(wú)人駕駛出租車(chē)投放!
知識(shí)無(wú)人駕駛是未來(lái)汽車(chē)的發(fā)展方向,一般來(lái)說(shuō),這項(xiàng)科技會(huì)隨著技術(shù)與算法的不斷推進(jìn),在使用體驗(yàn)上也會(huì)有持續(xù)性的提升。但是,在商業(yè)化運(yùn)營(yíng)領(lǐng)域,無(wú)人駕駛出租車(chē)卻掉鏈子了。最近,通用汽車(chē)旗下的自動(dòng)駕駛公司Cruis ...
【知識(shí)】
閱讀更多2023P&I丨影像人的狂歡盛宴,精彩明年再約!
知識(shí)8月12日,第24屆上海國(guó)際攝影器材和數(shù)碼影像展正式在上海新國(guó)際博覽中心落下帷幕。為時(shí)3天的P&I展會(huì)再度成為國(guó)內(nèi)外影像廠商傾力參與的行業(yè)盛會(huì),圍繞影像前沿技術(shù)賦能行業(yè)發(fā)展,促進(jìn)長(zhǎng)三角攝影文化 ...
【知識(shí)】
閱讀更多
熱門(mén)文章
最新文章
友情鏈接
- Redmi Book 14筆記本預(yù)熱,重約1.37kg主打輕薄,首發(fā)價(jià)3699元起
- 吉利銀河L7官宣將于5月31日上市 預(yù)計(jì)售價(jià)15
- 采用三排6座設(shè)計(jì) 大眾ID.Buzz長(zhǎng)軸版信息曝光
- vivo S17系列官宣:1.5K雙曲屏,后置升級(jí)柔光環(huán)
- 全新埃爾法路試照片曝光 今年6月底上市
- 索尼發(fā)布ZV
- 續(xù)航488公里 加速3.3秒 奧迪RS e
- OPPO K11x手機(jī)官宣,后置1億像素主攝,5000mAh電池+67W快充
- 勞斯萊斯CEO表示:現(xiàn)在訂購(gòu)閃靈 將于2025年才能交車(chē)
- Redmi Book 14筆記本預(yù)熱,重約1.37kg主打輕薄,首發(fā)價(jià)3699元起
- 舞劇《醒·獅》上演 點(diǎn)燃羊城夏夜的藝術(shù)激情
- 芝加哥發(fā)生飛車(chē)槍擊案致4死14傷
- 中國(guó)科協(xié)年會(huì)舉辦防彈防爆復(fù)合材料最新進(jìn)展與應(yīng)用技術(shù)專(zhuān)題論壇
- 東西問(wèn)|皮特·赫爾曼:人工智能,是人權(quán)進(jìn)步的助推器還是絆腳石?
- 2025年中國(guó)原生民歌節(jié)在內(nèi)蒙古啟幕
- 中新健康丨為什么胖人更招蚊子?
- 商務(wù)部公布對(duì)原產(chǎn)于歐盟的進(jìn)口相關(guān)白蘭地反傾銷(xiāo)調(diào)查的最終裁定
- 邁阿密?chē)?guó)際四球不敵巴黎圣日耳曼 無(wú)緣世俱杯八強(qiáng)
- 七大類(lèi)別全面覆蓋 2025“北京大視聽(tīng)”網(wǎng)絡(luò)視聽(tīng)精品發(fā)布
- 探訪廣州南站高鐵寵物托運(yùn)服務(wù):“攜寵出行”更便捷