大模型與人工智能區(qū)別:以前的模型大都是弱人工智能,像阿爾法狗只能下圍棋,而各種識別產(chǎn)品也只能完成一個(gè)任務(wù)。這些模型之間是隔離的不能互相支撐。而大模型則通過擴(kuò)大模型的參數(shù)規(guī)模,并通過大量數(shù)據(jù)的訓(xùn)練,來支撐所有人工智能的任務(wù)。
大模型就是一種參數(shù)規(guī)模非常大的人工神經(jīng)網(wǎng)絡(luò)。因?yàn)閰?shù)足夠大之后它能力非常強(qiáng),所以在很多任務(wù)上都表現(xiàn)出非常好的能力。
因?yàn)榇竽P蛯W(xué)習(xí)了非常多的知識,經(jīng)過了非常多的數(shù)據(jù)訓(xùn)練,這樣就具有了非常好的通用性。包括像我們?nèi)粘I钪薪?jīng)常見到的各種人工智能產(chǎn)品,比如說人臉識別、對話機(jī)器人,等等。
因?yàn)榇竽P偷娜萘糠浅4?、能力非常?qiáng),所以它把所有的任務(wù)都合在一起,用一個(gè)模型來提供非常多的任務(wù)的支撐,就是我們?nèi)斯ぶ悄苓@個(gè)領(lǐng)域所謂的通用人工智能,所以它展示出來通用人工智能一個(gè)非常好的前景。
人工智能大模型的類型
大模型可以分為兩類,通用大模型和垂直大模型。通用大模型,基礎(chǔ)大模型,擅長處理多種任務(wù),是行業(yè)技術(shù)的制高點(diǎn),推動產(chǎn)業(yè)革命。如GPT系列就是通用模型。訓(xùn)練通用大模型的參數(shù)規(guī)模大,需要強(qiáng)大的算力支撐,通常是頭部企業(yè)的兵家必爭之地。
國內(nèi)科技、互聯(lián)網(wǎng)巨頭紛紛布局,百度的文心一言、阿里的通義千問大模型、騰訊的混元大模型、科大訊飛的星火認(rèn)知大模型、商湯科技的日日新大模型等都是。
垂直大模型,行業(yè)大模型,是大模型應(yīng)用落地的重要形式?;谕ㄓ么竽P瓦M(jìn)行微調(diào),通過訓(xùn)練專業(yè)數(shù)據(jù),向各行各業(yè)等多個(gè)場景提供更加精準(zhǔn)、高效的解決方案。比如華為盤古大模型就是針對行業(yè)提供專業(yè)大模型,已經(jīng)初步運(yùn)用在政務(wù)、金融、鐵路、氣象、煤礦等領(lǐng)域。
國際上,除了ChatGPT外,還有Llama2,是Meta與微軟聯(lián)手推出的開源大模型,包含70億參數(shù)、130億參數(shù)、700億參數(shù)三個(gè)規(guī)模;其訓(xùn)練數(shù)據(jù)快速增加,接受了2萬億tokens的訓(xùn)練。
推薦閱讀:
本文內(nèi)容不用于商業(yè)目的,如涉及知識產(chǎn)權(quán)問題,請權(quán)利人聯(lián)系SPASVO小編(021-60725088-8054),我們將立即處理,馬上刪除。