2018年,中國(guó)人工智能行業(yè)在基礎(chǔ)資源與技術(shù)領(lǐng)域取得了顯著進(jìn)展,為產(chǎn)業(yè)應(yīng)用的爆發(fā)奠定了堅(jiān)實(shí)基礎(chǔ)。本報(bào)告將深入剖析該年度中國(guó)AI在算力、數(shù)據(jù)、算法及關(guān)鍵使能技術(shù)方面的核心動(dòng)態(tài)與發(fā)展趨勢(shì)。
一、 算力基礎(chǔ):芯片競(jìng)逐與云端協(xié)同
算力是人工智能發(fā)展的引擎。2018年,中國(guó)在AI計(jì)算芯片領(lǐng)域呈現(xiàn)多元化發(fā)展格局。一方面,以英偉達(dá)GPU為代表的通用芯片在數(shù)據(jù)中心訓(xùn)練場(chǎng)景中仍占據(jù)主導(dǎo),國(guó)內(nèi)云服務(wù)商(如阿里云、騰訊云、百度云)大規(guī)模部署,提供了強(qiáng)大的云端AI算力服務(wù)。另一方面,中國(guó)AI芯片設(shè)計(jì)公司迎來(lái)發(fā)展熱潮,寒武紀(jì)、地平線、比特大陸等企業(yè)分別在云端、終端及專用領(lǐng)域推出AI芯片,尋求在特定場(chǎng)景下的性能與能效突破。國(guó)家層面推動(dòng)的先進(jìn)計(jì)算基礎(chǔ)設(shè)施(如超算中心)也開(kāi)始更緊密地與AI計(jì)算融合,形成“超算+智算”的混合算力模式。
二、 數(shù)據(jù)資源:規(guī)模擴(kuò)張與治理挑戰(zhàn)
數(shù)據(jù)是訓(xùn)練AI模型的燃料。2018年,中國(guó)憑借龐大的網(wǎng)民基數(shù)和豐富的應(yīng)用場(chǎng)景,在數(shù)據(jù)資源規(guī)模上持續(xù)領(lǐng)先。互聯(lián)網(wǎng)巨頭、電信運(yùn)營(yíng)商及垂直行業(yè)企業(yè)積累了海量的文本、圖像、語(yǔ)音及用戶行為數(shù)據(jù)。數(shù)據(jù)的價(jià)值釋放面臨兩大關(guān)鍵挑戰(zhàn):一是數(shù)據(jù)孤島問(wèn)題突出,跨企業(yè)、跨行業(yè)的數(shù)據(jù)流通與協(xié)作機(jī)制尚不健全;二是數(shù)據(jù)安全與隱私保護(hù)法規(guī)日趨嚴(yán)格(如《網(wǎng)絡(luò)安全法》的實(shí)施),如何在合規(guī)前提下高效利用數(shù)據(jù)成為行業(yè)共同課題。推動(dòng)數(shù)據(jù)標(biāo)注標(biāo)準(zhǔn)化、發(fā)展隱私計(jì)算技術(shù)(如聯(lián)邦學(xué)習(xí))成為當(dāng)年的重要探索方向。
三、 算法突破:開(kāi)源生態(tài)與創(chuàng)新應(yīng)用
算法是AI系統(tǒng)的靈魂。2018年,中國(guó)AI算法研究在學(xué)術(shù)層面緊跟全球前沿,在計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理等領(lǐng)域論文發(fā)表量位居世界前列。更重要的是,產(chǎn)業(yè)實(shí)踐推動(dòng)了算法的快速落地與迭代。國(guó)內(nèi)科技公司積極擁抱并貢獻(xiàn)于TensorFlow、PyTorch等國(guó)際主流開(kāi)源框架,同時(shí)也在推動(dòng)自主開(kāi)源生態(tài)(如百度的PaddlePaddle)。在應(yīng)用算法層面,基于深度學(xué)習(xí)的目標(biāo)檢測(cè)、語(yǔ)義分割、機(jī)器翻譯、語(yǔ)音合成等技術(shù)成熟度顯著提升,開(kāi)始大規(guī)模集成到安防、金融、醫(yī)療、內(nèi)容創(chuàng)作等具體產(chǎn)品中。遷移學(xué)習(xí)、小樣本學(xué)習(xí)等旨在降低數(shù)據(jù)依賴的新興算法受到更多關(guān)注。
四、 關(guān)鍵使能技術(shù):感知與認(rèn)知的深化
在具體技術(shù)維度,2018年的發(fā)展呈現(xiàn)出從“感知智能”向“認(rèn)知智能”延伸的態(tài)勢(shì)。
- 計(jì)算機(jī)視覺(jué):技術(shù)已高度商業(yè)化,在安防監(jiān)控、手機(jī)解鎖、金融身份認(rèn)證等領(lǐng)域普及,同時(shí)向工業(yè)質(zhì)檢、自動(dòng)駕駛等對(duì)可靠性與精度要求更高的領(lǐng)域滲透。動(dòng)態(tài)識(shí)別、3D視覺(jué)成為熱點(diǎn)。
- 自然語(yǔ)言處理:在智能客服、搜索引擎優(yōu)化等應(yīng)用驅(qū)動(dòng)下持續(xù)進(jìn)步,預(yù)訓(xùn)練語(yǔ)言模型(如BERT,同年發(fā)布)開(kāi)始展現(xiàn)潛力,為后續(xù)的突破埋下伏筆。語(yǔ)義理解的深度仍是攻堅(jiān)重點(diǎn)。
- 語(yǔ)音技術(shù):智能音箱市場(chǎng)的爆發(fā)帶動(dòng)了遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別、語(yǔ)音喚醒、方言識(shí)別等技術(shù)的快速成熟,語(yǔ)音交互成為重要的人機(jī)接口。
- 知識(shí)圖譜:作為連接感知與認(rèn)知的關(guān)鍵技術(shù),在金融風(fēng)控、智能推薦、醫(yī)療輔助診斷等領(lǐng)域構(gòu)建行業(yè)知識(shí)模型的需求旺盛,大規(guī)模自動(dòng)化構(gòu)建技術(shù)得到發(fā)展。
五、 與展望
2018年是中國(guó)人工智能基礎(chǔ)資源與技術(shù)承前啟后的關(guān)鍵一年。算力層面呈現(xiàn)“云端強(qiáng)、終端追”的格局;數(shù)據(jù)在規(guī)模優(yōu)勢(shì)下尋求合規(guī)高效的利用之道;算法依托開(kāi)源生態(tài)快速產(chǎn)業(yè)化;各項(xiàng)使能技術(shù)則在廣泛的應(yīng)用場(chǎng)景中錘煉升級(jí)。核心芯片對(duì)國(guó)外依賴度較高、尖端原創(chuàng)算法有待突破、高質(zhì)量數(shù)據(jù)生態(tài)不完善等短板依然存在。夯實(shí)基礎(chǔ)層的技術(shù)自主性與協(xié)同效率,將是支撐中國(guó)人工智能產(chǎn)業(yè)行穩(wěn)致遠(yuǎn)、從“應(yīng)用大國(guó)”邁向“技術(shù)強(qiáng)國(guó)”的根本保障。