作為未來(lái)科技發(fā)展的前沿領(lǐng)域,人工智能在技術(shù)應(yīng)用方面有很多細(xì)分領(lǐng)域,比如深度學(xué)習(xí)、推薦引擎、計(jì)算機(jī)視覺(jué)、智能機(jī)器人、自然語(yǔ)言處理、實(shí)時(shí)語(yǔ)音翻譯、視覺(jué)內(nèi)容自動(dòng)識(shí)別等。其中的自然語(yǔ)言處理,是人工智能領(lǐng)域中的一個(gè)重要方向。從整體來(lái)看,人工智能自然語(yǔ)言處理推動(dòng)著語(yǔ)言智能的持續(xù)發(fā)展和快速突破,并越來(lái)越多地應(yīng)用于各個(gè)行業(yè)。
綜合來(lái)看,自然語(yǔ)言處理是人工智能的一種應(yīng)用程序,它為需要快速可靠地分析文本數(shù)據(jù)的公司提供了各種各樣的應(yīng)用程序。這有效地實(shí)現(xiàn)了人機(jī)交互,并允許對(duì)以前未使用的大量數(shù)據(jù)進(jìn)行分析、格式化。
從2008年到現(xiàn)在,在圖像識(shí)別和語(yǔ)音識(shí)別領(lǐng)域的成果激勵(lì)下,人們也逐漸開(kāi)始引入深度學(xué)習(xí)來(lái)做自然語(yǔ)言處理研究,由最初的詞向量到2013年word2vec,將深度學(xué)習(xí)與自然語(yǔ)言處理的結(jié)合推向了高潮。
近兩年,人工智能自然語(yǔ)言處理已實(shí)現(xiàn)的應(yīng)用包括機(jī)器翻譯、信息檢索、智能問(wèn)答系統(tǒng)。在智能問(wèn)答方面,借助人工智能自然語(yǔ)言處理,人們能夠精確地分析用戶所需要的知識(shí),通過(guò)與用戶交互,為用戶提供個(gè)性化、實(shí)時(shí)性的信息服務(wù)。例如,瀏覽知乎時(shí),會(huì)有相關(guān)問(wèn)答推送、熱點(diǎn)詞、焦點(diǎn)問(wèn)題排行等。
企業(yè)進(jìn)軍人工智能自然語(yǔ)言處理領(lǐng)域,也為相關(guān)產(chǎn)業(yè)發(fā)展注入了更多活力,百度就是其中之一。當(dāng)前,百度不僅在自然語(yǔ)言處理技術(shù)和產(chǎn)業(yè)應(yīng)用中取得豐碩成果,更秉承開(kāi)源開(kāi)放、合作共贏的理念,構(gòu)建了以飛槳深度學(xué)習(xí)平臺(tái)為基礎(chǔ)、集成語(yǔ)言與知識(shí)核心技術(shù)及多樣化場(chǎng)景解決方案的開(kāi)源開(kāi)放大生產(chǎn)平臺(tái),這就為廣大開(kāi)發(fā)者技術(shù)創(chuàng)新提供了相應(yīng)支持。
放眼國(guó)外,在閱讀理解領(lǐng)域,斯坦福大學(xué)于2016年通過(guò)Amazon眾包平臺(tái)建立了基于維基百科的數(shù)據(jù)集SQuAD,Microsoft亞洲研究院于2016年開(kāi)放了基于必應(yīng)搜索記錄的數(shù)據(jù)集MSMARCO。
在醫(yī)療領(lǐng)域,基于云端平臺(tái),使用人工智能和自然語(yǔ)言處理,實(shí)時(shí)為患者護(hù)理過(guò)程中的關(guān)鍵算法提供支持。基于集成電子健康記錄的軟件,并直接在照顧病患的當(dāng)下使用預(yù)測(cè)建模、機(jī)器學(xué)習(xí)、臨床NLP和人工智能就可以輔助醫(yī)療人員進(jìn)行實(shí)時(shí)決策。
有分析人士指出,面對(duì)當(dāng)前人工智能自然語(yǔ)言處理模型規(guī)模與計(jì)算機(jī)算力需求的日益增長(zhǎng),軟件和計(jì)算機(jī)硬件層面的協(xié)同創(chuàng)新具有重大意義。多模態(tài)融合的核心模態(tài),應(yīng)由具體的任務(wù)所決定,自然語(yǔ)言可視為符號(hào)系統(tǒng)。但如果不探究符號(hào)所表示的實(shí)際對(duì)象,將很難學(xué)習(xí)符號(hào)潛在本質(zhì)。
隨著人類進(jìn)入智能時(shí)代,智能設(shè)備和各類數(shù)據(jù)數(shù)量都快速增長(zhǎng)。自然語(yǔ)言處理領(lǐng)域經(jīng)過(guò)多年發(fā)展,雖然取得了長(zhǎng)足的進(jìn)步但同時(shí)也面臨很多挑戰(zhàn),其中最主要的主要問(wèn)題有兩個(gè):即語(yǔ)義理解(知識(shí)、常識(shí)的學(xué)習(xí)問(wèn)題)和低資源問(wèn)題。
面對(duì)標(biāo)注數(shù)據(jù)資源貧乏的問(wèn)題,比如客服系統(tǒng)、小語(yǔ)種的機(jī)器翻譯、特定領(lǐng)域?qū)υ捪到y(tǒng)、多輪問(wèn)答系統(tǒng)等,自然語(yǔ)言處理尚無(wú)通用的高效解決辦法。而要想攻克相關(guān)難題,還需要一定的時(shí)間。
自然語(yǔ)言處理是人工智能禮帽上的明珠,而填補(bǔ)語(yǔ)言鴻溝的機(jī)器翻譯則是自然語(yǔ)言處理十分典型的應(yīng)用技術(shù)之一。機(jī)器翻譯的發(fā)展從剛開(kāi)始運(yùn)用規(guī)則系統(tǒng),到統(tǒng)計(jì)的機(jī)器學(xué)習(xí)方法,后又解決算法、算力等各方面的問(wèn)題,不斷邁上新臺(tái)階。
隨著技術(shù)的快速發(fā)展,人們會(huì)越來(lái)越深入地理解自然語(yǔ)言、掌握知識(shí),推動(dòng)人工智能技術(shù)發(fā)揮更大的價(jià)值,以此為社會(huì)進(jìn)步和產(chǎn)業(yè)發(fā)展提供更多的推動(dòng)力。