導語:自從2016年AlphaGo圍棋AI擊敗李世石,世界又掀起了一輪人工智能浪潮,公眾視野對于人工智能的討論不絕于耳,高等院校的人工智能研究院相繼成立,與人工智能有關的商業項目雨后春筍搬出現,并在一些領域進入到人們的生活當中。
與此同時,有關人工智能的社會影響的討論也一直沒有停止。有人認為,人工智能會在近幾年大規模取代人類勞動,并在有生之年替代人類;但也有人認為,人工智能現在只是資本炒作的噱頭,并沒有取得過多實質進展。有人認為,人工智能會加劇壟斷集中,國家甚至會依靠人工智能實現法西斯式的統治,但也有人認為,人工智能是資本主義的喪鐘和共產主義的春天。還有人認為,人工智能會導致社會階級結構的變化,比如產業工人減少和腦力無產者增加。
對這些問題的爭論,離不開對當前人工智能發展現狀的認識。事實上,算上近幾年,人工智能有三次浪潮,第一次浪潮實現了基于規則的簡單推理,第二次浪潮是基于數據的機器學習及簡單決策,本次浪潮是在深度學習的基礎上眾多決策領域的突破。每一次浪潮,都有上述問題的廣泛討論與研究。仔細觀察本次浪潮,可以確定的是:當前人工智能在人類嚴格定義的問題上可以取得接近甚至超過人類的成果,如圍棋、電競游戲等。然而,人工智能目前大量依賴人工標注的數據,且容錯性短期內無法解決。此外,當前人工智能遠遠無法有人類的思想,如推理、感知并沒有實質性突破??梢詳喽?,目前人工智能在生產領域只會處于輔助部門的位置。而從階級結構的角度,人工智能一定會帶來更大規模的壟斷集中,并加速資本主義基本矛盾的爆發。
2019年1月20日,載言同志在“好家伙”線上講座向大家詳細講述了人工智能的技術現狀,并在此基礎上討論了人工智能行業的現狀,以及人工智能對社會矛盾產生的影響。
在本次講座開始之前,先對本次講座做一些說明。因為大家也知道,這幾年人工智能的浪潮,也引發了在左圈里面很多方面的討論,而且討論可以說是各種方向都有,有些討論也比較天馬行空,所以說我這次講座的一個重點,是希望把這次講座,講得更加實際一些,看一看我們當前人工智能,到底發展到一個什么樣的情況?;诋斍暗娜斯ぶ悄?,我們去做一些相關的討論。
首先我們僅討論當前可預見時間內的人工智能,而這個當前和可預見時間大概是幾年?可能就是五年,也可能是十年。如果說接下來可能出現一波人工智能低潮的話,可能只有20年。我們也是在這么一段時間內進行考慮,我們不會討論更長遠的時間,比如說50年,100年,那個時候可能在大家腦子會非常的天馬行空。
為什么只討論這段時間?是因為畢竟我們對對當前社會的理解,可能也就是這么多的時間!從長遠來說,馬克思主義已經把握一個大的方向,但是從短期來說,還是要看現實矛盾,從現實的矛盾去探討當前的各種問題。
然后第二點,是我們這次講座,要側重于從技術角度來調整問題,所以說本次講座可能我要花一半的時間講這個,這一部分基礎理論應該是需要一些高中的數學知識。然后我們盡量把這些技術理論講得通俗一些,也讓大家從基礎理論的角度出發來看,這人工智能到底發展到什么程度,我們去從一些現實的生活做判斷。
我們討論的一個前提就是,這是我對當前人工智能的理解,可能有一些同志有不同的觀點,我們后面可以再進行討論。我對當前人工智能理解就是一個更加先進的機器,這個機器可能能操作以前機器沒有辦法去做的事情,而且可能是能夠做很多以前自己沒有辦法去做的事情。
至于它有沒有人的感知,反正在能預見的時間內,我認為是沒有,所以我們不討論更加長遠時間內的問題。
有一個叫馮象的老師,他有一本書叫《我是阿爾法》,里面也說了一些人工智能的遠景。對于一些遠景問題的話,可以參考馮象老師的那本書,它相應的文章里面提出的一些觀點。
然后第三點的話,我們不討論當前看來非常虛無飄渺的問題,比如說最典型的問題就是人工智能何時取代人類,我們不討論。
然后還是基于這個點,我們不討論以后所有工作是不是全部自動化了??赡苣承┕S是全自動化的,這已經有實現的了,比如一些港口。但是所有工廠能不能全自動化,這一點我覺得可能時間太長了,我們也不討論這個問題。
當然還有一種討論,說人工智能能不能統治人類,不僅能夠取代,而且能夠統治。當然這個統治可能說的很抽象,比如說像資本主義私有制社會里面,統治階級能不能依靠人工智能統治人民。這一點的話也不討論,一是它比較長遠,二是我們還是把重點放在人的關系上。。
最后一個就是,人工智能會不會對資本主義內部的經濟結構產生影響,就是說在資本主義的環境下,會不會有些階級會消失,有些階級會產生?比如說比較典型的觀點是,腦力無產者會成為將來社會的主流,而產業工人是沒落的群體。這個問題的話,也相對來說也非常長的,我們也不做討論。
01
人工智能的典型應用
今天我們是主要是談這幾個方面的,首先先談一下人工智能當前有哪些應用。
然后花一半的時間去談論一下人工智能目前的一些技術理論及發展現狀,從工程角度來理解一下,人工智能到底在做什么。
第三點的話是討論一下人工智能目前的行業發展是一個什么樣的情況,就是說各個產業在人工智能里面有什么樣的應用。然后第四點的話,討論一下,就是從馬克思的政治經濟學的角度,看對人工智能如何去理解,這個涉及到一些政治經濟學的知識。
最后一點就是說一下我對人工智能一個基本的結論。
首先先談一個典型應用。
先說一下什么是人工智能。國外有一個人,他編了一本教科書,分成了兩個維度。
一個就是,一個人維度,或者可以做人做的事情,或者可以像人一樣具有理性(畢竟人是有社會性的)。然后第二點的話,是從行為的角度,或者有一定的行為,或者有一定的思維(畢竟人有社會性啦,他可以思考)。
那么從這兩個維度,其實就可以構成四個層面的定義,比如說一個人工智能系統可以像人一樣地行動;然后更高端的,就是人工智有可能像人一樣地思考;或者進一步來說,人工智能這個系統,可能能夠理性地進行行動,不僅是像人一樣行動,而且是能夠做一些正確的決策,而且這個正確決策,對社會來說看起來是合理的;還有一個就是,人工智有可能能夠像做到一種理性的思考,甚至理性思考可能還比人要好一些。
從目前發展情況來說,我標了不同的顏色,這不同顏色就標志著人工智能在不同的層面下發展的情況。
比如說紅色的這部分就是人工智能像人一樣行動,其實這一部分從當前來說已經基本上實現了,或者有一些沒有實現的,應該也能夠在近期來進行實現,在比較簡單的領域做人做的事情。
然后這些系統能不能像人一樣思考?這個誰都不知道。當然有的人工智能系統能做一些類似人的行為,比如說AlphaGo,AlphaGo確實是在這個方面還是起了很大的突破的,它至少能知道這個棋局是一個什么樣的情況,這有點像人一樣思考。
但是它能夠做到理性思考,理性行動,那就當前的人工智能可能遠遠達不到這個層次,畢竟它遠遠沒達到人對事物認知的水平。
我們說一些典型的應用,比如說自然語言的處理。
這里面的語音,第一點就是語音合成,這里面就有一個大家知道公司叫訊飛。可能很多人會用一種輸入法,叫訊飛輸入法,那種輸入法,至少你在走路或者是在開車的時候,使用起來都非常地方便,因為我只要說一段語音,無論是普通話還是地方的方言,一般來說這個識別準確率能達到90%以上,至少是人都能看得懂,漢字的敘述順序和錯誤,可能不會影響到人對這段語音的文字的判斷。
然后語音合成的話,就是可以合成一些像人聽起來非常舒服的這種,比如說可能合成一些方言等等,最近不是有一個非常火的平臺,就是什么新聞聯播的播音員的合成,還有在iPhone手機上有一個東西叫siri的對話系統,就是我說的一句話,然后然后siri會自動反應,比如說打電話給誰誰誰,那就真的把電話給撥出去了。
自然語言里面還有一些其他應用,比如說機器翻譯等,一會我會舉一個例子。
信息的抽取,就是給一段話,生成一段摘要的文字,有的時候也是能成功的。信息的檢索,就百度谷歌的搜索,自動的問答,比如說百度王寶強的前妻是誰,百度直接就反應,說了馬蓉。還有一個就是文本的情感識別。另外比如說有一些在炒股領域可能有些可笑例子,比如說像之前章澤天和劉強東,之前兩者關系出現一些矛盾,于是有一個股票當天就暴跌了,這個股票就叫澤天股份。當然還有川大智勝啊,西儀股份。它們可能也會受到智能炒股軟件一些影響,即這些炒股軟件針對網上消息進行大數據分析,“發現”了相關股票的“負面/正面消息”,然后做出賣/買的決定,當然這都只是傳言了,當個段子聽就可以。
這里面就舉一個例子就是谷歌的翻譯,然后上圖是前幾年谷歌翻譯系統,然后下圖是谷歌2016年的翻譯系統。我們可以對比一下,上圖和下圖翻譯系統,然后它的翻譯效果,前一段文字你會發現其實讀起來非常不通順,比如說第二句 “AI教科書定義字段的研究的和設計的管理,智能管理智能代理,其中一個智能代理是感覺周圍環境”,你會發現讀起來非常不通順,也不知道他在說什么。
但是到16年,他翻譯就已經是非常通順。關于第二句話,“AI教科書將該領域定義為智能代理的研究和設計,其中這個代理能夠感知其環境,并采取行動以最大化及成功機會的系統”,那么發現這段話至少人是能夠非常理解的,而且其實翻譯的結構和人自己去翻譯,可以說是沒有什么太大的差別。
所以說現在讀英文論文的話,大家都會采取一個手段,就是先把這段英文扔到谷歌翻譯里面,讓谷歌翻譯,再看一看他到底在講什么,可能這篇論文理解起來就會更容易些。然后寫論文的時候就也會做,先寫一段中文,把它扔到就谷歌或者百度翻譯里面,讓他生成一個英文,然后把這段英文粘貼,然后潤色里面的文字。
然后在視覺領域的話,一般是針對圖像或者視頻,一般可以做圖像的分類,比如說我拍一個照片,這照片有一朵花,花是一個是一種什么樣的種類的花,這個APP都是有實現的。
還有就是物體的檢測,比如說給一張圖,這個圖里面是有很多綿羊,把每只綿羊都識別出來。
當然可能大家更加熟悉的就是街上攝像頭的人臉或者行人的檢測,就是我這個攝像頭三個環境里面,基本上這攝像頭下面,所有的人,我都可以檢測出來,甚至我都知道這個人的一些基本特征是什么。
然后右邊這個圖,是一些場景的標注。比如說這個場景,我給定三種這張圖,我去標注右上,然后可以看到標注的結果就是右上方,比如說哪些地方是馬路,哪些地方是物體,哪些地方是高樓,哪個地方是天空,那我都可以把這個區域都找出來,這一些現在人工智能系統已經被完全實現了。
用場景標注在自動駕駛領域是非常實用的。還有是安防領域,這是一個非常簡單的安防系統,所以我給定在攝像頭背后,去連一個數據中心,他在數據中心里面可以實時地去進行進行人臉和判決,有時候可能去抓一些犯罪分子,會去抓一些相對敏感的人物等等。
另外一點,比如說像在火車站、飛機場這樣的一些環境當中,利用人臉識別的系統去代替以前的實名制,是實名制的檢驗系統。
然后還有一個,最近這個視聽節目類吧,要進行審核。這個審核領域,像抖音這種短視頻,審核的話,人的審核其實根本沒有辦法完成的,所以很多時候會比較依賴機器審核。比如說一些直播系統,它背后是有一個AI的鑒黃師的,就是說某個主播,可能會做一些黃色行為,鑒黃師就可以立馬反映到后臺,然后后臺有些審核人員就跟進,根據反饋的結果,然后去決定到底要不要封殺主播的一些不法的行為。這種鑒黃師其實現在已經有了非常廣泛的運用。
(有人提問:道路識別這個因為樓房是白色的?)你剛才說的這道路識別,就是照片的建筑顏色是白色的是吧?但問題是,其實是如果從人的角度來說,肯定是識別判別的一個依據,但是現實的場景當中,建筑物的顏色可能千奇百怪,道路顏色可能也是千奇百怪的,而且會受到雪天、雨水天、太陽這種影響,所以他不一定都是這樣。建筑物或者是場景范本這種識別,它可能會綜合很多的因素,這個因素都是從數據中去學習出來。
然后還有一個比較經典的,就是圍棋游戲,待會我會講圍棋游戲的基本的原理。
另外就是一些電競游戲,比如說像dota2,還有像星際爭霸?,F在dota2和星際爭霸的AI的水平,基本上已經能夠超過一般的頂級玩家水平,但是遠遠達不到職業玩家的水平。(最近星際爭霸AI可以達到一般職業玩家的水平)
還有一大類就是屬于生成工作,就是AI可以自己去做一些藝術作品,比如說AI去作畫,AI去作曲,這個現在都有一些初步結果。我們實驗室有一個人,做一個工作,就是AI生成風景畫,大家可以猜一下,哪些畫是生成的,哪些畫是真實的中國畫??赡芤话愕娜舜_實看不出來,當然如果你放大去看里面的細節,可能是能夠看出來的。這里就直接展示結果,有標簽的是生成圖片,仔細看看這生成圖片,可能和真實的圖片還是有一定的差別的,但是如果你簡單去看,確實是能夠達到一個就是水平不太高的人的做畫標準。
自動駕駛領域,它是有很多的攝像頭,有雷達測距的系統,它就會根據汽車周圍環境信息,去做一些自動駕駛決策,比如說要加速,減速,剎車等等。自動駕駛系統,至少可以做到一個輔助駕駛水平,就是人去離開方向盤,在一個比較簡單的環境中,是可以做一些簡單的決策的。
這是一個自動駕駛的例子,就是它可以檢測出來前面的汽車,它的行駛的軌跡和行駛的速度。
這里也是自動駕駛的一個案例,比如說給他一個前方的攝像頭,它來做什么,比如說會做一些檢測工作,防止有一些障礙物,然后直接撞上去。右側就是一個場景的分割,我要把道路去分割出來,防止汽車不小心就開到了荒郊野里去了。
所以總結就是人工智能有三大應用場景,總共3大類。
第一類對機器人和人都很容易,比如說語音識別、機器翻譯、棋類游戲,這類是對機器對人都是比較容易,人能夠經過大量的訓練,達到一個很高的水準,機器也是,可以達到一個很高水平。這些領域有一個特點,就是他對問題的定義都是高度的結構化或者是形式化的,也就是說這個定義非常非常簡單,每個人都會知道這個問題到底是什么,雖然我可能不會這個問題,但我至少知道這個問題應該是出一個什么樣的結果。
第二個就是對機器和人類可能都很難,比如說像提出一些新的概念,可能人類都不一定能完成,機器目前來說也不一定會完成。
還有一大類就是對人類容易,對機器很難。當然就是這一類任務的難度都是相對的,比如說早期的話有像圖像識別、圖像理解、聯想,等等這樣的一些工作,對人類都是很容易的,對機器是很難。但這幾年對圖像識別,然后自然語言的處理,它可以說對機器來說也都不是那么難的事情。一般來說只要對人類容易的問題,一般長遠來說機器都是能夠解決的。
當然有些對人容易的問題,可能機器是不能夠解決的,這是一些基本的應用。
02
基礎理論和發展現狀
講一下基礎理論,在講基礎理論的時候先簡單說一下,人工智能總計有三次的浪潮。
第一次浪潮大概是從56年到70年,第二次大概是從70年到90年,第三次大潮大概是2006年以后。
然后第一次浪潮就是先提出了,機器能夠做一些人能做的事情。比如說他們早期的人就想做一些定理的證明,做一些基本的道路、線路的規劃等等,或者是想下一些簡單的棋的游戲,這就是第一次人工智能浪潮。
然后第二次人工智能的話,覺得人類有很多的知識,但這些知識的話,機器可能不是能夠掌握,我能不能創造一個人工智能的模型,讓機器去學習一些人類的知識,就形成了第二次浪潮。第二次浪潮比較典型的就是機器學習的這個方案,就是讓讓機器去學習,根據一些數據去學習一定的規律,這種規律可能人也是能夠掌握,或者說是人先總結一些比較簡單的,你比如說一個文檔,它是每個詞它都有一定的詞頻,這個詞頻我就可以構成一個特征,當中一個特征,我去做一些東西,對,要繼續做一個決策。就是第二次。
第三次的話,就是基于大數據發展,這個數據量都非常高,數據可能非常復雜,但是人工智能吧,不管數據多么的復雜,我只要能夠有大量的數據可輸進,我就能夠解決一些人類定義的很好的問題。就是第三次的浪潮,第三次浪潮是以深度學習為標志發展。
然后每次浪潮最低潮的時候,總會有這樣的反應。每次人工這種高潮進去的時候,肯定有很多人聲音就是:天啊人類要毀滅了,但是每次低潮的時候,他說這個東西都是騙子。
現在到了第三次浪潮,可能也有快下去了,過幾年可能要下去。將來也有很多人可能有很多聲音,就是說現在人工智能就是個騙子。
我們再總結一下,就是56年提出,人工智能第一個階段,基本上就是到70年,當時主要是做搜索。就是說我給他一個問題,然后也知道這個問題可能有哪些可行的解,那我就把這些解一個一個的找出來,然后去得到一個最好的結果。這就是早期的任務,比如說定理的證明啊,游戲啊等等,都是能夠得到比較好的一種。
然后第二的時候就是知識處理,希望人類有一些支持。比如說像醫療領域,我去看一個病,看病的話,它可能有一個標準流程,比如說我要根據某些特征1、2、3,去判斷它到底是不是一個心臟病,或者是不是癌癥。
當時就希望利用這些知識,讓機器去掌握這樣的知識,就創造了知識工程,或者專家系統等等。系統給輸入一些標準化的東西,輸入一些新特征,比如說心電圖的一些特征,然后讓專家去做一些診斷。但因為人做這種角色其實非常非常復雜的,當時機器去做決策,其實都是只能靠簡單的搜索,所以說,當時這個領域其實是客觀上失敗的。
然后接下來發展第三個階段,就是特征數據,我人到這個機器去處理的時候,我人先對這個數據做一些簡單的處理,比如說我去判斷一朵花是什么樣的、什么種類的花,我可以人先去做一些簡單處理,比如說先把這花的顏色,花瓣的大小,花瓣的數量等等東西,用一種簡單的方法先把這些特征提取出來,然后把這些特征去放到一個機器學習的系統里邊,比如說通過一些統計的知識,然后去就統計到底可能是某一種花,它可能長度大概就是在5到8厘米區間。另外一種花,可能花瓣長度會在9到12厘米區間,但有一種新的花的花瓣長度,可能是七厘米,我就判斷他就是前一種花,這都是一些統計學習的知識,當然優化學習也是有相應的這種知識的。這是特征處理下取得了一定的成果。
當然人工智能機器學習取得真正突破的結果就是2010年深度學習,就是說我根本不用去提取一個圖片或者文本特征,我只需要把這個圖片簡單地扔到一個人工智能這種學習模型當中,它就能出來一個結果,而且能出來一個很好的學習結果。
所以說其實我們講了這么多,它的一個本質就可以發現它先定義一個問題,然后用相關的算法去求解和預測一些新的問題。
這就是有哪些問題,第一大類人工智能可能就是搜索,然后第二大類人工智能就是繼續學習,繼續學習就分為回歸、分類、深度學習,還要強化學習。
首先就是講搜索,搜索就很簡單,就是要窮舉一個所有的可能情況,找到一個最優的決策。這里面就一般分成幾大類,比如說像棋類的游戲,導航啊,智能問答啊等等的,等會我會一個一個地講。
先說導航的問題,就是我們大家知道手機軟件,然后希望能從A到B,找到一個最優的路徑,一般來說根據高德地圖運用的規劃,我們就能夠非常傻瓜地到我們想要的目的地,它是怎么實現的呢?比如說我們考慮北京市,就這么一個道路的網絡,就這個點??赡芫褪且恍╆P鍵的地點,然后現在就是一些道路或者路徑,我們想從一個點A,就是A這樣一個點,然后到這樣的點,點B,怎么去找?其實就是暴力搜索的辦法。首先會發現A的周邊可能有三個點,有三條道路,人工智能系統就會把這三個道路全部搜索一遍。然后這個道路我們在這三條,然后到達這三個點后,我可能要找一些新的道路,比如說我要從某個點出發去尋找新的道路,會發現比如通過GPS的信息會發現這個點到這個點的距離可能是最短,那我就從這個點出發。然后發現他旁邊有三條道路,肯定不能走回去,都走回去,那不就死循環了。發現可能有這樣這三條三個可能的方向,于是所有的點搜索到就可能能從A點到達道路,就包括O打頭的這個地方,S打頭這個地方,F打頭的這個地方,P打頭這個地方還有G打頭這個地方,再然后對這些地方在選取一個點,繼續進行搜索,比如說我們發現F點根據GPS進行地點最近,我就從F點出發再做一步,然后要找百度下面的一個路徑,當然你可能肯定也不能走回頭路,結果發現好像F這個點正好一步能夠到達最終的終點,就寫錯了這樣一條路徑,AI從S點到F點一直到D點這上一條路徑,這就是一個搜索。其實搜索就是計算機就做一個簡單事情,非常暴力的進行搜索,找到沖擊和所有的情況,然后找到一個找到想要的結果。
下棋也是,比如說一個最簡單的棋,就相當于是在一個井字的3×3的井字格里面畫圈,或者說畫叉,然后如果是某一方能夠橫豎斜形成三個能夠連在一起的話,某一方就贏了。這是一個現在假設機器就是畫叉的這個人,可能要下下一步的棋,然后機器要判斷他下一步要下到哪,機器就要窮舉所有情況,所有情況其實簡單,就是人工智能的系統,它要把所有可能的棋局都要下一遍。比如說現在有三個部分,就有三種可能情況,比如說他可能下到這里,右邊中間這個點,但是下到這里發現肯定不行,因為比如說畫圈的人下到了這里,那圈就贏了,我肯定不能下到這個地方,如果說我下到這個地方當然也不行,因為畫圈的只要下到這里它肯定也贏了。然后我下到這個地方,我就讓畫叉的話我再做進一步的一個計算,比如說如果畫圈的話到這里結果可能是平局。如果這個畫圈的話到這里,那這個畫叉的再補一步,就是這三條連成一線,那么這畫叉的就贏了。(ppt演示)
綜合的所有的可能情況會發現,這個人工智能系統可能只能把叉畫到這里面,最后取得勝利。
然后還有智能問答,我們這里面就幾個最簡單的這種問答,可能大家原群里面,就是可能在微信群里面,都能看到一個非常搞笑的AI類核心代碼,估值一個億。它做什么呢?
比如說我輸入一個“在嗎?”
“在”。
然后我再說“你好”
AI說“你好”。
我說“能聽懂漢語嗎?”
“能聽懂漢語”。
“真的?”
“真的”
“English too?”
“Englisg too.”
“bye!”
“bye!”
你會發現后面代碼其實對這些文字做一些簡單的替換,比如說如果后面有“嗎”和問號的話,那我就把這個“嗎”和問號換成嘆號,如果是句號的話,我就可以是一個陳述句,然后發現好像這個邏輯都是正常的。
實際上早期的智能問答系統它就是在做這個事情,然后我就存大量的問答的語句和格式,那么人輸入某一段話,他就去在這個數據庫里面做匹配,匹配一個對這個問題的最佳回答,然后再輸出出來,然后你們發現,其實所有智能問答在早期的話,本質其實就是在做這個事情。
(有人提問:下棋問題,為什么繼續計算?)這個問題是下棋總結的棋步,為什么還要繼續計算?對,總結棋步肯定是要他要在搜索的時候,我要模擬棋局,就是要把棋局的結果下完,在下完之后,它實際上這個計算才能夠真正地停止。
這是搜索啊,然后接下來還有一大類,就是機器學習,這個可能大家也會聽到很多相關的概念,我們得簡單說一下,機器學習他到底在做什么?其實就是比如說我們假設收集到一百本書的頁數,這一百本書的價格,大致是一個這樣的情況,比如說這有一本書,有一本書是55頁,然后它的價格是69塊錢,有本書是105,價格79.5,有本書是90頁,價格是128塊錢,然后有一本書是240頁,價格133。
我們把這一百本書,可以在一個坐標系里面去畫出來,可能會通過這個分布,我們可以得到一個非常簡單的結論,就是書的頁數越多價格就越高,這其實也是符合人類常理的。
好的,我們接下來想做的任務的做兩個,第一個就是告訴機器學習什么,然后第二個任務就是等機器把結果寫出來,告訴機器學習什么呢?就是說我們假設有一本書是480頁,我想知道這本書的價格是多少,
可能就是我們要學習的話,因為我們覺得可能書的頁數越多,書價值越高的,其實它可能就成為一個線性的關系,就是一次函數的關系,比如說可能是下面這樣一條斜線。當然書價是480塊錢的話,我能在斜線找到對應書價這樣一個點,然后得到相應的結果。
好了,這個斜線可能大家都學過,y=wx+b,W和B都是一些待定的系數,待定系數比如說可以解方程,也可能用一些其他方法去求,我們是必須要求W和B是什么?
好,問題就是w和b是多少合適,我這里面就有一個。我們設y=wx+b這樣一個一次函數,我們需要確定wb到底多少最合適。比如說這可能下面是有一些不同的情況,然后當然最好的情況,就直接根據這樣的一些離散的點,人去畫,或者機器再畫一條直線,感覺這個直線能夠覆蓋到大多數情況就可以了。比如說下面這三種情況,可能都是一個比較合理的結果。但是哪個點可能就是哪條直線是最好的,我可能需要做一定的量化。
比如說一個最好的最簡單方法,就是要使預測的書價和實際的書價差越少越好,你說這樣一個預測的點,比如說這是一個預測書價和書的線性的關系,我會發現可能每個點,和每個實際的書價和預測的書價,都會有一定偏差。這個就是偏差。我們就希望讓這些偏差,就是所有點偏差的和越小越好,也就是說讓預測書價,實際書價,差越小越好。
怎么去形式化這個問題,我們可能就要做,像高中的話大家可能都學習過,我需要構造一個函數,針對實際問題,我們去實際問題去做到一個y=f(x)這樣一個函數,然后去優化Y等于X,那么在這個問題中也是一樣的。
比如說我們假設價是y=wx+b,我們肯定是適當,比如說頁數是55,那么它價格55w+b,然后它55W+B,它和實際69,他肯定存在一個誤差,他這個誤差我就取一個平方,就是這就是第一本書的誤差。為什么取平方而不是取絕對值,就因為取平方可能更好計算,沒有別的道理。然后這第二本書的話,預測價格是105w+b,實際價格79.5,我這也是求一個相應的誤差,所有書的誤差總和,我就可以一百個把它列出來,然后得到這么一個結果。然后得到這個結果的話,其實我們可以做到一個以W+B有關的損失函數,這點我只列了以W相關的損失函數。比如說是有這樣的一個情形是很明顯這樣的形式,如果是掌握初中掌握的二次函數知識的話,肯定知道W該怎么求。求它的最低點,對吧?比如說我們把W搬進去,用一個圖像去畫出來,肯定知道W大概斜率大概10到15之間的這樣一個數。OK,這是一個非常簡單的算法,當然有些還是可能非常復雜的,比如說三次函數,還有可能這個函數都是分段的函數。總之到實際的深度機器學習里面,這個函數是非常復雜的,肯定不是像這么簡單的二次函數。
在求解過程中就有另外一種方法,就是畫切線,然后算導數。比如說我就隨機的從某一個點出發,然后這個點會發現它可能在現在切線,然后在切線的時候,我可能就是取一段X,然后X往前移,移到這里,然后再從這個點出發,然后再畫一個斜線再往前移。然后這樣的話,所有我們去做一個迭代,然后迭代人算肯定是非常的困難的,這樣一個循環,但是機器的話確實非常容易去解決這類的問題。然后當然這個切線怎么算?那些高中的導數知識,其實就告訴我們答案。
我小結一下吧,我從線性規劃這個例子去說一下,目前最火的人工智能在做什么?首先就是在搜集數據。剛才不說書價和書的頁數這樣一個關系,書的頁數是X,然后書價Y,就是X和Y也構造一個關系。
第二個就是選擇模型,就是選擇一個合適的函數F(x),比如說剛才那個問題,相應合適的函數就是一個線性函數,在F(x)中的參數,都是W和B兩個參數。
第三點就設計代價函數,比如說衡量一個預測結果,和衡量一個真實的結果的差距,比如說用一個平方誤差的代價函數,
最后一步就是用一些方法去進行優化,去優化這個系統。
所以說機器學習,其實從原理來說是非常簡單的,但是在實際考察問題的時候,他可能有一些現實的困難,比如說他可能數據是非常復雜的,比如說一個圖像,你怎么去確定圖像對應的輸入,X比如說它的它向量X,它是一個什么樣的格式?我怎么去擬合它?可能就是讓上個世紀一直到本世紀的前幾年,一直大家都在研究這個X該怎么去算,直到最近深度學習,大家知道,我直接把圖像每個像素點的RGB三色通道的數值輸入進去就可以了。
然后另外需要設計合適的模型,可能這些模型會非常非常的復雜。另外一點模型的輸出和真實的結果可能是非常復雜的,比如說剛才這個解釋的這個問題,就是輸入輸出就是一個連續的實數。但是可能有時候輸出是一個離散的,比如說1和0,那就代表1可能代表某一類人,0可能代表另外一類。有的時候可能輸出的結果是一個框,這個框可能有四個參數,就是左上角這個點的坐標和右下角的點的坐標,反正總之實際輸出的結果是非常復雜的,雖然設計時就是和這個代價函數進行優化。然后非常復雜,大家可能用高中學的知識,就沒有辦法去進行解決了。
然后呢,把F(x)學習出來的話,我就可以用到實際場景了,比如說給定一個新的數據,X那我就要預測,它對應的標簽我直接用學習好的F去預測就可以了,這都是基于學習。
然后我們再說一些其他應用,比如說分類,分類的話,比如說鳶尾花的話兩有兩種分支,一種是變色鳶尾花,一種是山鳶尾花。我們需要判斷給定一張圖片,這個圖片有一朵鳶尾花,那這朵鳶尾花到山鳶尾花,還是變色的鳶尾花。
比如說用一個比較簡單的方法,我可以用我可以選取這個圖片連幾個特征,比如說花瓣的長度,花瓣的寬度,到植株的長度,還有花瓣的顏色,這樣四個參數,然后進行學習,然后去判斷,最后這個到底是一個什么樣的花。比如說第一個花,他這個花瓣的長度5.10cm,花瓣的寬度是3.5cm,然后可能植植株的高度是1.4米,植株寬度可能是0.2米等等的,最后它這種花比如說是一種白鳶尾花等等,這就有一組X,還有四個數就構成一個x,然后輸出的話就是一個什么樣的話,比如說用B或者E來進行表示。
如果我們畫在一個坐標系里面,其實就可以看到這個為什么用四個,四個特征可能是非常的合理的,比如說我們僅用花瓣長度和花瓣的寬度這兩個特征,然后在這個坐標系上做一個顯示,就會發現這個山鳶尾花,它花瓣的長度寬度都比較短,然后變色鳶尾花花瓣長度和寬度都比較大。于是我發現這兩個類別其實在這個坐標系統是明顯分開的,我們就可以畫這么一條紅色的直線去把這兩個種類分開,比如說這樣一個一側結構,比如說可能這樣一個函數小于零的時候,它就是山鳶尾花,還是這樣一個函數大于零的時候,它就是變色鳶尾花。
當然怎么去確定這么一條直線?一個最簡單的方法就是蒙嘛。把這條直線在所有空間里面枚舉一遍,然后找到一個最好的,看起來最好的直線。當然有一個比較靠譜的做法,我可以通過函數的手段去進行優化。
比如說我開始可能是這樣一條直線,發現這條線肯定是不能把這兩個類別分開的。也可能這個直線也不能把所有類別走開。當然可能是這樣的直線,這個直線其實是能成功地把這兩個類別分開了,但是好像發現分開的效果并不是很好。當然有可能是這樣的,這樣的直線的話,他們分的效果就很好,我們就可以以這條直線去進行優化,就其實是蒙的方法。(ppt演示)
實際上怎么去形式化去應對這個問題呢?有一個比較簡單方案,就是定義分類的間隔,你說第三條直線它是這樣的一個直線,它分類會發現這條直線對著山鳶尾花特征的距離中最短的距離,會比較小,然后這條直線到變色鳶尾花的最短距離可能也是比較小的。
但是如果是紅色的直線,會發現這是這個直線對著山鳶尾花的最短距離,和這條直線對變色鳶尾花的最短距離都是比較大的,但我們肯定會選取紅色的直線作為最好的結果。
當然這個東西是可以去用一個函數,形式化來進行表示的,然后我們去優化這個函數,就確定這條直線到底在哪。
然后這是分類問題,當然還有其他應用,比如說垃圾郵件分類,看它這個郵件,到底是不是垃圾郵件,垃圾郵件分類是一個早期機器學習很經典的應用,因為其實比較簡單。比如說你去判斷這個郵箱的地址,他是不是正常留下地址。
然后看到這文字內容,比如說什么東西是免費的,我要營銷這個什么東西肯定宣傳免費,我一看到免費的兩個字,我就可以把它扔倒垃圾郵件里面,因為肯定對用戶沒什么用。你可能會看到SCI會議投稿,或者說國內xxx,垃圾的會議投稿,當這個垃圾郵件系統發現這些文字的時候,我也得把它分成垃圾郵件里面。而正常的一些郵件,它可能會分析出一些完整的事情,我就把它放到正常的郵件中去使用。
還有手寫字體的識別,就是OCR系統,這時候給另一個圖片去判斷圖片上的文字是什么。
他現在廣泛使用的車牌識別,還有像圖像的分類,就看到一種花是什么樣的花,還有人臉的識別,這都屬于分類的一些典型的應用。
然后在這個領域中,還有一個很重要的分支,就是這幾年發展就深度學習,和普通的機器學習有幾種不同?它本質的話,其實就是深度學習它是一個非常復雜的函數。這種非常復雜,可能人都沒有辦法去理解,但反正它是可以構造出來的。
它動機就是人的一個神經元結構,它是分層的。你說我們考慮我們一個聽覺的系統,這個系統先通過耳蝸對吧?然后耳蝸把信號處理掉,給了大腦皮層,大腦分好幾種區域,比如說V1區,v2區,v3區,然后v1區把信號處理給Av2區,v2區把信號處理給v3區,最后呢信號到了腦的一個言語臨界的這樣一個系統,去得到正確的信息,然后這些正確的信息去指導人去做下一步的決策。
神經元結構是高度分層的。那深度學習,就基于這樣一個動機,它就會設計一些分層的網絡結構,那種網絡本身其實就是復雜函數的復合。比如說第一層一個輸入f,第一層套一個f1,第二層把f1輸出,然后套一個f2,然后快f2輸出然后套套套,然后套了好幾層,就是套了L層,最后得到真正結果。
所以可以發現就這個函數是非常復雜的,一個簡單點函數,可能就是之前說的y=wx+b,這樣一個線性函數,復雜的話就是,我可以直接給定一張圖像,然后對這個圖像就是用卷積等等操作,處理,當然卷積是一個什么大家可以網上去搜一下,這都屬于大學里面的一些基本的內容。
然后函數的優化也很簡單,因為我們是能夠把問題定義,比如說可能輸出結果是一種類別,或者輸入結果是某一個數,我就可以根據這個類別信息,根據數的信息確定一個代價的函數,然后這個代價函數,我就可以進行優化。優化也有一些特定的方法,這個就不多介紹了。
其實反正本質的話,深度學習相對普通學習一個優勢,就是說叫沒有中間商賺差價。他的意思就是說,比如說給他一張圖像或視頻,這樣一個非常復雜的數據,那這個非常復雜數據,我用一個很復雜的函數處理,我都可以得到最后的結果,比如說分類,復雜函數得到0到9這個數字的結果。
下面就可以看到,一個非常典型的結構,就是給定一張圖片,這個圖片就有非常復雜的這個函數結構。這些函數結合,最后輸出的結果就是它的分類結果。
以前的時候,機器學習怎么處理,它可能會有一些其他方法去判斷。這張圖里面文字有多少條直線,比如說這里面有三條直線,這三條直線我們能夠判定,它可能是A可能在H。然后在三角之間的關系去構造一種特征,就說這可能是一堆實數的組合,然后用一個分類器,來進行分類,最后分類的結果。
但是深度學習的話,我就可以把這兩個過程融合到一塊,用一個非常復雜的函數去得到解。
就這么一個設計思路,其實在當前人工智能領域,得到一個飛速的發展。比如說圖像的識別,有一個任務,有一個任務是這個圖像的分類任務,就是說給定一張圖像,這個圖像里面有一個物體,物體里面它是包含在人類生活中一千個不同的實體,比如說是一種鳥一朵花或者一條狗一只貓等等,它有不同的標簽,我要根據這張圖片去判斷這個里面的目的,到底是一個什么樣的標簽。
但怎么去定一個錯誤率,就是說我可以一個人或者機器,我可以對這張圖片打五個標簽,如果這五個標簽里面有其中一個,和這張圖片真實的表現相同,我就認為它是針對錯誤,我們認為它是分類正確,否則就認為它是分類錯誤。早期的話它就分類錯誤率多少,可能百分之比將近30%,但自從有了剛才所說的深度學習,這個分類錯誤就一路下降到了2017年,它分類錯誤率是多少?2.5%。而一般來說一個熟練去做分類的人類,它的分類錯誤率是多少?大概是5%。
所以說你會發現有一些非常差的標題黨,經常會發一個什么重磅,某某領域的機器識別的性能已經超過了人類,它本質是什么樣的?就是在這些特定問題上,比如說這種分類的問題的準確率上它超過了人類,然后人臉識別也是,他可能是在這個兩個人臉,它是不是屬于同樣一個人,在這個問題中就是要回答是或者否,他超過了人類。
其實這個問題從人的角度來說,它是個非常簡單的問題,輸入這張圖片,輸出,就是看到就是哪個類別,0-1?1-1000?你其實輸出一個數就可以了,這種簡單的問題機器現在都是可以解決的,并且超過了人類的水平。
而這種深度學習還有另外一個特點,就是說它需要高度依賴大規模的數據,然后會說對當前人工智能的意味著什么?也就是說以前的數據量比較少的時候,它分類準確率是非常低的。
(ppt演示)我看右邊圖標,先看綠線吧,在以前的機器學習算法數據量增長,性能逐漸提升。當然其實數據做到一定程度的時候,機器學習的算法可能無法繼續,性能就無法繼續提升了,但有了深度學習就不一樣,我只要有更多的數據,我就能獲得更好的結果,于是現在就出現一類領域的數據的標注員。
另外還有一個就是強化學習,強化學習的本質就是它是一個自我學習的過程,就是我提一個問題,然后這個問題,他可能比如分成好幾部,比如說我要做題,做數學題,就分成第一步第二步第三步第四步,做完這個題,然后有老師去判斷,這里面就可能說總分12分,給你八分。好了,機器回過頭來,我就要去判斷我這樣的一個解題的步驟,存在哪些問題,好像發現可能第一步存在問題,我就去優化一下第一步。然后我再重新再嘗試把這道題做出來,第一步第二步先把這道題做出來,這時候可能有一個老師會跟你說,你現在得了9分,好像這一步可能是從錯誤變成正確了。我再找出來第三部又出了問題,然后把第三步來修改一下。然后第一步第二步第三步再做那道題,那么做完這道題得了12分,這就是強化學習的概念。
有個非常經典的應用,就是在圍棋領域。剛才我們說了,在下棋的時候一個比較簡單的方法,就是暴力搜索所有的可能情況,在國際象棋,象棋,五子棋,還有剛才那個“井”字棋,都是可以用這個策略的,為什么?因為搜索的步驟其實比較小的,你像國際象棋可能只需要搜索上百億步就可以了,上百億步,其實對機器處理是非常簡單的,因為機器每秒,一般普通機器就可以計算上億步,一個很好的機器,可能可以計算上百億股的,所以說我只要對棋局下面所有可能的情況,然后就可以指導人工智能這個模型去走一個最合理的步驟。
但是對于圍棋就不一樣了,圍棋每個下棋的步驟可能都是多少?有361步的。你下上幾步的話,基本上它所有走的可能情況可能比宇宙中的原子數量還要多,對機器來說是根本沒有辦法處理。剛才有一個同志的提一個問題,就是說所有的步驟,你把這所有的步驟算下來,這是不是浪費資源,確實計算機它就是出這么處理的,我只要有多少資源我就可以下多少步,我們不管有些搜索步驟是不是對人類是合理的,反正我把所有的步驟窮舉一下,我就能得到最好的結果。
AlphaGo也是這樣處理思路,但是他做了很多的改進。AlphaGo因為有了深度學習,所以說它就有個棋感,我可以把棋譜輸入到一個神經網絡里面,然后獲得這個棋譜,就當前的棋局,它可能獲勝的概率,會輸入0到1之間的實數,這實數就是概率,概率越高的話,我就要越有可能走這一步。
這個模型怎么去學習呢?是因為在國際比賽中其實有大量的棋譜,我是把棋譜和其余的結果用到神經網絡模型里面去進行學習,其實網絡就能夠獲得棋感,也就是說我給你當前棋局,我就能知道大概下一步能夠下哪些可能的位置了。
然后基于這些可能的位置下到可能的位置,比如說可能每一步我至少要到十個最有可能的位置,我說那行,其實我就可以做暴力搜索,每一步模擬找到幾個最有可能的下法,然后去做到最后的結果。這就是AlphaGo第一步學習的方法,讓其棋力提升,就通過剛才強化學習的方法,就是我自己去做,然后每次對弈肯定是有輸贏的,有沒有這個模型的話,那我就去判斷我為什么去贏,把相應的步驟去進行優化的話,我就判斷我哪一步可能輸了,讓我對這個輸的哪一步再進行優化,就會得到更好的結果。
剛才講的人工智能的一些基礎的理論,我做了一些簡單的總結,就是目前解決的問題其實就是一些決策問題,就是這個問題有非常明顯的規則,比如說分類問題,識別問題,檢測問題,還有路徑的規劃問題。當然還有一些部分是數據的生成問題,比如說圖像的生成應該生成這些問題也是高度規則性的,都是可以解決的。
然后哪些領域取得突破,就剛才三大領域里面對的內容對機器較難,比如說語音識別,圖像的識別,視頻的分類,然后復雜棋類的競技電子、競技游戲等等,其實都是取得巨大突破,或者簡單來說就是任何可以沿著路徑的問題,其實都是取得了重大的突破。
但問題是對人類很難的問題,機器基本上是沒有辦法處理,比如說我去發掘新的概念,必須是沒有辦法處理。
人工智能其實還有很多現實的問題,比如說第一點,剛才講到了目前的人工智能的模型,如果是數據量越多的話,學習的性能越高的,所以說人工智能高度依賴這樣我們所要學習的數據,這時候就產生了一個行業:數據標注員。
比如說對于人臉識別來說,我希望把所有的我需要的人臉,如果是我要看到這個人的眼睛在哪里?鼻子在哪?嘴在哪?那我就需要就是把人的鼻子眼睛嘴,X軸Y軸的位置,都要標注出來,這個需要數據標記員來說肯定是非常高的。沒有這些標注,你人工智能系統都沒有辦法去判斷人臉的這些眼睛,鼻子的位置在哪里。
所以會發現數據標注本身其實蘊含了大量的人類知識,這其實我們可以推斷一個基本的結論,就是目前的人工智能是完全依附于人類的,不可能去創造出新一些新的歷史,因為人工智能所創造數據這塊,都是依賴一些人類的先驗知識。
第二點的話,就是人工智能它高度依賴計算資源,比如說現在一些人臉識別的系統,它一般都是只能放在后臺的大規模的集群計算機里面去進行計算,手機上是沒有辦法實施進行處理的。
第三點的話,就是就是說有一個詞叫做過度擬合易攻擊,舉個例子,我們比如說對于數據這個問題,比如說可能有一些在人工智能領域,可能有些不太能依靠這種智能去解決,比如說用AI去預測某個人他有沒有犯罪的傾向,這個東西其實很容易引起社會爭議,為什么?因為你從全球的角度來說,黑人或者說像長長胡須的一些人,他一定會有更大的可能被判斷為犯罪分子。很簡單,是因為在社會中黑人,或者留長胡須的人,因為受到社會的影響,還有他們社會地位比較低等等各種因素,它們的犯罪率是遠遠高出其他人,這時候其實就會產生大量的政治不正確,比如說像種族歧視的問題。
還有一個最近可能出現,有一些新的方案,比如說用AI去判斷一個人是否有黨性,你說這種東西怎么去判斷,還是我先找到一堆歷史的數據,這些歷史數據,比如說可能是人參加組織生活的這種次數,比如在微信里面發表反動言論的這種頻率等等,然后這個人是否在工作場合是否工作等等這樣一些特征,去看看這個人可能黨性比較好,黨性不好。當然你像當前的環境,你是否黨性測試會產生指鹿為馬的可能性呢?誰都不好說。
這是第一點,第二點的話就是模型它可能易受攻擊,我們舉這么一個很經典的例子,對,(ppt演示)左邊是一張原始的圖片,這是大熊貓。但是我加一個很微小的微小的一個噪聲,把這個噪聲壓到咱圖像里面,會發現這張圖片,可能以很高的概率去識別成長臂猿了。這在當前機器學習的領域是一個非常常見的現象,而且這個現象目前來說沒有辦法有效解決。為什么?因為這個模型一般來說非常的復雜,模型非常復雜,這個前提之下,你這個模型復雜,它可能會遇到一些非常奇怪的結果,
大家可以下去就畫一個,比如說大家可以下去去畫一個,比如剛才圖書那個問題,總共不是一百個點,一百個點用一次函數去擬合的話,發現可能很多點你可能誤差都是非常完整非常大的。
然后有一個很簡單方法,我可以用一百次函數去擬合,這一百個點很明顯,每個點肯定都是能夠擬合得非常好。想象一下都可以知道,一百個函數在整個空間里面,它可能是上下跳躍的幅度非常大,這個就帶來一個很現實的問題,就是過度擬合。就是說我可能預測480頁這個書有多少錢話,我可能預測一個結果:-100,這明顯就是一個過度擬合。但是比如有一本書,它在訓練數據中它可能是450頁,然后它的價格是一百塊錢??赡苓@個模型就很精確的預測出它是一百塊錢,但是451頁,他要預測的話,它是比如說0.1塊錢,這都是有可能的。但是你用線性函數,它就不會產生這樣的結果,這就是對抗樣本。
還有一個在人臉識別領域,就是有些干擾物,它對人臉識別影響非常大的。比如說上圖是一個戴特制眼鏡的一張照片,下一步當然人臉所對應的搜索結果,但是會發現肯定它不是同一個人的人臉,但是就現有的人臉識別系統很容易就判斷錯,所以說大家會在火車站發現,如果說你戴著眼鏡的話,基本上是識別不成功的。這個系統,可能會當把你當前照相人臉和身份證上人練,認為不是你同樣一個人。
反正總結一下高度依賴數據,高度依賴自然資源,過度擬合易攻擊。
另外還有兩點就是人工智能現代網絡就是知其然,不知其所以然,怎么理解呢?阿爾法去進行下棋的時候,現在就是頂級的一個棋手都不知道為什么要下到這么一個非常奇怪的位置上,而且沒有任何道理。這就是知其然而不知其所以然。
所以包括圖像理解,我有一個非常復雜的函數,把這張圖像的預測結果輸出來,但是中間他怎么操作的,人類是不能理解。
另外一點就是人類的一些動作,根本沒有辦法完成。因為人類都沒有辦法去定義,就像機器去對這些問題去定義,和學習那是不可能的,因為你沒有模型,沒有損失的函數及優化等等,這都是沒有辦法去完成一些探索新的事物。
(提問環節)好了,我就講一些基本理論的問題,然后中間可以休息一下,大家來一些提問。主持人先集中問問題,然后一分鐘后我來回答這些問題。
1.人工智能和人最本質的區別
我個人認為,是當前的人工智能還是完成人所定義的事情,也就是說他是沒有任何的思想,沒有任何的對現實問題有理解能力,還有對一些問題沒有這種拓展能力,比如人是可以對一些問題進行抽象和總結的,但是機器其實是沒有能力,他可能有的就把這些問題進行抽象,但是他就沒有能力把這些問題進行泛化。
所以說人工智能目前來說,它其實能夠解決人定義的非常好的問題,但是就是人所沒有辦法去定義和理解的問題,人工智能都沒有辦法解決。
2.自然語言處理是用什么語法,是生成語法還是范疇語法?
我不太清楚生成語法,范疇語法是什么樣的意思?我說一下我的理解吧,早期的話可能早期的話就是自然語言的處理方法,其實是有一種基于統計的方法,就是你可以把語法理解成一種概率的分布。
比如說這個名詞,主謂賓,主謂賓就是名詞動詞名詞,其實是一個標準的語法結構,大概人工智能在這處理自然語言的時候,它就會根據這樣的一個結構去進行處理,他知道第一個詞可能是主語,第二次可能是謂語,第三個詞可能是賓語。第一第三個可能是名詞,第二個詞可能是動詞,然后它基于這樣一些先驗的知識,然后去確定到底這個句子是一個什么意思。因為我知道第一個詞什么,第三個詞是什么?它都是名詞。第二個詞它是一個動作,然后它實際上這個語言它基本的意義就是能夠理解出來了,我不知道這是不是叫生成語法。
但是現在深度學習的話,基本上可能就脫離了這一套,可能就脫離了這套語法體系了。
他就是根據大量大量的數據,然后對這些大量的數據進行建模,發現好像這種語言里面它可能有ABCDEFGHIJK這些語法的結構,然后對應了另外一個語言里面,它可能是有A‘B‘C‘D‘這樣一個語法結構,然后里面有一些一一對應的關系,然后這些一一對應的關系我就可以做一些自然語言處理的,翻譯的工作。
因為我不是做自然語言處理方向,那我也只能說一些基本的處理方法。
當然了,里面最簡單一個處理方法就是詞頻上的處理。就是說比如說一個領域,剛才說垃圾郵件,比如說可能某些東西是免費的,免費這個詞就是垃圾郵件的關鍵詞,然后這樣一些關鍵詞,我就可以用這些關鍵詞,去讓它識別成垃圾郵件。包括這個群里面可能有一些敏感詞的分析,敏感詞分析其實也是一種基于關鍵詞和詞頻的處理,在機器學習和對語言進行決策的領域,詞頻是最簡單和最經典方法。
3.人工智能和數據的種類有關系嗎?
人工智能其實跟數據的種類并沒有任何的關系,關系并不是很大。當然要實際去分析問題的時候,就是語音是一個領域的,語音識別是一個領域,然后圖像識別是一個領域,自然語言領域是一個領域,不同的領域的話,它的本質就是這些不同的,不同類別的數據,大家先就近一個特征進行處理。特征一般來說都是一些實數一些實數的一個數組,然后用這個數組建立模型去進行決策。
4人工智能是否具有新的特點?
我認為現在能處理的數據,還是基本上都能處理。
「 支持烏有之鄉!」
您的打賞將用于網站日常運行與維護。
幫助我們辦好網站,宣傳紅色文化!
歡迎掃描下方二維碼,訂閱烏有之鄉網刊微信公眾號
