谷歌“猜畫小歌”隱藏了什么樣的黑科技
你的朋友圈被一款名叫“猜畫小歌”的微信小程序游戲刷屏了嗎?就在前幾天,當(dāng)小編早晨醒來習(xí)慣性的刷了一下朋友圈,結(jié)果發(fā)現(xiàn)幾乎所有人都在一夜之間成了“靈魂畫手”,其火爆程度不言而喻。
出于職業(yè)敏感和強(qiáng)大的好奇心,我決定今天來扒一扒這個“猜畫小歌”底,以及其背后的Google AI究竟在醞釀什么黑科技。
或許有的朋友不喜歡刷朋友圈,還不知道發(fā)生了什么。那么就先讓我們來了解一下“猜畫小歌”究竟是個什么鬼。
簡單的說,這是一款通過手機(jī)來繪畫的小游戲,玩家需要在游戲限定的20秒內(nèi)完成要求的繪畫,如果你的畫作被AI識別成功,那么就算順利達(dá)成。
“猜畫小歌”的一夜成名引發(fā)了全球媒體的強(qiáng)烈關(guān)注。據(jù)CNN消息,Google正在嘗試一種新方式來開拓中國市場。
據(jù)悉,“猜畫小歌”由來自Google AI的神經(jīng)網(wǎng)絡(luò)驅(qū)動,該網(wǎng)絡(luò)源自囊括超過5000萬個手繪素描的數(shù)據(jù)群。Google產(chǎn)品經(jīng)理Chris Tam在博客中說,這個游戲旨在讓人們“有機(jī)會體驗(yàn)一下人工智能的交互現(xiàn)在是多么自然”。
谷歌早在去年就通過另外一種方式回歸中國,那就是在北京成立了Google AI中國中心。
相信正是因?yàn)檫@樣的契機(jī),才會讓我們中國的用戶通過微信小程序這個途徑,獲得了這次“零距離”體驗(yàn)人工智能高科技的機(jī)會。同時也因?yàn)槲⑿艠O強(qiáng)的社交屬性,讓這款小程序游戲能夠在一夜之間火遍全中國,成為了轟炸朋友圈的利器。
好了,現(xiàn)在來劃重點(diǎn):“猜畫小歌”這款微信小程序游戲來自Google AI,其技術(shù)核心是“超過5000萬個手繪素描的數(shù)據(jù)群” 和“Google AI的神經(jīng)網(wǎng)絡(luò)驅(qū)動” 這兩大關(guān)鍵。接下來我們就從這兩個技術(shù)入手,看看Google AI正在醞釀著哪些黑科技。
首先,我們就從數(shù)據(jù)的部分入手,看看谷歌都從哪搞來這么龐大的圖形數(shù)據(jù)庫。
5000萬手繪素描數(shù)據(jù)來自哪?
按照機(jī)器的運(yùn)行邏輯,不難猜出“猜畫小歌”的核心在于“數(shù)據(jù)”和“識別”這兩大核心技術(shù)。
只要有了強(qiáng)大的數(shù)據(jù)庫支持,然后再經(jīng)過機(jī)器的篩選和識別,自然就能夠輕松的識別出你畫的是什么鬼東西了~數(shù)據(jù)庫中的有效樣本越多,那么識別的準(zhǔn)確率也會越高。
其實(shí)這個道理也可以同樣應(yīng)用于人身上,你的閱歷越豐富,那么你越容易做出正確的決定。
那么問題來了,Google AI的數(shù)據(jù)都是從哪里來?前文提及的“超過5000萬個手繪素描的數(shù)據(jù)群”又是如何產(chǎn)生的呢?
其實(shí)早在2016年,Google就推出了一個網(wǎng)頁版的《快速涂鴉》小游戲,但是由于中國大陸無法訪問Google,因此關(guān)注的人并不多。
筆者也實(shí)際體驗(yàn)了一下這款網(wǎng)頁版本的《快速涂鴉》,相比用手指在手機(jī)屏幕上作畫,通過鼠標(biāo)在網(wǎng)頁作畫的體驗(yàn)要差很多。
不過令人感到贊嘆的是,當(dāng)我的遙控器還沒畫完的時候,機(jī)器就已經(jīng)非??焖俚淖R別出,令人驚奇。
Google正是通過這個網(wǎng)頁小游戲,讓來自全球的玩家通過鼠標(biāo)在網(wǎng)頁上進(jìn)行作畫不斷的完善數(shù)據(jù)庫,以協(xié)助訓(xùn)練神經(jīng)網(wǎng)絡(luò)識別涂鴉。
按照《快速涂鴉》的網(wǎng)頁提示,我們來到了涂鴉數(shù)據(jù)的大本營。在這里匯集了全球1500萬玩家貢獻(xiàn)的超過5000萬份的涂鴉數(shù)據(jù)。
在Google看來,這些涂鴉是一個獨(dú)特的數(shù)據(jù)集,可以幫助開發(fā)人員培訓(xùn)新的神經(jīng)網(wǎng)絡(luò),幫助研究人員了解世界各地人們?nèi)绾卫L畫,并幫助藝術(shù)家創(chuàng)造我們尚未開始思考的事物。
我們點(diǎn)開“apple”這個樣本,會發(fā)現(xiàn)其實(shí)Google已經(jīng)通過這個小游戲收集了139,898個有效的數(shù)據(jù)樣本。
無論你是來自世界的任何一個地方,只要你見過蘋果,那么蘋果在你的意識形態(tài)中的樣子基本不會超出這139,898樣本之外。這也就解釋了Google AI為什么能夠如此快速的識別出你畫出圖形,因?yàn)檫@個數(shù)據(jù)庫實(shí)在是太過于強(qiáng)大了。
我現(xiàn)在越來越理解AI為什么叫人工智能了,那就是賦予機(jī)器像人一樣的邏輯和思維能力。而數(shù)據(jù)和決策,對人或者是對機(jī)器都是同等的重要。唯一不同的是,人有情感,而機(jī)器或許目前沒有,至于以后,誰知道呢~
神經(jīng)網(wǎng)絡(luò)如何像人類一樣思考?
解決了數(shù)據(jù)樣本來源的問題,那么剩下的問題就是讓機(jī)器來如何學(xué)習(xí)和分析這些數(shù)據(jù)樣本,并最終做出決策。
關(guān)于“人工智能”這個詞匯,其實(shí)我們都已經(jīng)非常熟悉了,但是或許你很少聽到“神經(jīng)網(wǎng)絡(luò)”這個詞。而很多專業(yè)的人士認(rèn)為,“神經(jīng)網(wǎng)絡(luò)”是“人工智能”發(fā)展的基石,比如模式識別、自動控制,以及最核心的深度學(xué)習(xí)都基于它。
那么神經(jīng)網(wǎng)絡(luò)究竟該如何理解呢?在很早以前,科學(xué)家們希望創(chuàng)造出能夠像人類一樣思考的機(jī)器。
經(jīng)過研究發(fā)現(xiàn),人類之所以具備思考的能力,其根本是我們體內(nèi)的神經(jīng)網(wǎng)絡(luò),而組成神經(jīng)網(wǎng)絡(luò)的個體就被稱為神經(jīng)元??茖W(xué)家們大膽設(shè)想,如果能夠制造出人工神經(jīng)元,那么就能夠制造出人工神經(jīng)網(wǎng)絡(luò),從而讓機(jī)器“深度學(xué)習(xí)”并像人一樣“思考”。
提到“深度學(xué)習(xí)”這個關(guān)鍵詞,其實(shí)你可以把具備人工神經(jīng)網(wǎng)絡(luò)的機(jī)器視為一個剛剛出生的嬰兒,而嬰兒的大腦里是一片空白。
嬰兒通過不斷的成長學(xué)習(xí)到更多的知識,并通過這些經(jīng)歷形成了獨(dú)立思考和獨(dú)立決策的能力。而機(jī)器在通過“深度學(xué)習(xí)”之后,也將具備同樣的能力。
唯一不同的是,人靠的是大腦來進(jìn)行思考。而機(jī)器是通過TPU對大量的數(shù)據(jù)進(jìn)行分析和計算并通過建立的模型來做出最終的判斷。
那么面對問題,人類是如何思考的呢?舉個簡單的例子,你正在為中午吃什么而發(fā)愁。
擺在你面前的是三個問題:①沙縣小吃是否好吃;②沙縣小吃遠(yuǎn)不遠(yuǎn);③外面天氣怎么樣。
經(jīng)過觀察和思考你會發(fā)現(xiàn):你喜歡吃沙縣小吃,最近的沙縣小吃有點(diǎn)遠(yuǎn),外面天氣不錯。于是你糾結(jié)了,但你真的是個吃貨,最終你決定:今天中午走遠(yuǎn)一點(diǎn)去吃沙縣小吃。
和你不同的是,機(jī)器會把這一切都變成0和1來進(jìn)行計算。
比如問題①沙縣小吃好不好吃?答案是0代表好,1代表不好。機(jī)器通過采集到的數(shù)據(jù)對不同的問題進(jìn)行判斷,形成不同的0或者1。那么機(jī)器如何做最終的決定呢?
機(jī)器會把不同的問題加上一個加權(quán)值。比如你對口味要求高,那么問題“①沙縣小吃是否好吃”的權(quán)重就更高;相反你不太在意距離的遠(yuǎn)近,那么問題“②沙縣小吃遠(yuǎn)不遠(yuǎn)”的權(quán)重就會很低。
通過對不同問題分析和判斷,并輔以加權(quán)值的復(fù)雜計算,最終機(jī)器會計算出一個結(jié)果:今天中午走遠(yuǎn)一點(diǎn)去吃沙縣小吃。
就是這樣,機(jī)器和你都做出了你認(rèn)為十分正確的決定,而且都經(jīng)歷了“觀察”和“思考”的過程。
唯一不同的是,你是通過大腦里神經(jīng)元的微電荷來做出的決定,而機(jī)器是通過構(gòu)建模型、大量數(shù)據(jù)的分析、對比、計算、加權(quán)……等一系列的復(fù)雜計算而做出的。