身為全球最大社交網(wǎng)絡(luò),F(xiàn)acebook的人工智能究竟是什么水平?

來(lái)源:網(wǎng)絡(luò) 時(shí)間:2017-03-01 14:10:17

身為全球最大社交網(wǎng)絡(luò),F(xiàn)acebook的人工智能究竟是什么水平?

【AI世代編者按】美國(guó)科技新聞網(wǎng)站BackChannel近日刊文,介紹了Facebook內(nèi)部的人工智能團(tuán)隊(duì)及其發(fā)展現(xiàn)狀。

以下為AI世代(微信:tencentAI)編譯整理的文章內(nèi)容:

在被任命為Facebook應(yīng)用機(jī)器學(xué)習(xí)事業(yè)部(以下簡(jiǎn)稱(chēng)“AML”)負(fù)責(zé)人,幫助這家全球最大社交網(wǎng)絡(luò)部署人工智能技術(shù)時(shí),杰奎因·奎諾內(nèi)羅·坎德拉(Joaquin Quinonero Candela)有些遲疑。

杰奎因·坎德拉,F(xiàn)acebookAML事業(yè)部工程總監(jiān)

坎德拉是一位出生在西班牙的科學(xué)家,他總是自稱(chēng)“機(jī)器學(xué)習(xí)人士”。之所以有所遲疑,并不是因?yàn)樗麤](méi)有目睹人工智能給Facebook帶來(lái)了多大的幫助。自從2012年加盟這家社交網(wǎng)絡(luò)巨頭以來(lái),他已經(jīng)見(jiàn)證了該公司廣告業(yè)務(wù)的轉(zhuǎn)變——他們利用機(jī)器學(xué)習(xí)技術(shù)提升了贊助內(nèi)容的相關(guān)性和營(yíng)銷(xiāo)效果。

更重要的是,他通過(guò)一種獨(dú)特的方式用技術(shù)武裝自己部門(mén)的下屬——即便這些人并沒(méi)有接受過(guò)專(zhuān)業(yè)的人工智能技術(shù)培訓(xùn)。不僅如此,他還擴(kuò)大了機(jī)器學(xué)習(xí)技術(shù)在整個(gè)廣告部門(mén)的普及程度。

但他并不確定同樣的“魔法”能在更大范圍內(nèi)展現(xiàn)出來(lái),因?yàn)檫@個(gè)平臺(tái)上的數(shù)十億用戶之間的聯(lián)系取決于模糊的價(jià)值觀,而不是用來(lái)衡量廣告的硬性數(shù)據(jù)?!拔倚枰_定這么做的確有價(jià)值。”他提到這次任命時(shí)如是說(shuō)。

盡管有些懷疑,坎德拉還是接受了任命。而現(xiàn)在雖然距離那時(shí)僅僅過(guò)去兩年時(shí)間,但他當(dāng)初的遲疑卻變得非常可笑。

究竟有多可笑?坎德拉上月在紐約的一次會(huì)議上對(duì)臺(tái)下的一眾工程師發(fā)表了演講?!拔乙l(fā)表一份重要聲明?!彼嬲f(shuō),“如果沒(méi)有人工智能,F(xiàn)acebook如今已經(jīng)無(wú)法存在下去。你或許并未意識(shí)到,但每當(dāng)你使用Facebook或Instagram或Messenger時(shí),你的使用體驗(yàn)都有人工智能的一份功勞?!?/p>

去年11月,我來(lái)到Facebook位于門(mén)羅帕克的總部采訪坎德拉和他的團(tuán)隊(duì)時(shí),便得以目睹人工智能如何在突然之間成為Facebook的生存養(yǎng)料。目前為止,提到Facebook在這一領(lǐng)域的發(fā)展,很多目光都會(huì)集中于該公司組建的世界級(jí)Facebook人工智能研究事業(yè)部(以下簡(jiǎn)稱(chēng)“FAIR”),該部門(mén)的領(lǐng)導(dǎo)者是著名的神經(jīng)網(wǎng)絡(luò)專(zhuān)家嚴(yán)·勒坤(Yann LeCun)。

與谷歌(微博)微軟、百度、亞馬遜和蘋(píng)果(這家以保密著稱(chēng)的公司如今也允許其科學(xué)家發(fā)布研究成果)等競(jìng)爭(zhēng)對(duì)手一樣,F(xiàn)AIR也成為供不應(yīng)求的頂尖人工智能項(xiàng)目畢業(yè)生優(yōu)先選擇的公司。計(jì)算機(jī)在視覺(jué)、聽(tīng)覺(jué)甚至對(duì)話能力上取得的進(jìn)步都得益于這種類(lèi)似于大腦的數(shù)字神經(jīng)網(wǎng)絡(luò),而FAIR則是這方面研究成果最為豐厚的機(jī)構(gòu)之一。

但坎德拉的AML事業(yè)部則負(fù)責(zé)將FAIR的研究成果與Facebook的實(shí)際產(chǎn)品融合到一起,更重要的是,他們還將幫助該公司的所有工程師,把機(jī)器學(xué)習(xí)技術(shù)融合到自己的工作中。

由于Facebook已經(jīng)離不開(kāi)人工智能,所以所有工程師都必須使用這項(xiàng)技術(shù)。

把人工智能塞到每個(gè)人手中

就在我造訪Facebook前兩天,美國(guó)剛剛結(jié)束總統(tǒng)大選,而該公司CEO馬克·扎克伯格(Mark Zuckerberg)也剛剛在一天前回應(yīng)稱(chēng),那些宣稱(chēng)Facebook傳播假新聞幫助唐納德·特朗普(Donald Trump)當(dāng)選美國(guó)總統(tǒng)的想法“太瘋狂”。由于人們之前就對(duì)Facebook的假新聞泛濫狀況心懷不滿,所以扎克伯格的這番評(píng)論無(wú)異于火上澆油。

盡管很多爭(zhēng)議并不在坎德拉的職責(zé)范圍內(nèi),但他知道,F(xiàn)acebook需要借助機(jī)器學(xué)習(xí)技術(shù)來(lái)解決假新聞危機(jī),而這恰恰是他團(tuán)隊(duì)的職責(zé)之一。

但為了讓公司內(nèi)部的公關(guān)人員安心,坎德拉還向我展示其他一些東西,以此體現(xiàn)他的團(tuán)隊(duì)正在從事的工作。令我意外的是,這其實(shí)是一套有點(diǎn)無(wú)聊的把戲:它可以將一張照片或一段視頻按照某位著名畫(huà)家的獨(dú)特風(fēng)格進(jìn)行渲染。這很容易讓我們想起Snapchat上的各種噱頭——把照片轉(zhuǎn)化成畢加索風(fēng)格的畫(huà)作早已不是什么新鮮技術(shù)。

“這種技術(shù)名為神經(jīng)風(fēng)格轉(zhuǎn)移?!彼忉尩溃熬褪且惶状笠?guī)模的神經(jīng)網(wǎng)絡(luò),它可以通過(guò)訓(xùn)練將一張照片重新繪制成特定風(fēng)格的畫(huà)作?!?他掏出自己的手機(jī),拍了一張照片,然后在屏幕上操作了一番,照片很快就被渲染稱(chēng)梵高名畫(huà)《星夜》(The Starry Night)的風(fēng)格。

更令人驚奇的是,他還能在視頻播放過(guò)程中將內(nèi)容渲染成類(lèi)似的風(fēng)格。但他表示,真正重要的東西其實(shí)是在肉眼無(wú)法看到的:Facebook開(kāi)發(fā)的神經(jīng)網(wǎng)絡(luò)已經(jīng)可以在手機(jī)上獨(dú)立運(yùn)行。

這同樣不算新奇——蘋(píng)果之前也宣稱(chēng)已經(jīng)可以在iPhone上完成一些神經(jīng)網(wǎng)絡(luò)計(jì)算。但由于Facebook并不控制硬件,所以他們面臨的難度要大得多。坎德拉表示,他的團(tuán)隊(duì)之所以能完成這套“把戲”,是因?yàn)樗麄兎e累了大量經(jīng)驗(yàn)——每個(gè)項(xiàng)目都可以降低其他項(xiàng)目的工作難度,每個(gè)項(xiàng)目也都可以讓未來(lái)的產(chǎn)品在接受更少培訓(xùn)的情況下,開(kāi)發(fā)類(lèi)似的產(chǎn)品——從而加快類(lèi)似項(xiàng)目的開(kāi)發(fā)速度。

“從啟動(dòng)項(xiàng)目到公開(kāi)測(cè)試,我只花了8個(gè)星期,這太瘋狂了。”他說(shuō)。

他表示,在這么短時(shí)間內(nèi)完成任務(wù)還有另外一個(gè)秘訣,那就是合作——這也恰恰是Facebook文化的基石。具體到這個(gè)項(xiàng)目,正是因?yàn)槟軌蜉p易接觸到其他事業(yè)部的研究成果——尤其是熟悉iPhone硬件的移動(dòng)部門(mén)——才使得他們能夠把原本需要借助數(shù)據(jù)中心才能完成的圖像渲染任務(wù),通過(guò)手機(jī)來(lái)獨(dú)立實(shí)現(xiàn)。

從左到右依次為AML事業(yè)部工程總監(jiān)杰奎因·坎德拉,應(yīng)用計(jì)算機(jī)視覺(jué)團(tuán)隊(duì)負(fù)責(zé)人馬諾哈·帕魯麗,技術(shù)產(chǎn)品精力里塔·阿奎諾,工程經(jīng)理拉簡(jiǎn)·蘇巴

這項(xiàng)技術(shù)不僅可以方便用戶為自己的親友拍攝《吶喊》風(fēng)格的短片,還能讓整個(gè)Facebook變得更加強(qiáng)大。從短期來(lái)看,這讓該公司得以更好地解讀語(yǔ)言、理解文本。從長(zhǎng)期來(lái)看,他還能對(duì)你的所見(jiàn)、所言展開(kāi)實(shí)時(shí)分析。

“我們以秒為單位,甚至比秒還短——必須實(shí)時(shí)完成。”他說(shuō),“我們是社交網(wǎng)絡(luò),如果我要預(yù)測(cè)人們對(duì)某段內(nèi)容的反饋,我的系統(tǒng)就要立刻作出反應(yīng),對(duì)嗎?”

坦德勒又看了一眼他剛才拍的那張梵高風(fēng)格的自拍像,完全不屑于掩飾自豪之情?!澳軌蛟谑謾C(jī)上運(yùn)行復(fù)雜的神經(jīng)網(wǎng)絡(luò),便能將人工智能放到所有人的手上?!彼f(shuō),“這并不是偶然發(fā)生的,這都得益于我們?cè)诠緝?nèi)部展示人工智能的方式?!?/p>

“這是一場(chǎng)漫長(zhǎng)的旅程?!彼a(bǔ)充道。

微軟老兵大顯神威

坎德拉出生在西班牙,他3歲時(shí)隨家人搬到摩洛哥,在那里的法語(yǔ)學(xué)校就讀。盡管畢業(yè)時(shí)的文理學(xué)科都獲得高分,但他還是決定入讀馬德里的一所學(xué)校,學(xué)習(xí)一門(mén)在他看來(lái)最難的學(xué)科:通信工程。這門(mén)學(xué)科不僅需要掌握天線和放大器等物理知識(shí),還要對(duì)數(shù)據(jù)有充分的理解,他認(rèn)為這“很酷”。

坎德拉對(duì)開(kāi)發(fā)自適應(yīng)系統(tǒng)的教授非常著迷。他自己開(kāi)發(fā)了一套系統(tǒng),利用智能過(guò)濾器來(lái)改善手機(jī)漫游信號(hào),他現(xiàn)在將其稱(chēng)做“嬰兒階段的神經(jīng)網(wǎng)絡(luò)”。他對(duì)訓(xùn)練算法格外著迷,而不太喜歡大量編寫(xiě)代碼。2000年在丹麥度過(guò)的一個(gè)學(xué)期進(jìn)一步激發(fā)了他在這方面的興趣,他在那里見(jiàn)到了機(jī)器學(xué)習(xí)教授卡爾·拉斯穆森(Carl Rasmussen)。

拉斯姆森曾在多倫多師從傳奇人物、機(jī)器學(xué)習(xí)鼻祖吉奧夫·辛頓(Geoff Hinton)。畢業(yè)前夕的坎德拉原本要參加寶潔的領(lǐng)導(dǎo)力項(xiàng)目,但卻接到了拉斯姆森的博士項(xiàng)目邀請(qǐng)。于是,他選擇了機(jī)器學(xué)習(xí)。

2007年,他來(lái)到位于英國(guó)劍橋的微軟研究院工作。入職后不久,他獲悉微軟正在舉行一項(xiàng)面向所有員工的競(jìng)賽:該公司即將推出必應(yīng)搜索,所以需要對(duì)關(guān)鍵字搜索廣告進(jìn)行改進(jìn)——精確預(yù)測(cè)用戶何時(shí)會(huì)點(diǎn)擊一則廣告。

優(yōu)勝團(tuán)隊(duì)的方案將被投入實(shí)體測(cè)試,以便了解它是否有最終發(fā)布的價(jià)值。而優(yōu)勝團(tuán)隊(duì)本身也將獲得免費(fèi)的夏威夷旅行作為獎(jiǎng)勵(lì)。共有19個(gè)團(tuán)隊(duì)參與競(jìng)賽,坎德拉的團(tuán)隊(duì)與另外一個(gè)團(tuán)隊(duì)并列第一。他獲得了免費(fèi)旅行的機(jī)會(huì),但由于微軟遲遲沒(méi)有推進(jìn)更重要的獎(jiǎng)勵(lì),導(dǎo)致他感覺(jué)自己被欺騙了——微軟一直沒(méi)有對(duì)他的方案展開(kāi)測(cè)試,以判斷這個(gè)方案能否最終作為產(chǎn)品推出。

接下來(lái)發(fā)生的事情展示出坎德拉的堅(jiān)決態(tài)度。他展開(kāi)了一場(chǎng)“瘋狂的運(yùn)動(dòng)”,說(shuō)服微軟給他一次機(jī)會(huì)。他在微軟內(nèi)部展開(kāi)了五十多次對(duì)話,還開(kāi)發(fā)了一個(gè)模擬器來(lái)展示自己算法的優(yōu)越性。他甚至找到直接負(fù)責(zé)這項(xiàng)決策的副總裁:他在吃自助餐時(shí)主動(dòng)坐到那位副總裁身邊,甚至?xí)プ「黄鹕蠋臋C(jī)會(huì)向其宣傳自己的方案。他還在沒(méi)有事先請(qǐng)示的情況下闖入這位高管的辦公室,聲稱(chēng)說(shuō)話必須算數(shù),他的算法的確更好。

最終,坎德拉的算法在2009年隨同必應(yīng)一起推出。

Facebook 20號(hào)樓內(nèi)景

2012年初的一個(gè)周五,坎德拉到Facebook門(mén)羅帕克園區(qū)拜訪了一個(gè)朋友。讓他震驚的是,他聽(tīng)說(shuō)該公司的員工不需要獲得上司批準(zhǔn),也可以測(cè)試自己的項(xiàng)目。他們就是這么做的。于是他星期一便去Facebook參加面試,周末就拿到了錄取通知。

加入Facebook廣告團(tuán)隊(duì)后,坎德拉的工作是領(lǐng)導(dǎo)一個(gè)小組來(lái)展示相關(guān)性更強(qiáng)的廣告。當(dāng)時(shí)的確使用了機(jī)器學(xué)習(xí)技術(shù),“但我們當(dāng)時(shí)使用的模型不算先進(jìn),太過(guò)簡(jiǎn)單”??驳吕f(shuō)。

還有一位與坎德拉同時(shí)加盟Facebook的工程師,他叫侯賽因·梅哈納(Hussein Mehanna),他對(duì)該公司在人工智能集成度方面的落后程度同樣感到驚訝。“以外人的身份看待他們的產(chǎn)品質(zhì)量時(shí),我以為一切都已成型,但顯然并非如此?!泵饭{說(shuō),“沒(méi)過(guò)幾個(gè)星期,我就告訴杰奎因,F(xiàn)acebook真正缺乏的是一個(gè)行之有效的世界級(jí)機(jī)器學(xué)習(xí)平臺(tái)。我們雖然擁有機(jī)器,但卻沒(méi)有合適的軟件幫助機(jī)器對(duì)數(shù)據(jù)展開(kāi)盡可能深入的學(xué)習(xí)?!保壳皳?dān)任Facebook核心機(jī)器學(xué)習(xí)負(fù)責(zé)人的梅哈納同樣是微軟老兵——接受本文采訪的其他幾名工程師也都有著相同的身份。這僅僅是巧合嗎?)

梅哈納所說(shuō)的“機(jī)器學(xué)習(xí)平臺(tái)”指的是部署一套最先進(jìn)的人工智能范式:憑借著基于人腦行為模式的幾種模型,這種范式把這項(xiàng)技術(shù)從上個(gè)世紀(jì)的“寒冬”(當(dāng)時(shí),早期的“思維機(jī)”想法已經(jīng)提不起人們的興趣)帶到了最近的繁榮時(shí)期。

具體到廣告業(yè)務(wù),F(xiàn)acebook需要讓它的系統(tǒng)完成一些人力無(wú)法企及的任務(wù):實(shí)時(shí)而精確地預(yù)測(cè)有多少人會(huì)點(diǎn)擊某一條廣告??驳吕退膱F(tuán)隊(duì)希望根據(jù)機(jī)器學(xué)習(xí)流程開(kāi)發(fā)一套新系統(tǒng)。而由于該團(tuán)隊(duì)希望以平臺(tái)的方式來(lái)打造這套系統(tǒng),讓該部門(mén)內(nèi)的所有工程師都可以使用,所以他們?cè)陂_(kāi)發(fā)過(guò)程中努力確保建模和訓(xùn)練都能廣泛推廣和復(fù)制。

構(gòu)建機(jī)器學(xué)習(xí)系統(tǒng)的重要因素之一便是獲得海量數(shù)據(jù)——數(shù)據(jù)越多,效果越好。幸運(yùn)的是,這恰恰是Facebook最大的資產(chǎn)之一:如果每天都有十多億人與你的產(chǎn)品互動(dòng),你就可以收集大量培訓(xùn)資料,獲得數(shù)不清的用戶行為范例。

這也讓整個(gè)廣告團(tuán)隊(duì)的開(kāi)發(fā)速度從幾個(gè)星期推出一個(gè)新模型,變成了每個(gè)星期推出幾個(gè)新模型。而由于這將成為一個(gè)平臺(tái),讓其他人也可以在內(nèi)部開(kāi)發(fā)自己的產(chǎn)品,所以坎德拉必須在開(kāi)發(fā)過(guò)程中讓多個(gè)團(tuán)隊(duì)都參與其中。他們把整個(gè)過(guò)程精確地分成三個(gè)步驟:“先關(guān)注性能,再關(guān)注實(shí)用性,然后構(gòu)建一個(gè)社區(qū)?!彼f(shuō)。

坎德拉的廣告團(tuán)隊(duì)已經(jīng)證明機(jī)器學(xué)習(xí)給Facebook帶來(lái)的巨大轉(zhuǎn)變?!拔覀?cè)陬A(yù)測(cè)點(diǎn)擊、點(diǎn)贊、轉(zhuǎn)化等指標(biāo)時(shí)實(shí)現(xiàn)了不可思議的成功?!彼f(shuō)。接下來(lái)自然是將這種方法延伸到更多服務(wù)中。事實(shí)上,F(xiàn)AIR負(fù)責(zé)人勒坤一直主張?jiān)O(shè)立一個(gè)與之配合的部門(mén),負(fù)責(zé)將人工智能技術(shù)應(yīng)用到實(shí)際產(chǎn)品中。

“我非常希望成立這樣一個(gè)部門(mén),因?yàn)槟阈枰M織一群頂尖工程師,雖然他們不必直接關(guān)注產(chǎn)品,但卻需要關(guān)注基礎(chǔ)技術(shù),好讓很多產(chǎn)品部門(mén)都可以對(duì)其加以利用?!崩绽ふf(shuō)。

2015年10月,坎德拉成為新成立的AML團(tuán)隊(duì)負(fù)責(zé)人(但只擔(dān)任了一段時(shí)間,原因在于他很謹(jǐn)慎,而且同時(shí)保留了廣告部門(mén)的職位,需要同時(shí)身兼二職。)他與FAIR保持了密切關(guān)系,后者在紐約、巴黎、門(mén)羅帕克都設(shè)立了辦事處。事實(shí)上,無(wú)論FAIR的研究員與AML的工程師在哪里比鄰而坐,就相當(dāng)于在那里設(shè)立了一個(gè)FAIR辦事處。

雙方的合作方式可以通過(guò)一款正在開(kāi)發(fā)的產(chǎn)品全面體現(xiàn)出來(lái):這款產(chǎn)品可以針對(duì)用戶發(fā)表在Facebook上的照片提供語(yǔ)音描述。過(guò)去幾年,訓(xùn)練一套系統(tǒng)識(shí)別某個(gè)場(chǎng)景中的物體,并得出一般性的結(jié)論,已經(jīng)成為標(biāo)準(zhǔn)的人工智能實(shí)踐模式。例如,可以通過(guò)這項(xiàng)技術(shù)判斷一張照片究竟是在室內(nèi)還是室外拍攝的。

但FAIR的科學(xué)家最近發(fā)現(xiàn)了一些方式來(lái)訓(xùn)練神經(jīng)網(wǎng)絡(luò),幾乎可以描述一張圖片中所有有趣的問(wèn)題,并通過(guò)這些物體在圖片中的位置以及與其他物體的關(guān)系,判斷這張照片的主題——從而精確分析出某張照片的主題是人與人的擁抱,還是某人正在騎馬。

“我們把這項(xiàng)成果展示給AML的人。”勒坤說(shuō),“他們想了一會(huì)兒說(shuō),‘你知道,這在一種情況下非常有用?!?他們之后便開(kāi)發(fā)了一款原型功能,當(dāng)盲人和視力受損的人將手指放在一張照片上時(shí),便可用手機(jī)為其描繪照片上的內(nèi)容。

“我們一直在溝通?!笨驳吕岬紽AIR時(shí)說(shuō)道,“整體目標(biāo)是把基礎(chǔ)科學(xué)轉(zhuǎn)化成具體項(xiàng)目,這就需要一種粘合劑,對(duì)吧?我們就是粘合劑。”

把基礎(chǔ)研究用于實(shí)踐

坎德拉將人工智能應(yīng)用分為四大領(lǐng)域:視覺(jué)、語(yǔ)言、語(yǔ)音和拍攝效果。他表示,這四大領(lǐng)域都可以促成一套“內(nèi)容理解引擎”。Facebook希望了解如何才能真正理解某段內(nèi)容的含義,從而判斷評(píng)論背后的細(xì)微意圖;參透語(yǔ)言背后的精確含義;在飛速而過(guò)的視頻畫(huà)面中識(shí)別朋友的面部;解讀你的面部表情并將其復(fù)制到虛擬現(xiàn)實(shí)的化身上。

“我們希望實(shí)現(xiàn)人工智能技術(shù)的通用應(yīng)用。”坎德拉說(shuō),“我們需要理解和分析的內(nèi)容呈現(xiàn)爆炸式增長(zhǎng),但我們添加標(biāo)簽和區(qū)分事物的能力卻沒(méi)有同步提升?!?要解決這個(gè)問(wèn)題,就要開(kāi)發(fā)一套通用系統(tǒng),使得一個(gè)項(xiàng)目的成果可以進(jìn)行累積,還能為其他從事相關(guān)項(xiàng)目的團(tuán)隊(duì)提供幫助。

坎德拉說(shuō):“如果我能開(kāi)發(fā)許多算法,把一項(xiàng)任務(wù)的知識(shí)轉(zhuǎn)移到另一項(xiàng)任務(wù),那豈不是很了不起?”

這種轉(zhuǎn)化可以對(duì)Facebook推出產(chǎn)品的速度產(chǎn)生重大影響。以Instagram為例。自從推出以來(lái),這款圖片服務(wù)都以逆向時(shí)間順序展示用戶的照片。但在2016年初,該公司決定使用相關(guān)性算法展示圖片。

好消息是,由于AML已經(jīng)在News Feed等產(chǎn)品中應(yīng)用了這種算法,“不必從頭開(kāi)始?!笨驳吕f(shuō),“他們有一兩個(gè)精通機(jī)器學(xué)習(xí)的工程師與幾十個(gè)正在部署各種排名應(yīng)用的團(tuán)隊(duì)展開(kāi)聯(lián)系。之后便可復(fù)制這些模式,一旦有問(wèn)題,還可以與這些模式的負(fù)責(zé)人溝通?!闭蛉绱?,Instagram才得以在短短幾個(gè)月內(nèi)完成如此重大的轉(zhuǎn)變。

AML團(tuán)隊(duì)一直在探索各種用例,用自己的神經(jīng)網(wǎng)絡(luò)與不同團(tuán)隊(duì)的成果進(jìn)行結(jié)合,從而開(kāi)發(fā)一項(xiàng)適用于“Facebook規(guī)?!钡莫?dú)特功能?!拔覀?cè)谑褂脵C(jī)器學(xué)習(xí)技術(shù)構(gòu)建自己的核心能力,同時(shí)取悅我們的用戶?!盇ML感知團(tuán)隊(duì)首席工程師唐默·萊萬(wàn)德(Tommer Leyvand)說(shuō)。(他同樣來(lái)自微軟。)

最近推出的一項(xiàng)名為“社交推薦”(Social Recommendations)的功能就是典型例子。大約一年前,一位AML工程師跟一位Facebook共享團(tuán)隊(duì)產(chǎn)品經(jīng)理談到了人們?cè)谙蚝糜颜髑螽?dāng)?shù)氐牟宛^和服務(wù)建議時(shí)展開(kāi)的深度互動(dòng)。

“問(wèn)題在于如何向用戶展示相關(guān)信息。”AML自然語(yǔ)言團(tuán)隊(duì)產(chǎn)品經(jīng)理里塔·阿奎諾(Rita Aquino)說(shuō)。共享團(tuán)隊(duì)曾經(jīng)嘗試對(duì)特定短語(yǔ)進(jìn)行文字匹配?!爱?dāng)你每天接受10億個(gè)帖子時(shí),這未必很精確,也未必可以大范圍應(yīng)用?!卑⒖Z說(shuō)。

Facebook技術(shù)產(chǎn)品經(jīng)理里塔·阿奎諾

通過(guò)訓(xùn)練神經(jīng)網(wǎng)絡(luò),然后用實(shí)時(shí)行為來(lái)測(cè)試各種模型,該團(tuán)隊(duì)便可察覺(jué)細(xì)微的語(yǔ)言差異,從而精確判斷用戶何時(shí)針對(duì)某一區(qū)域詢(xún)問(wèn)就餐或購(gòu)物建議。這便會(huì)觸發(fā)一條請(qǐng)求,顯示在相應(yīng)聯(lián)系人的News Feed信息流中。接下來(lái),仍然由機(jī)器學(xué)習(xí)來(lái)判斷他人何時(shí)提供有用的建議,并將企業(yè)或餐廳的地點(diǎn)顯示在用戶News Feed信息流里的地圖上。

阿奎諾表示,她在Facebook任職的一年半期間,人工智能從產(chǎn)品中難得一見(jiàn)的元素,變成了從初始階段就融入其中的技術(shù)?!叭藗兿Mc之互動(dòng)的產(chǎn)品更加智能。”她說(shuō),“其他團(tuán)隊(duì)看到社交推薦功能和我們的代碼后會(huì)問(wèn):‘你們我們?nèi)绾尾拍茏龅??’你不必非得是機(jī)器學(xué)習(xí)專(zhuān)家,也可以根據(jù)自己所在部門(mén)的經(jīng)驗(yàn)進(jìn)行嘗試?!?/p>

具體到自然語(yǔ)言處理領(lǐng)域,該團(tuán)隊(duì)也開(kāi)發(fā)了一套可以方便其他團(tuán)隊(duì)使用的Deep Text系統(tǒng)。它對(duì)Facebook翻譯功能使用的機(jī)器學(xué)習(xí)技術(shù)起到了幫助,這項(xiàng)技術(shù)每天被應(yīng)用到40多億帖子中。

在圖片和視頻領(lǐng)域,AML團(tuán)隊(duì)則開(kāi)發(fā)了一套名為L(zhǎng)umos的機(jī)器學(xué)習(xí)視覺(jué)平臺(tái)。這個(gè)平臺(tái)最早源自馬諾哈·帕魯麗(Manohar Paluri),當(dāng)時(shí)身為FAIR實(shí)習(xí)生的他負(fù)責(zé)開(kāi)發(fā)一個(gè)宏偉的機(jī)器學(xué)習(xí)項(xiàng)目,他稱(chēng)之為“Facebook的視覺(jué)皮質(zhì)”——其目的是處理和理解Facebook上發(fā)布的所有圖片和視頻內(nèi)容。

應(yīng)用計(jì)算機(jī)視覺(jué)團(tuán)隊(duì)負(fù)責(zé)人馬諾哈·帕魯麗

在2014年的一場(chǎng)黑客松活動(dòng)上,帕魯麗和同事尼基爾·喬里(Nikhil Johri)用一天半時(shí)間開(kāi)發(fā)了一個(gè)原型產(chǎn)品,并將結(jié)果展示給滿懷熱情的扎克伯格和Facebook COO雪莉·桑德伯格(Sheryl Sandberg)。

當(dāng)坎德拉組建AML事業(yè)部后,帕魯麗與他一同領(lǐng)導(dǎo)計(jì)算機(jī)視覺(jué)團(tuán)隊(duì),并開(kāi)發(fā)了Lumos,幫助所有Facebook工程師(包括Instagram、Messenger、WhatsApp和Oculus)充分利用這個(gè)視覺(jué)皮質(zhì)。

有了Lumos,“公司里的任何人都可以使用這些多樣化的神經(jīng)網(wǎng)絡(luò)上的功能,然后針對(duì)他們特定的場(chǎng)景構(gòu)建各種模型,了解實(shí)際運(yùn)行效果?!迸留旣愓f(shuō),他同時(shí)任職于AML和FAIR兩個(gè)團(tuán)隊(duì),“最后可以讓一個(gè)人來(lái)給系統(tǒng)糾錯(cuò),對(duì)其重新訓(xùn)練,然后推動(dòng)它進(jìn)步,不需要AML團(tuán)隊(duì)再介入其中?!?/p>

帕魯麗給我簡(jiǎn)單地展示了效果。他在筆記本上啟動(dòng)Lumos,然后運(yùn)行了一個(gè)樣本任務(wù):提煉神經(jīng)網(wǎng)絡(luò)對(duì)直升機(jī)的識(shí)別能力。有一個(gè)頁(yè)面上包含很多圖片——如果我們不斷滾屏,大約會(huì)有5000張圖片——里面有很多直升機(jī)照片,還有一些類(lèi)似直升機(jī)的東西。(一個(gè)是玩具直升機(jī),還有一些則是像直升機(jī)一樣飄在空中的物體。)

在訓(xùn)練過(guò)程中,F(xiàn)acebook使用了公開(kāi)發(fā)布的圖片(不包括僅限于好友或部分用戶查看的內(nèi)容)。即便我并不是工程師,對(duì)人工智能技術(shù)更談不上精通,但我卻可以輕而易舉地找到負(fù)面例子來(lái)訓(xùn)練系統(tǒng)構(gòu)建“直升機(jī)圖片分類(lèi)器”。

最終,這個(gè)被稱(chēng)作“監(jiān)督式學(xué)習(xí)”的歸類(lèi)步驟可能更加自動(dòng)化,因?yàn)樵摴菊谧非髾C(jī)器學(xué)習(xí)領(lǐng)域的圣杯——“非監(jiān)督式學(xué)習(xí)”——在這種模式下,神經(jīng)網(wǎng)絡(luò)可以自己判斷這些圖片中究竟是什么內(nèi)容。帕魯麗表示,該公司已經(jīng)取得了一些進(jìn)展?!拔覀兊哪繕?biāo)是在未來(lái)1年將人類(lèi)的注釋減少100倍?!彼f(shuō)。

從長(zhǎng)遠(yuǎn)來(lái)看,F(xiàn)acebook認(rèn)為視覺(jué)皮質(zhì)將與自然語(yǔ)言平臺(tái)共同成為坎德拉所謂的通用內(nèi)容理解引擎?!拔覀冏罱K無(wú)疑會(huì)將它們?nèi)跒橐惑w。”帕魯麗說(shuō),“到那時(shí),我們就會(huì)直接開(kāi)發(fā)‘皮質(zhì)’。”

Facebook希望他們?cè)诩夹g(shù)進(jìn)步中使用的核心原則可以通過(guò)發(fā)表論文等方式傳播到公司外部,利用這種民主化模式更加廣泛地傳播機(jī)器學(xué)習(xí)技術(shù)?!澳悴槐卦倩ㄙM(fèi)漫長(zhǎng)的時(shí)間開(kāi)發(fā)智能應(yīng)用,速度可以大幅加快。”梅哈納說(shuō),“想象一下這項(xiàng)技術(shù)對(duì)制藥、安全和交通的影響。我認(rèn)為,在這些領(lǐng)域開(kāi)發(fā)應(yīng)用的速度可以加快好幾百個(gè)量級(jí)?!?/p>

面臨無(wú)解難題

盡管AML已經(jīng)深度融合到研發(fā)流程之中,為該公司的產(chǎn)品賦予了視覺(jué)、分析甚至語(yǔ)言能力,但該公司CEO扎克伯格還認(rèn)為,在他努力利用Facebook為社會(huì)創(chuàng)造福利的過(guò)程中,這項(xiàng)技術(shù)將起到至關(guān)重要的作用。

在扎克伯格之前發(fā)表的5700字宣言中,這位CEO 7次提到了“人工智能”或“AI”,都是在描述如何利用機(jī)器學(xué)習(xí)和其他技術(shù)提升社會(huì)安全性和信息量的背景下提到的。

要實(shí)現(xiàn)這些目標(biāo)并非易事,這與坎德拉最初對(duì)AML的職位猶豫不決時(shí)的原因相同。如果你試圖成為主要的信息來(lái)源,并為數(shù)十億用戶構(gòu)建個(gè)人關(guān)系,即使是機(jī)器學(xué)習(xí)也無(wú)法解決這一過(guò)程中面臨的所有人為問(wèn)題。正因如此,F(xiàn)acebook才不斷修改News Feed算法——當(dāng)你自己都無(wú)法真正確定時(shí),又該如何通過(guò)訓(xùn)練讓系統(tǒng)給出最優(yōu)組合呢?

“我認(rèn)為這個(gè)問(wèn)題幾乎無(wú)解?!笨驳吕f(shuō),“如果隨機(jī)展示新聞,你會(huì)覺(jué)得浪費(fèi)時(shí)間。如果只展示來(lái)自朋友的新聞,那就會(huì)贏家通吃。最終會(huì)不停地討論兩種極端情況之間的哪個(gè)狀態(tài)才是最好的。我們?cè)噲D展開(kāi)一些探索。”

Facebook將繼續(xù)使用人工智能來(lái)解決這個(gè)問(wèn)題,這已經(jīng)成為其在每個(gè)領(lǐng)域發(fā)展的基礎(chǔ)動(dòng)力。“機(jī)器學(xué)習(xí)和人工智能領(lǐng)域有很多研究都希望能夠優(yōu)化合適的探索水平?!笨驳吕瓭M懷希望地說(shuō)。

當(dāng)Facebook被人當(dāng)做假新聞的元兇時(shí),他們自然會(huì)要求人工智能團(tuán)隊(duì)盡快從該平臺(tái)上清洗所有的新聞毒瘤。這是一場(chǎng)罕見(jiàn)的全員行動(dòng),甚至連一向著眼長(zhǎng)期前景的FAIR團(tuán)隊(duì)也參與進(jìn)來(lái)。勒坤表示,該團(tuán)隊(duì)擔(dān)任顧問(wèn)的角色。

結(jié)果,在FAIR的努力下,他們已經(jīng)開(kāi)發(fā)出一款有助于解決該問(wèn)題的工具:一個(gè)名為WorldVec(vec是“向量”的縮寫(xiě))的工具。WorldVec為神經(jīng)網(wǎng)絡(luò)增加了某種記憶能力,幫助Facebook給所有內(nèi)容都貼上信息標(biāo)簽,例如它的來(lái)源,以及都有哪些人分享過(guò)這些內(nèi)容。

借助這些信息,F(xiàn)acebook便可了解假新聞的分享特征,并使用該公司的機(jī)器學(xué)習(xí)算法根除毒瘤。“結(jié)果表明,尋找假新聞并不像判斷人們最喜歡哪些內(nèi)容那么困難?!崩绽ふf(shuō)。

坎德拉的團(tuán)隊(duì)之前開(kāi)發(fā)的系統(tǒng)加快了Facebook推出這些審核產(chǎn)品的速度。這些產(chǎn)品的具體表現(xiàn)仍然有待觀察??驳吕硎?,現(xiàn)在就通過(guò)數(shù)據(jù)展示該公司利用算法減少了多少假新聞,還為時(shí)過(guò)早。

但無(wú)論這些新的措施是否奏效,這些困惑本身還是引發(fā)了一個(gè)問(wèn)題:這種用算法解決問(wèn)題的模式——在機(jī)器學(xué)習(xí)時(shí)代得以進(jìn)一步加強(qiáng)——是否會(huì)不可避免地帶來(lái)有害的結(jié)果。很顯然,有人認(rèn)為這已經(jīng)在2016年發(fā)生了。

坎德拉否認(rèn)這種觀點(diǎn)。“我認(rèn)為我們把世界變得更加美好?!笨驳吕€主動(dòng)講了個(gè)故事。就在他接受采訪的那天,坎德拉給他在Facebook上的一個(gè)聯(lián)系人打了個(gè)電話——那人是他朋友的父親,他們之前只見(jiàn)過(guò)一面。

他看到那人發(fā)了許多支持特朗普的內(nèi)容,并對(duì)這些內(nèi)容感到困惑。隨后,坎德拉意識(shí)到,他的工作是根據(jù)數(shù)據(jù)制定決策,而他卻忽視了重要信息。所以,他給那人發(fā)了信息,希望跟他聊聊。那位聯(lián)系人同意了,于是,他撥通了電話。

“這并沒(méi)有改變我身處的現(xiàn)實(shí),但卻讓我以截然不同的方式來(lái)看待事情?!笨驳吕f(shuō),“在沒(méi)有Facebook的世界里,我永遠(yuǎn)不會(huì)有這樣的聯(lián)系人?!?/p>

換句話說(shuō),盡管人工智能成為Facebook的關(guān)鍵元素,甚至事關(guān)這個(gè)平臺(tái)的存亡,但它卻并非唯一答案?!艾F(xiàn)在的挑戰(zhàn)在于,人工智能仍處于初級(jí)階段。”坎德拉說(shuō),“我們才剛剛起步?!保ň幾g/長(zhǎng)歌)

繼續(xù)閱讀與本文標(biāo)簽相同的文章

分享至:

你可能感興趣 換一換

分享到微信朋友圈 ×
打開(kāi)微信,
使用“掃一掃”即可將網(wǎng)頁(yè)分享至朋友圈。