不久之前,,人們還常說,計(jì)算機(jī)視覺的辨別能力尚不如一歲大的孩子,。如今看來,,這句話要改寫了。計(jì)算機(jī)不僅能和大多數(shù)成年人一樣識(shí)別圖片中的物體,,在馬路上駕駛汽車的安全性還高過16 歲的青少年,。更神奇的是,如今的計(jì)算機(jī)不再是被動(dòng)按照指令識(shí)別和駕駛,,而是像自然界的生命由數(shù)百萬(wàn)年前開始進(jìn)化那樣,,自主地從經(jīng)驗(yàn)中學(xué)習(xí)。是數(shù)據(jù)的井噴促成了這一技術(shù)進(jìn)步,。如果說數(shù)據(jù)是新時(shí)代的石油,,那么學(xué)習(xí)算法就是從中提取信息的煉油廠;信息積累成知識(shí);知識(shí)深化成理解;理解演變?yōu)橹腔邸?
深度學(xué)習(xí)是的一個(gè)分支,它根植于數(shù)學(xué),、計(jì)算機(jī)科學(xué)和神經(jīng)科學(xué),。深度網(wǎng)絡(luò)從數(shù)據(jù)中學(xué)習(xí),就像嬰兒了解周圍世界那樣,從睜開眼睛開始,,慢慢獲得駕馭新環(huán)境所需的技能,。的起源可以追溯到20 世紀(jì)50 年代人工智能的誕生。關(guān)于如何構(gòu)建人工智能,。
當(dāng)時(shí)存在兩種不同的觀點(diǎn):一種觀點(diǎn)主張基于邏輯和計(jì)算機(jī)程序,,曾主宰人工智能的研究和應(yīng)用數(shù)十年;另一種觀點(diǎn)則主張直接從數(shù)據(jù)中學(xué)習(xí),經(jīng)歷了更長(zhǎng)時(shí)間的摸索才逐漸成熟,。
20 世紀(jì),,計(jì)算機(jī)技術(shù)還不夠成熟,而且按照現(xiàn)在的標(biāo)準(zhǔn),,數(shù)據(jù)存儲(chǔ)成本十分高昂,,用邏輯程序來解決問題更加高效。熟練的程序員需要為每個(gè)不同的問題編寫不同的程序,,問題越大,,相應(yīng)的程序也就越復(fù)雜。如今,,計(jì)算機(jī)能力日趨強(qiáng)大,,數(shù)據(jù)資源也變得龐大且豐富,使用學(xué)習(xí)算法解決問題比以前更快,、更準(zhǔn)確,,也更高效。此外,,同樣的學(xué)習(xí)算法還能用來解決許多不同的難題,這遠(yuǎn)比為每個(gè)問題編寫不同的程序更加節(jié)省人力,。
汽車新生態(tài):無(wú)人駕駛將全面走入人們生活
在2005 年美國(guó)國(guó)防部高級(jí)研究計(jì)劃局( 以下簡(jiǎn)稱darpa)舉辦的自動(dòng)駕駛挑戰(zhàn)賽中,,一輛由斯坦福大學(xué)塞巴斯蒂安·特隆(sebastian thrun)實(shí)驗(yàn)室開發(fā)的自動(dòng)駕駛汽車stanley最終贏得了200萬(wàn)美元現(xiàn)金大獎(jiǎng)。團(tuán)隊(duì)利用了技術(shù)教它如何自主地在加利福尼亞州的沙漠中穿行,。132 英里的賽道中有若干狹窄的隧道和急轉(zhuǎn)彎,,還包括啤酒瓶道(beer bottle pass),這是一段蜿蜒曲折的山路,,兩側(cè)分別是碎石遍布的陡坡和斷壁,。特隆并沒有遵循傳統(tǒng)的ai 方法,即通過編寫計(jì)算機(jī)程序來應(yīng)付各種偶發(fā)事件,,而是在沙漠中駕駛stanley,,讓汽車根據(jù)視覺和距離傳感器的感應(yīng)輸入,學(xué)習(xí)如何像人一樣駕駛,。
特隆后來參與創(chuàng)立了高科技項(xiàng)目重點(diǎn)實(shí)驗(yàn)室google x,,并開始了進(jìn)一步研究自動(dòng)駕駛汽車技術(shù)的計(jì)劃。谷歌的自動(dòng)駕駛汽車自此開始,在舊金山灣區(qū)累積了350 萬(wàn)英里的車程,。優(yōu)步(uber)已經(jīng)在匹茲堡投放了一批自動(dòng)駕駛汽車,。蘋果也步入自動(dòng)駕駛領(lǐng)域,以擴(kuò)大其操作系統(tǒng)控制的產(chǎn)品范圍,,并希望能夠再現(xiàn)它在手機(jī)市場(chǎng)上的輝煌,。汽車制造商們親眼看見一個(gè)100 年來從未改變的行業(yè)在他們眼前發(fā)生了轉(zhuǎn)型,也開始奮起直追,。通用汽車公司以10 億美元的價(jià)格并購(gòu)了開發(fā)無(wú)人駕駛技術(shù)的硅谷創(chuàng)業(yè)公司cruise automation,,并在2017 年投入了額外的6 億美元用于研發(fā)。2017年,,英特爾以153 億美元的價(jià)格收購(gòu)了mobileye,,它是一家專門為自動(dòng)駕駛汽車研發(fā)傳感器和計(jì)算機(jī)視覺的公司。在價(jià)值數(shù)萬(wàn)億美元的交通運(yùn)輸領(lǐng)域,,參與的各方都下了極高的賭注,。
自動(dòng)駕駛汽車不久將擾亂數(shù)百萬(wàn)卡車司機(jī)和出租車司機(jī)的生計(jì)。最終,,如果一輛自動(dòng)駕駛汽車能夠在一分鐘內(nèi)出現(xiàn),,將你安全帶到目的地且無(wú)須停車,在城市擁有汽車就顯得不那么必要了,。今天,,汽車行駛時(shí)間平均僅占4%,這意味著它其余96% 的時(shí)間都需要停放在某個(gè)地方,。由于自動(dòng)駕駛汽車可以在城市外圍維修和停放,,城市中被大量停車場(chǎng)占用的空間得以被重新高效利用。城市規(guī)劃者已經(jīng)開始考慮讓停車場(chǎng)變成公園了,。街邊的停車道可以成為真正的自行車道,。其他汽車相關(guān)行業(yè)也將受到影響,包括汽車保險(xiǎn)業(yè)和修理廠,。超速和停車罰單將不復(fù)存在,。由醉駕和疲勞駕駛導(dǎo)致的交通事故死亡人數(shù)也會(huì)相應(yīng)減少。通勤浪費(fèi)的時(shí)間也將被節(jié)省下來做其他事情,。根據(jù)2014年的美國(guó)人口普查數(shù)據(jù),,1.39 億上班族人均單日通勤時(shí)間達(dá)到了52分鐘,全年總計(jì)296 億小時(shí),。這驚人的340 萬(wàn)年的時(shí)間本可以在人生中得到更好的利用,。自動(dòng)駕駛汽車會(huì)使公路通行能力翻兩番。而且,,一旦大規(guī)模投入使用,,沒有方向盤,、可以自己開回家的自動(dòng)駕駛汽車還會(huì)讓大規(guī)模汽車盜竊行為銷聲匿跡。雖然目前自動(dòng)駕駛汽車仍面臨很多監(jiān)管和法律層面的障礙,,但這一技術(shù)一旦開始普及,,我們就將迎來一個(gè)嶄新的世界??梢灶A(yù)見的是,,卡車大概會(huì)在10 年內(nèi)率先實(shí)現(xiàn)自動(dòng)駕駛,出租車要花上15 年,,而15 到25 年后,,客運(yùn)無(wú)人車將全面走入人們的生活。
汽車在人類社會(huì)中的標(biāo)志性地位將以我們無(wú)法想象的方式發(fā)生變化,,一種新的汽車生態(tài)也將應(yīng)運(yùn)而生,。正如100 多年前汽車的出現(xiàn)創(chuàng)造了許多新的行業(yè)和就業(yè)機(jī)會(huì),圍繞著自動(dòng)駕駛汽車的發(fā)展,,也出現(xiàn)了一個(gè)快速增長(zhǎng)的生態(tài)系統(tǒng),。從谷歌獨(dú)立出來的自動(dòng)駕駛公司waymo,8年來已經(jīng)投入了10億美元,,并在加州中部山谷搭建了一個(gè)秘密測(cè)試場(chǎng)所,。該場(chǎng)所位于一個(gè)占地91 英畝的仿造小鎮(zhèn),其中還設(shè)計(jì)了騎自行車的“演員”和假的汽車事故,。其目的是擴(kuò)大訓(xùn)練數(shù)據(jù)集以包含特殊和不常見的情況(也叫邊緣情況),。公路上罕見的駕駛事件經(jīng)常會(huì)導(dǎo)致事故。自動(dòng)駕駛汽車的不同之處就在于,,當(dāng)一輛汽車遇到罕見事件時(shí),,相應(yīng)的學(xué)習(xí)體驗(yàn)會(huì)被傳遞給所有其他自動(dòng)駕駛汽車,這是一種集體智能,。其他自動(dòng)駕駛汽車公司也在建造許多類似的測(cè)試設(shè)施,。這些舉措創(chuàng)造了以前并不存在的新工作機(jī)會(huì),以及用于汽車導(dǎo)航的傳感器和激光器的新供應(yīng)鏈,。
自然語(yǔ)言翻譯:從語(yǔ)言到句子的飛躍
如今,谷歌在超過100 種服務(wù)中使用了深度學(xué)習(xí),,包括街景視圖(street view),、收件箱智能回復(fù)(inbox smart reply)和語(yǔ)音搜索。幾年前,,谷歌的工程師意識(shí)到他們需要將這些計(jì)算密集型應(yīng)用擴(kuò)展到云端,。他們開始著手設(shè)計(jì)一種用于深度學(xué)習(xí)的專用芯片,并巧妙地設(shè)計(jì)了可以插入數(shù)據(jù)中心機(jī)架中的硬盤插槽的電路板,。谷歌的張量處理單元(tpu)現(xiàn)在已配置在遍布全球的服務(wù)器上,,讓深度學(xué)習(xí)應(yīng)用程序的性能得到了大幅改進(jìn)。
深度學(xué)習(xí)快速改變格局的一個(gè)例子是它對(duì)語(yǔ)言翻譯的影響。語(yǔ)言翻譯是人工智能的一只圣杯,,因?yàn)樗蕾囉诶斫饩渥拥哪芰?。谷歌最近推出了基于深度學(xué)習(xí)的最新版谷歌翻譯(google translate),代表了自然語(yǔ)言翻譯質(zhì)量的重大飛躍,。幾乎一夜之間,,語(yǔ)言翻譯就從零散雜亂的拼湊短語(yǔ),升級(jí)到了語(yǔ)意完整的句子,。之前的計(jì)算機(jī)方法搜索的是可以被一并翻譯的詞匯組合,,但深度學(xué)習(xí)會(huì)在整個(gè)句子中尋找詞匯之間的依賴關(guān)系。
下一步工作是訓(xùn)練更大規(guī)模的深度學(xué)習(xí)網(wǎng)絡(luò),,針對(duì)段落來提高句子間的連貫性,。文字背后都有悠久的文化歷史。俄裔作家和英文小說家,,《洛麗塔》一書的作者弗拉基米爾·納博科夫(vladimir nabokov)曾經(jīng)得出結(jié)論,,在不同語(yǔ)言之間翻譯詩(shī)歌是不可能的。他將亞歷山大·普希金(aleksandr pushkin)的詩(shī)體小說《葉甫蓋尼·奧涅金》(eugene onegin)直譯成了英文,,并對(duì)這些詩(shī)文的文化背景做了解釋性腳注,,以此論證他的觀點(diǎn)?;蛟S谷歌翻譯終有一天能夠通過整合莎士比亞的所有詩(shī)歌來翻譯他的作品,。
語(yǔ)音識(shí)別:實(shí)時(shí)跨文化交流不再遙遠(yuǎn)
人工智能的另一只圣杯是語(yǔ)音識(shí)別。不久之前,,計(jì)算機(jī)的獨(dú)立語(yǔ)音識(shí)別應(yīng)用領(lǐng)域還很有限,,如機(jī)票預(yù)訂。而如今,,限制已不復(fù)存在,。2012 年,一名來自多倫多大學(xué)的實(shí)習(xí)生在微軟研究院(microsoft research)的一個(gè)夏季研究項(xiàng)目中,,讓微軟的語(yǔ)音識(shí)別系統(tǒng)性能得到了顯著的提升,。2016 年,微軟的一個(gè)團(tuán)隊(duì)宣布,,他們開發(fā)的一個(gè)擁有120 層的網(wǎng)絡(luò)已經(jīng)在多人語(yǔ)音識(shí)別基準(zhǔn)測(cè)試中達(dá)到了與人類相當(dāng)?shù)乃健?
這一突破性成果將在之后的幾年逐漸影響我們的社會(huì),,計(jì)算機(jī)鍵盤會(huì)被自然語(yǔ)言接口取代。隨著數(shù)字助手,,如亞馬遜的alexa,、蘋果的siri 以及微軟的cortana 先后進(jìn)入千家萬(wàn)戶,這種取代已經(jīng)在發(fā)生了,。就如隨著個(gè)人電腦的普及,,打字機(jī)退出了歷史舞臺(tái),,有一天電腦鍵盤也將成為博物館的展品。
當(dāng)語(yǔ)音識(shí)別和語(yǔ)言翻譯結(jié)合到一起時(shí),,實(shí)時(shí)的跨文化交流將有可能實(shí)現(xiàn),。《星際迷航》中那種萬(wàn)能翻譯機(jī)將觸手可及,。為什么計(jì)算機(jī)語(yǔ)音識(shí)別和語(yǔ)言翻譯達(dá)到人類的水平要花這么久的時(shí)間?難道計(jì)算機(jī)的各種認(rèn)知能力同時(shí)進(jìn)入瓶頸期僅僅是巧合嗎?其實(shí)所有這些突破都源于大數(shù)據(jù)的出現(xiàn),。
ai 醫(yī)療:醫(yī)學(xué)診斷將更加準(zhǔn)確
深入皮膚
隨著的成熟并被應(yīng)用于可獲取大數(shù)據(jù)的許多其他問題,服務(wù)行業(yè)和其相關(guān)職業(yè)也將發(fā)生轉(zhuǎn)變,?;跀?shù)百萬(wàn)患者病情記錄的醫(yī)學(xué)診斷將變得更加準(zhǔn)確。最近的一項(xiàng)研究將運(yùn)用到了囊括超過2000 種不同疾病的13 萬(wàn)張皮膚病學(xué)圖像中,,這個(gè)醫(yī)學(xué)數(shù)據(jù)庫(kù)是以前的10 倍大,。該研究的網(wǎng)絡(luò)被訓(xùn)練用于診斷“測(cè)試集”(test set,它從未見過的新圖像集)中的各種疾病,。它在新圖像上的診斷表現(xiàn)與21 位皮膚科專家的結(jié)論基本一致,,甚至在某些情況下還要更準(zhǔn)確。在不久的將來,,任何一個(gè)擁有智能手機(jī)的人都可以拍下疑似皮膚病變的照片,,并立即進(jìn)行診斷——而現(xiàn)在要完成同樣的過程,我們需要先去看醫(yī)生,,耐心等待病變被專家篩查出來,,然后再支付一大筆賬單。這一進(jìn)步將大大擴(kuò)大皮膚病護(hù)理的范圍,,提升護(hù)理質(zhì)量,。如果個(gè)體可以很快得到專家診斷,他們會(huì)在皮膚病的早期階段,,也就是更容易治療的時(shí)候就開始就醫(yī),。借助,所有的醫(yī)生都將更準(zhǔn)確地診斷罕見的皮膚病,。
深入癌癥
如果專家在轉(zhuǎn)移性乳腺癌的淋巴結(jié)活檢切片圖像上判斷錯(cuò)誤,,就有可能導(dǎo)致致命的后果。這是一種深度學(xué)習(xí)擅長(zhǎng)的模式識(shí)別問題,。實(shí)際上,,一個(gè)經(jīng)過大量結(jié)論清晰的切片數(shù)據(jù)訓(xùn)練出來的深度學(xué)習(xí)網(wǎng)絡(luò)能達(dá)到0.925 的準(zhǔn)確度,還不錯(cuò),,但還不及人類專家在同一測(cè)試集上達(dá)到的0.966。然而,,把深度學(xué)習(xí)與人類專家的預(yù)測(cè)結(jié)合起來,,準(zhǔn)確度達(dá)到了0.995,,幾近完美。由于深度學(xué)習(xí)網(wǎng)絡(luò)和人類專家查看相同
的數(shù)據(jù)的方式不同,,二者相結(jié)合的效果比單獨(dú)預(yù)測(cè)要好,。這樣一來,更多的生命得以被挽救,。這表明在未來,,人類與機(jī)器將是合作而非競(jìng)爭(zhēng)的關(guān)系。
深入睡眠
如果你有嚴(yán)重的睡眠問題(70% 的人一生中都會(huì)遇到這個(gè)問題),,你要等待幾個(gè)月才能見到你的醫(yī)生(除非問題十分緊急),,然后你會(huì)被轉(zhuǎn)到一個(gè)睡眠診所。在那里,,你需要在身上接幾十個(gè)能在你入睡時(shí)記錄你的腦電圖(eeg)和肌肉活動(dòng)的電極,,接受徹夜觀察。每個(gè)晚上,,你會(huì)先進(jìn)入慢波睡眠,,然后定期進(jìn)入快速眼動(dòng)(rem)睡眠,在此期間,,你會(huì)做夢(mèng),,但是失眠、睡眠呼吸暫停綜合征,、不寧腿綜合征以及許多其他睡眠障礙會(huì)干擾這種睡眠模式,。如果你在家里就很難入睡,那么在一張陌生的床上,,全身接滿了讓人不安的醫(yī)療設(shè)備進(jìn)入睡眠狀態(tài),,絕對(duì)算得上真正的挑戰(zhàn)。睡眠專家會(huì)查看你的腦電圖記錄,,以30 秒為單位標(biāo)記睡眠階段,,一段8 小時(shí)的睡眠要花幾個(gè)小時(shí)才能標(biāo)記完。而最終你會(huì)得到一份有關(guān)睡眠模式異常情況的報(bào)告,,以及一份2000 美元的賬單,。
依據(jù)1968 年由安東尼·雷希特施芬(anthony rechtshaffen)和艾倫·卡萊斯(alan kales)設(shè)計(jì)的系統(tǒng),睡眠專家將接受尋找表征不同睡眠階段特征跡象的培訓(xùn),。但是由于這些特征常常不明確,,也不一致,只有75% 的情況下專家們能在數(shù)據(jù)解讀上達(dá)成一致,。相比之下,,我實(shí)驗(yàn)室之前的一名研究生菲利普·洛(philip low)使用無(wú)監(jiān)督,花了不到一分鐘的計(jì)算機(jī)運(yùn)算時(shí)間,,以3 秒的時(shí)間分辨率自動(dòng)檢測(cè)睡眠階段,,和87%的人類專家達(dá)成了一致的結(jié)論,。此外,這種方式只需要在頭部的單個(gè)位置做記錄,,用不到那些觸點(diǎn)和接線,,也節(jié)省了大量佩戴和摘除的時(shí)間。2007 年,,我們創(chuàng)立了一家公司neurovigil,,想將這項(xiàng)技術(shù)引入睡眠診所,但診所對(duì)此沒有表現(xiàn)出多大興趣,,因?yàn)榭咳肆?biāo)注能產(chǎn)生更多的現(xiàn)金流,。實(shí)際上,依據(jù)保險(xiǎn)號(hào)向患者開具賬單,,會(huì)讓診所沒有動(dòng)機(jī)采用更廉價(jià)的程序,。neurovigil 在大型制藥公司發(fā)現(xiàn)了另一個(gè)市場(chǎng),這些公司在開展臨床試驗(yàn),,需要測(cè)試他們的藥物對(duì)睡眠模式的影響,。這項(xiàng)技術(shù)目前正在進(jìn)入長(zhǎng)期護(hù)理設(shè)施市場(chǎng),幫助解決在老年人中更普遍的進(jìn)行性睡眠問題,。
睡眠診所模式是存在缺陷的,,因?yàn)樵谶@樣的限制條件下不能可靠地診斷出健康問題:每個(gè)人的生理基數(shù)都不同,而偏離這個(gè)基數(shù)的信息最重要,。neurovigil 已經(jīng)有了一個(gè)小型設(shè)備ibrain,,它可以在家里記錄你的腦電圖信息,將數(shù)據(jù)傳到網(wǎng)上并分析數(shù)據(jù)的長(zhǎng)期趨勢(shì)和異常情況,。這可以幫助醫(yī)生及早發(fā)現(xiàn)健康問題,,在惡化前及時(shí)干預(yù)并阻止慢性疾病的發(fā)展。其他很多疾病的治療也將受益于持續(xù)監(jiān)測(cè),,如1 型糖尿病,,血糖水平可以被監(jiān)測(cè)并通過胰島素進(jìn)行調(diào)節(jié)。使用能夠連續(xù)記錄數(shù)據(jù)的廉價(jià)傳感器正在對(duì)其他慢性疾病的診斷和治療產(chǎn)生重大影響,。
從neurovigil 的發(fā)展過程中可以看出:
第一,,即便擁有更好更廉價(jià)的技術(shù),也不代表能輕易地將其轉(zhuǎn)化為有市場(chǎng)價(jià)值,,甚至更優(yōu)質(zhì)的新產(chǎn)品或服務(wù);
第二,,當(dāng)現(xiàn)有產(chǎn)品在市場(chǎng)中的地位根深蒂固,就會(huì)進(jìn)一步開發(fā)出深入應(yīng)用的二級(jí)市場(chǎng),,可以讓新技術(shù)產(chǎn)生更直接的影響,,并爭(zhēng)取時(shí)間來改進(jìn),提升競(jìng)爭(zhēng)力。太陽(yáng)能和許多其他新興產(chǎn)業(yè)的技術(shù)就是這樣進(jìn)入市場(chǎng)的,。從長(zhǎng)遠(yuǎn)來看,,已被證實(shí)具有優(yōu)勢(shì)的睡眠監(jiān)測(cè)和新技術(shù)將會(huì)覆蓋到家中的患者,并最終融入醫(yī)療實(shí)踐,。