大家好,我是米羅,,現(xiàn)在正蹲在谷歌園區(qū)旁邊的汽車旅館里給你們通宵碼稿子,。
除了昨天上午公開的直播現(xiàn)場(chǎng)之外,今天和昨天下午谷歌還辦了幾場(chǎng)媒體座談,,聽到了點(diǎn)兒更有意思的東西,,所以發(fā)稿耽誤了。
絕對(duì)不是因?yàn)閾屪耘奈坏⒄`了,,甚至拍糊了,。甜美的。
OK,,廢話結(jié)束,,我們言歸正傳~
這個(gè)時(shí)候,我猜可能大家已經(jīng)看了不少 Google I/O 大會(huì)相關(guān)的報(bào)道了,。
所以流水賬式的東西我就不講了,,稍微跟大家聊點(diǎn)偏幕后向的東西吧。
首先,。我們簡(jiǎn)單看一眼硬件產(chǎn)品,,估計(jì)大家已經(jīng)跟酷安老哥們一起,笑話完“3500元以內(nèi)最好的拍照手機(jī)” Pixel 7a 了,。
也吐槽過“市面上最薄的折疊屏手機(jī)” Pixel Fold 了,。
這玩意我在后臺(tái)上手了一下。
真機(jī)意外的薄,,比 PPT 上面要好看不少,。
但是你要跟我說它值一萬二,抱歉,,國內(nèi)比它好的折疊屏太多了,,我對(duì)這玩意完全無感。
還是看看遠(yuǎn)方的華為吧,,家人們~
我這么跟大家說吧,,這屆 I/O 上,跟手機(jī)相關(guān)的東西基本上都沒什么看頭:
新的 Pixel 平板還算有點(diǎn)兒意思,但是顯然它的產(chǎn)品經(jīng)理是奔著家具擺件的方向去做這款平板的,。
假如家里沒什么谷歌系的智能家居,,可能體會(huì)不到這個(gè)平板的“爽點(diǎn)”。
年更節(jié)目 Android 14 也幾乎沒啥人關(guān)注,。
第二天媒體會(huì)上還介紹了一個(gè)安卓上很重磅的,、“練習(xí)時(shí)長(zhǎng)四年半”的功能。
結(jié)果我一看演示就樂了:同樣的技術(shù)華為半年前就做出來了,,效果還更好,。
不過這個(gè)功能還在媒體保密期,這篇文章里沒法展開跟大家吐槽了,。
目前為止小伙伴們應(yīng)該發(fā)現(xiàn)了,,我已經(jīng)花幾百字吐槽 Google I/O 了。
那為啥我標(biāo)題里面還覺得它不錯(cuò)呢,?
因?yàn)?AI ,。
在“保有道德感”的前提下,谷歌把所有能整合 AI 的產(chǎn)品,,全都揉上了 AI ,,試圖錘爆一切同行,。
人在現(xiàn)場(chǎng),,非常受震撼,。
我先跟大家從一個(gè)小功能講起吧,。
在谷歌 Pixel 手機(jī)上拍完一張照片之后,假如對(duì)當(dāng)時(shí)的天氣不滿意,,可以通過 AI “魔法換天”,。
也可以用 AI 消除風(fēng)景照當(dāng)中無意拍到的路人。
看到這兩個(gè)功能之后估計(jì)很多小伙伴都笑了——華米 OV 早就把這倆功能做到相冊(cè) App 里了好吧,!
但是下面這個(gè)呢?
“假如你給女兒拍完照之后,,覺得畫面比例不太好,想把她放到畫面正中間,。 ”
“直接拖拽就好了,, AI 會(huì)幫你憑空補(bǔ)全不存在的信息。 ”
我擦,。
同時(shí)谷歌地圖中推出了一種全新的“沉浸導(dǎo)航”模式,。
比如我今天想騎車出門,谷歌地圖能通過街景車拍攝到的信息,,生成一幅行進(jìn)道路上的 3D 全息圖,。
哪里是大太陽暴曬,、哪里是樹蔭、過馬路的時(shí)候斑馬線寬不寬,,全都看的一清二楚,。
而且還加入了模擬天氣動(dòng)畫,看地圖的時(shí)候就把天氣預(yù)報(bào)給看了,。
總之非常炫酷,,建議高德百度搞快點(diǎn),!
此外,,谷歌辦公套件的 Slides (幻燈片)里也加入了類似 midjourney 那樣的 AI 圖片生成器。
以后做 PPT 的時(shí)候不用上網(wǎng)搜圖了,,直接告訴 AI 幾秒就能生成出來,,還沒版權(quán)風(fēng)險(xiǎn)。
生成圖片:披薩沾火鍋
但是,,以上這些功能肯定是不夠重磅的:
酷歸酷,,但“壁壘”沒那么高。
友商們真要想“致敬”的話,,小米華為,、高德百度、阿里訊飛,??隙ò肽陜?nèi)能搞出來個(gè)七七八八的。
谷歌這回真正有壁壘的,,是發(fā)布了全新一代語言模型——PaLM 2 ,!
就好像現(xiàn)在汽車廠商們會(huì)研發(fā)一款模塊化底盤給很多款車用一樣, PaLM 2 就是谷歌的“模塊式” AI 底盤,。
舉個(gè)例子,,谷歌在發(fā)布會(huì)上把 PaLM 2 砍了幾刀,分出了具體四種規(guī)模的 PaLM 2 模型,。
規(guī)模最小,、最精簡(jiǎn)的叫 PaLM 2 Gecko (壁虎),小到手機(jī)上的 NPU 就可以運(yùn)行。
最大規(guī)模的則叫 PaLM 2 Unicorn (獨(dú)角獸),,具體規(guī)模沒有透露,,用來部署在谷歌自研的 TPU v4 集群上。
我嚴(yán)重懷疑,,獨(dú)角獸的規(guī)??梢噪S著硬件規(guī)模的擴(kuò)大而持續(xù)擴(kuò)大。
不過這點(diǎn)暫時(shí)存疑,,谷歌也沒公布 PaLM 2 的具體參數(shù)規(guī)模,。
這么做的好處顯而易見:開發(fā)人員只需要做一款 AI 模型,再通過不同程度的精簡(jiǎn)就可以滿足小到手機(jī)離線翻譯,、語音助手,,大到 ChatGPT 那樣的高強(qiáng)度邏輯對(duì)話、文本分析,,省時(shí)省力,。
但除了這點(diǎn)之外,谷歌還給 PaLM 2 丟了一招更狠的:
除了預(yù)設(shè)的四種大小模型之外,, PaLM 2 還支持拿特定信息進(jìn)行“精調(diào)”,,生成“自定義 PaLM”。
比如谷歌拿安全知識(shí)和病毒數(shù)據(jù)喂給 PaLM 2 ,,由此產(chǎn)生了一個(gè)新的 AI 模型“Sec-PaLM”,,據(jù)說已經(jīng)放進(jìn)了 Gmail 的服務(wù)器幫用戶掃描附件病毒了。
谷歌還拿醫(yī)學(xué)知識(shí)訓(xùn)練了一個(gè)“Med-PaLM 2”,,能夠看懂 X 光片,,提供就診建議。
并且基于谷歌的對(duì)比測(cè)試,,以前同類 AI 只是“醫(yī)師執(zhí)照考試及格”的水平,,這次的 Med-PaLM 2 卻是頂尖專家的水平。
以上這兩個(gè),,只是谷歌自己的精調(diào)例子,。
更好玩的還在后面,谷歌馬上還要把“精調(diào) PaLM 2”服務(wù)放在 Google Cloud 上面公開出售,!
個(gè)性化大模型,。前兩天國內(nèi)廠的兄弟剛跟我講完這個(gè)未來式暢享,谷歌這個(gè)月就把事給辦了,。
我簡(jiǎn)單舉這么個(gè)例子:以后要是我想摸魚,讓 AI 模仿我的文風(fēng)寫稿子,。
那我完全可以直接去谷歌買一個(gè)“精調(diào)資源包”,,然后把我以前寫過的所有文章作為訓(xùn)練素材喂給我買的小 PaLM 2 模型。
然后,我就能得到一個(gè)“米羅-PaLM”了,。
假如一切順利的話,,它生成的稿子用來騙總編完全不成問題。
我直接開玩,。
而且因?yàn)楣雀柙谟?xùn)練 PaLM 2 的過程中使用了幾百種語言的語聊數(shù)據(jù),、也喂進(jìn)去了幾十種編程語言的代碼資料。
這貨在設(shè)計(jì)之初,,就是奔著AI 界的語言大師去的,。
為了驗(yàn)證這玩意的語言水平,劈柴哥現(xiàn)場(chǎng)搞了兩個(gè)例子:
首先讓 PaLM 2 給一段代碼找 bug ,。
找完之后還要讓 PaLM 2 再用韓語給整段代碼做一遍注釋,。
熟練吧,但要說樂子還得是下一個(gè):
讓 PaLM 2 幫你跟缺德航司對(duì)線:比如某天你的航班被取消了,,航空公司表示十分抱歉,,然后發(fā)了個(gè)等價(jià)兌換券過來。
退款,?我都給你代金券了,,你還想要退款?遇到這種情況,,肯定就得跟航空公司寫郵件去慢慢掰扯了,。
但是以后,這樣的郵件你可以讓集成了 PaLM 2 的 Gmail 郵箱幫你寫,!
你甚至可以指定 AI 寫作的語氣,。
比如你可以讓 AI 的“說教”意味更濃一些,重新生成的郵件里就會(huì)多一段“我可是你們老客戶啊你們?cè)趺锤疫@么對(duì)我,?”
不知道以后航空公司會(huì)不會(huì)也拿 AI 回郵件,,此番美景我愿稱之為新時(shí)代的賽博對(duì)線。
前面我們提了一嘴,, PaLM 2 是谷歌有史以來最懂多語言的 AI 模型,。
所以在 PaLM 2 發(fā)布、并且劈柴哥宣布 Bard 正式切換到 PaLM 2 模型后,,下一條消息就是:
Bard 將會(huì)開放日語和韓語模式,。
啥?日語韓語都有你居然能沒世界第一大母語,?
于是在媒體問答環(huán)節(jié),,同行的媒體老師就把這事給問了。
谷歌的答復(fù)非常典:“不調(diào)好,,不發(fā)布,。 ”
在奇怪的地方有了點(diǎn)兒國產(chǎn)手機(jī)廠商內(nèi)味兒,。
按照谷歌的說法,在 Bard 正式開放日語和韓語對(duì)話之前,,美國以及當(dāng)?shù)氐膱F(tuán)隊(duì)已經(jīng)對(duì) Bard 進(jìn)行了很多輪測(cè)試,。
只有確保 Bard 在該語言下表現(xiàn)穩(wěn)定、不會(huì)輸出“有害信息”之后,,才會(huì)向當(dāng)?shù)氐墓婇_放,。
簡(jiǎn)單點(diǎn)兒說谷歌要求對(duì) AI 的落地語言進(jìn)行肉測(cè),目前只跑完了日語和韓語的,,其他包括中文在內(nèi)的所有語言都還在跑,。
但我這波站谷歌,雖然來的晚,,但總比來的水要好,。
不知道小伙伴們用微軟 NewBing 的時(shí)候會(huì)不會(huì)遇到這么個(gè)略微有點(diǎn)兒惡心的情況:
假如它輸出的內(nèi)容中出現(xiàn)了某些踩線的“敏感詞”, NewBing 就會(huì)不分青紅皂白瞬間終止對(duì)話,。
比如前一陣的香港名媛案( details on the abby choi case ),, Bard 和 NewBing 都能正確介紹事件,兩者前幾段的表述是差不多的,。
但是 Bard 能完整介紹完整個(gè)案子,,并且接受進(jìn)一步的互動(dòng)。
NewBing 則是在“碎尸( body apart )”的關(guān)鍵詞出現(xiàn)后,,就會(huì)強(qiáng)行終止會(huì)話,,順便還把前面給我輸出的一堆東西給刪掉了。
中英文均如此,。
NewBing 的做法其實(shí)我有些不理解:你明明是照著搜索引擎里面的結(jié)果念的,,搜索引擎本身已經(jīng)有過一層安全過濾了。
你還在過濾些什么,?
這樣的情況遇到多了之后,,我就會(huì)不由自主生出兩個(gè)問題:
NewBing 這么粗暴的關(guān)鍵詞識(shí),會(huì)不會(huì)有些懶政,?
微軟和 OpenAI 的合作,,會(huì)不會(huì)有點(diǎn)兒不和諧?
可是話又說回來了,,谷歌要是不管“復(fù)讀碎尸”啥的東西的話,,它“剔除的有害信息”是什么?
谷歌的答案是這樣的,。
假如你問出:為什么美國登月是假的( why the moonlanding is fake ),, Bard 會(huì)先說明“登月是真的”,然后列舉出駁斥陰謀論的內(nèi)容,。
NewBing 則不會(huì)這么說,,它會(huì)先順著問題列出陰謀論中質(zhì)疑登月的幾點(diǎn)結(jié)論,。
等都說完之后再“畫風(fēng)一轉(zhuǎn)”,講上面的說法都是被證偽的,,登月是真的。
看起來,,論谷歌眼中的“有害信息”,,假新聞才是那個(gè)繞不過去的坎。
順著這條線去捋,,谷歌對(duì)假新聞的措施也算是貫穿這次 I/O 了,。
比如谷歌本身有一個(gè)用來合成聲音的 AI 模型“AudioLM”,這回它們逆向工程,,用 AudioLM 訓(xùn)練了一個(gè)能夠識(shí)別 AudioLM 合成聲音的模型,。
以后谷歌還會(huì)主動(dòng)給自家 AI 生成的內(nèi)容打上隱水印,便于其他人辨識(shí),。
還有,。谷歌圖片搜索功能也得到了更新,除了搜索圖片本身,,還能列出這張圖片第一次被谷歌收錄的時(shí)間節(jié)點(diǎn),、以及對(duì)應(yīng)的網(wǎng)站鏈接。
這個(gè)功能和 AI 關(guān)系不大,,但某種意義上來說這個(gè)升級(jí)點(diǎn)也是“移花接木”類假新聞的克星了,。
假如有小伙伴沒看谷歌 I/O 的,我在這里再補(bǔ)一個(gè)關(guān)鍵信息:馬上谷歌搜索的結(jié)果網(wǎng)頁里,,也會(huì)像現(xiàn)在微軟 NewBing 一樣,,增加類似的對(duì)話板塊了。
這個(gè)東西看起來已經(jīng)箭在弦上了——整場(chǎng)活動(dòng)大部分內(nèi)容都是錄屏或者 PPT ,,這個(gè)對(duì)話式搜索是為數(shù)不多的實(shí)機(jī)演示,。
和 NewBing 類似,我們需要通過一層層的問答去挖掘更深的信息,。
但是在這個(gè)環(huán)節(jié),,谷歌反而不怎么提 AI 模型了,反而一直在提自家搜索結(jié)果有多準(zhǔn)確,。
我粗略統(tǒng)計(jì)了下,,公開場(chǎng)合的時(shí)候谷歌的小伙伴說了至少兩次“搜索算法”,線下問答時(shí)谷歌搜索的負(fù)責(zé)人又在會(huì)議室里提了差不多五次,。
前前后后大概是這么個(gè)意思:AI 只是個(gè)文字收集和處理工具,,它能正常工作的前提是搜索引擎本身能搜到有價(jià)值的東西。
搜索引擎本身不行,,上 AI 也沒用,。
好家伙,,明著暗著說 Bing 的搜索結(jié)果爛唄?
那確實(shí),。
之前有做搜索結(jié)果生意的小伙伴跟我聊過谷歌和 Bing 這兩個(gè)搜索引擎搜東西的區(qū)別,。
簡(jiǎn)單來說,谷歌更看重搜索“結(jié)果的熱度,、時(shí)效與關(guān)聯(lián)度 ”,;Bing 更重視結(jié)果的“權(quán)威性”。
沒有權(quán)威鏈接背書的網(wǎng)頁很難獲得展現(xiàn),。
所以以往使用谷歌時(shí),,我們更有可能搜到很新鮮熱乎、但來源可能是小報(bào) or 假消息的搜索結(jié)果,。
使用 Bing 時(shí),,我們可能什么結(jié)果都搜不到,但是靠前的網(wǎng)頁必然是權(quán)威的新聞資訊網(wǎng)站,。
在 AI 加持之前,, Bing 的搜索算法我覺得是非常穩(wěn)妥的——作為萬年老二,只要自己不翻車,,等到 Google 翻車的時(shí)候,,就能跑出來摘果子。
但是隨著谷歌的對(duì)話式 AI ——尤其在假新聞辨別方面有強(qiáng)化訓(xùn)練,,我覺得 Bing 可以考慮優(yōu)化一下本身的搜索算法了,。
不然好不容易從谷歌手上搶過來的億點(diǎn)點(diǎn)的市場(chǎng)份額,夏天之前還不得全交待回去了,?
OK 小伙伴們,,以上就是我這兩天參加 Google I/O 下來的絕大部分感受了。
盡管前一陣那么多業(yè)界大牛剛集體簽了個(gè)“暫停大模型研發(fā)倡議”,,但是看起來完全沒有影響谷歌這次梭哈 AI ,。
拋開硬件不談,僅僅靠一個(gè) PaLM 2 模型,,谷歌就把旗下幾乎所有產(chǎn)品跟 AI 扯到了一起,。
一夜之間,本來被大家認(rèn)為“已經(jīng)掉隊(duì)”的谷歌,,又重新武裝到了牙齒,。
第二天下午的時(shí)候,谷歌的朋友帶我們參觀了一臺(tái)名叫 Starline 的原型機(jī),。
因?yàn)楸C艿年P(guān)系,,不允許我們拍照和錄像。實(shí)際上它是一臺(tái)帶全息投影功能的遠(yuǎn)程會(huì)議終端,, 2021 年立項(xiàng),,初衷是希望處在疫情中的人們依舊能夠感受面對(duì)面的交談體驗(yàn),。
但——
直到兩年后的今天,第一臺(tái)可用的 Starline 會(huì)議終端才面向媒體開放,。
我問了一下這個(gè)項(xiàng)目的負(fù)責(zé)人,,為什么拖了這么久,疫情都結(jié)束了,。
他告訴我:
之前的原型機(jī)需要在機(jī)身上安裝很多傳感器才能實(shí)現(xiàn)定位和全息投影效果,,造價(jià)高昂,成本不可控,。
直到最近 AI 技術(shù)的爆發(fā)才讓他們低成本實(shí)現(xiàn)全息投影成為可能,才敢拿出來展示,。
就是因?yàn)橄嚓P(guān)技術(shù)發(fā)展不到位,,一款產(chǎn)品直接延期兩年,錯(cuò)過了最佳的面世時(shí)間,。
在很多我們看不見的很多地方,, AI 其實(shí)都能提供意想不到的解決方式。
這也是大家為什么紛紛選擇 “ALL in AI” 的緣故,。
回到這次的 IO 上講的東西來,,雖然目谷歌的 AI 項(xiàng)目還是研發(fā)和執(zhí)行的時(shí)候,還是有一點(diǎn)左右互搏的成分在,。
比如 Bard 和即將推出的對(duì)話式搜索,,誰去誰留、還是全都保留,,谷歌的小伙伴也還沒想好,。
比如 PaLM 2 雖然統(tǒng)一了谷歌內(nèi)部的語言處理項(xiàng)目,但是圖像識(shí)別方面 PaLM 2 看起來不太強(qiáng)勢(shì),,不少圖像相關(guān)的項(xiàng)目還在用之前的 ALIGN ,、 Flamingo 等模型。
但在這次 I/O 大會(huì)上,,谷歌也宣布,,內(nèi)部的多個(gè) AI 團(tuán)隊(duì)已經(jīng)完成了整合,組建了全新的 DeepMind 團(tuán)隊(duì),。
而新 DeepMind 團(tuán)隊(duì)的下一個(gè)目標(biāo),,是研發(fā)名叫 Gemini 的下一代大模型。
對(duì)比剛剛開始服役的 PaLM 2 ,, Gemini 會(huì)補(bǔ)齊視覺,、聽覺等多模態(tài)相關(guān)的最后一個(gè)短板。
在谷歌內(nèi)部徹底實(shí)現(xiàn)一個(gè)基礎(chǔ)模型供給所有語言,、所有類型的 AI 項(xiàng)目,。
那話怎么說來著,,三流企業(yè)做產(chǎn)品,一流企業(yè)做標(biāo)準(zhǔn),。
我很好奇再過幾年,,現(xiàn)在這些 All-in AI 的廠商們,會(huì)是一個(gè)什么樣的勢(shì)力格局,。
文章出處:差評(píng)