2017年6月8日 星期四

轉載: 與FT共進下午茶:阿里雲人工智能科學家閔萬里



與FT共進下午茶:阿里雲人工智能科學家閔萬里

阿里雲人工智能科學家閔萬里表示,現階段中國人工智能創業是有泡沫的,其中很多只是“強行碰瓷”。


“人工智能會不會取代/毀滅人類?”
拜AlphaGo和去年大熱的美劇《西部世界》所賜,幾乎每個在公共場合露面的人工智能科學家,都曾被問到這個問題。數月前在一場科技論壇上,原斯坦福大學人工智能實驗室負責人李飛飛將這個問題回答了好多次。
所以這一次跟阿里雲人工智能科學家、人工智能孵化團隊負責人閔萬里的“下午茶”,我決定拋棄這類看起來“極客感”十足卻明顯能預料到答案的問題。我更好奇的是,未來BAT將如何在人工智能領域展開“圈地運動”,其中阿里又會扮演什麼樣的角色。
BAT爭相押注的人工智能
在杭州阿里雲園區內一間略顯昏暗的會議室內,我見到了閔萬里博士。“14歲被中科大少年班錄取,19歲赴美攻讀物理學碩士,後獲得芝加哥大學統計學博士學位。先後在IBM TJ Watson Research Center及Google 擔任研究員。”這是閔萬里在2013年加入阿里之前的履歷。
初到阿里的閔博士從電商數據化運營(比如通過實時數據指導賣家和小二調整網上商品排序)做起,之後的一切被他歸為“因緣際會”:進入阿里雲組建非電商大數據團隊,再到後來將雲計算與大數據相結合而完成的各個人工智能項目。
人工智能
人工智能發展面臨的法律挑戰
王新銳:監管部門和司法機關對透明性和舉證責任的要求,與機器學習結果的不確定性和算法保密要求之間,存在著一種結構性的緊張關係。

跟我想像中的“理科神童”截然不同,眼前身著淡藍色襯衫、笑瞇瞇的閔博士很是健談。或許是已經習慣了跟“外行人”解釋自己的工作,他在解釋專業概念時很善於打比方,說話直接,有問必答——他甚至都不需要我提前給出採訪提綱。
閔博士胸前的工牌上寫著他在阿里的花名:山景。通過花名制度,試圖剝離不同職級員工之間的權力感差異,是阿里集團的特殊企業文化。幾乎每個入職阿里集團的人,都有屬於自己的花名,而這些花名,大多取自於金庸的武俠小說,比如阿里集團CEO張勇的花名是逍遙子,而馬雲的花名是風清揚。
阿里巴巴,與騰訊和百度一起,被統稱為BAT。這三個業務起點不同卻版圖略有重疊的互聯網巨頭,被視為中國互聯網食物鏈的頂端。“正如其他行業曾經經歷過的一樣,創業公司之間的城池之戰,最終都會演變為BAT之間的版圖之爭”,這是我在之前的一篇文章中總結過的,之前的O2O、電子支付、打車軟件大戰甚至共享單車莫不如是——雖然百度就現在看來有些後繼乏力。
自然地,人工智能這一被公認為“顛覆性”的科技領域,引來三巨頭爭相押注:其中,百度發展最早,著力最多,雖然今年3月吳恩達的離職引來外界猜測紛紛,但其數據和技術積澱不可小覷;騰訊雖然在正式成立AI Lab之前,在各個事業群下面都有AI團隊,但還是在今年3月騰訊AI圍棋機器人“絕藝”,才初步嶄露頭角;阿里為人所熟知的就是阿里雲ET,以及應用到具體場景上的ET城市大腦、ET醫療大腦、工業大腦等,風格更偏應用,雖然今年也不甘人後,推出了極客感十足的“NASA”計劃。
閔博士將這個稱為“接地氣”,他一邊向我介紹阿里雲ET的各個應用場景,一邊總結:“我們以應用為導向,但是我們實際做的事可能不僅僅是為了應用,很多有意思的研究課題其實是從應用場景當中抽像出來的。出發點是為了應用,但最後結果有可能超越原來那個簡單應用的範疇。”
接著,在給我詳細解釋佈局思路的過程中,他把“場景”和“垂直”重複了好多遍,“垂直化就是一定要落在具體的場景當中,而不是虛無縹緲的說我搞一個平台可以適用於所有的應用場景。萬金油性質的東西價值密度是最低的,它就像水面上的浮萍。”
“所以我們一直強調我們做'大腦',不做平台。就是說有的人開源一個平台,這個確實可以做。但當我們往價值密度最深層去做的時候……”說到這裡閔博士把放在旁邊的手機拿起來開始給我打比方:“假定這是一塊木板,把它固定在這個平面上有多種做法,一種就是用萬能膠粘上去;另一種是用釘子把它頂下去,還有一種就是加上螺紋釘下去,黏性更強。當釘子很密的時候,下面的東西跟木板就分不開了,那時候平台就自然而然地形成了。
似乎覺得打了個比方之後我應該聽懂了,閔博士放下了被拿來當“木板”的手機,笑瞇瞇地繼續這個話題:“平台不是規劃出來的,也不是宣佈出來,也不是開源出來的,一定是打出來的;當你應用的場景越來越多的時候,所有人都知道原來這個大腦能幹這些事,那以後比如有個環境的問題,或者航空調度的問題等,都會想到我需要這個大腦,那就對接上就行了……所以大腦可能是我們未來的一個平台的一個代號。”
就在我們對話的前一天,騰訊宣布任命語音識別技術專家俞棟博士為AI Lab副主任,並成立美國西雅圖AI實驗室——一個非常特殊的無KPI實驗室。
無KPI?可以說是非常不符合中國互聯網公司風格了。一直對BAT三巨頭如何“搶地盤”格外關注的我感嘆道。閔博士也看到了這個,“我覺得這可能是我們最大的區別吧,就我自己個人的經歷和觀察來看,在公司裡面沒有KPI的團隊是成功不了的。沒有一個工作不存在KPI的,區別只是長期的柔性的(KPI),還是短期的剛性的。我們這裡強調的是一定要有業務變現的,有人願意為你做的事情買單,這才是真正的價值,這對大家都是公平的。”
“我們的研究要接地氣,天天去研究哥德巴赫猜想,那肯定不是公司要做的事。”瞧,他又把“接地氣”重複了一遍。
“產業革命不是因為AI就一下變得可怕了”
一直在強調將技術場景化的閔博士,給阿里雲的“大腦”前加上了前綴,成為城市大腦、醫療大腦、工業大腦。其中工業大腦是閔博士最滿意的項目。
這恰恰也是我最好奇的部分,即便在人工智能概念如此火熱的當下,無論是大眾還是互聯網公司,對人工智能的認知普遍偏向更“極客範兒”的美國風格:一夜之間,幾乎所有人都在討論語音圖像識別、深度學習以及神經網絡。進入工廠,進入製造業生產過程中的人工智能,現在還並不多見,更不像是互聯網公司該干的事兒。
看到我很好奇,閔博士開始慢慢回憶:“工業大腦是我從來沒想到能做成的,這是最冒險的,所以也是驚喜最多的一個。”由於之前在IBM和Google做過很多年智慧城市類項目,他實際上對城市大腦等其他項目很有把握,但工業大腦對於他是全新的。
回憶起一年以前第一次拿到江蘇協鑫的數據光伏切片數據時的情形,他將其形容為“像讀天書一樣”,“你說我一個做數據的人,給我的樣本我都讀不懂,這不是抓瞎嗎?”他將當時的沮喪又強調了一遍,並坦言當時確實有放棄的打算。
但當他進入工廠,看到車間的工人是怎樣憑經驗進行日常操作的時候,他看到了中間巨大的空間:對於工廠來說,需要的是一個能夠一直產出質量穩定的產品、永遠不會跳槽退休的“大腦”。最終做成之後,很快地,這一套最先在光伏產業鏈中實踐成功的系統,很快地被複製移植到了橡膠產業中。
那麼用不了多久,永不跳槽、不知疲倦的工業大腦還是會跟普通工人搶飯碗啊,我暗暗地想。瞧,就算我不在一開始就把“人工智能會不會取代人類?”的終極之問拋出來,我們還是避不開這個話題。
既然談到了產業革命與人類的關係,閔博士首先把眼下的產業革命定義了一番:“這是一場以大數據為原材料,用人工智能的技術作為新技術的數據革命,跟以往的產業革命沒有什麼區別。”說起數據革命,他來了興趣:“產業革命不是因為人工智能突然一下變得可怕了,產業革命一直在發生啊!”眼下的產業革命不僅只在機器的層面上,更體現在認知的層面上。
幾乎跟我以往接觸過的人工智能科學家們所想的一樣,閔博士認為將人工智能同人類的關係描述成“你死我活”是種賺眼球的做法。他認為,自動化的普及可以讓多餘的勞動力釋放出來做更有意義的事情。“某種程度上對某些崗位是一種挑戰,但對整體人類一定不是挑戰,而是幫助。”他很肯定地補充道。
對於大眾對人工智能的擔憂,閔博士倒不認為這是技術焦慮的體現,畢竟人類一直在經歷技術革命,更多的還是對人工智能失控風險的恐懼。“人工智能超越了個體腦力的極限,聰明人變壞是件很麻煩的事。”他這樣形容道。
“未來的風口一定是量子計算機”
隨著談話的深入,我們開始討論一些技術方面的問題。人工智能概念的普及,讓大眾開始對圖像識別、語音識別、神經網絡等概念漸漸了解,但非專業科研人士對人工智能的了解似乎也僅止於此。
我很好奇,什麼才是人工智能裡最難以突破的部分?對於這個籠統的問題,我認識的從業人士們給出的答案可以說是五花八門。
而閔博士給出的答案是,如何在多種模糊信號同步輸入下做判斷,是人工智能最大的難點。“我們在對話的時候,對於我的大腦,有視覺的輸入,也有語言的輸入。大腦需要實時分析這些信號做決策,來決定我下一句要跟對方講什麼。而且對方信號常常是模糊的,易於引起誤解的,所以我們的人腦時時刻刻在做的一件事,就是在多種模糊信號同步輸入的情況下做判斷。”
“這件人腦時時刻刻都在做的事情,卻是人工智能的極致。”他補充道,“現在有很多人去說,我那個圖像識別很精準,人臉識別很精準,但一個火眼金睛的人沒有聽覺或沒有語言能力的話,那還不是一個完整的人吧。所以要一個完整真正智慧需要是幾個功能的協同,所以協同是最難的。”而能初步把視覺、語言、聲音聚合在一起做判斷的無人駕駛,是閔博士心目中迄今為止差不多具備這個協同功能的人工智能。
談到技術問題閔博士語速變得快起來,我們的討論慢慢從無人駕駛轉到了量子計算機。這已經不是他第一次公開向媒體表達他對量子計算機的關注了。“下一個風口一定在量子計算機上,誰能先做出來,誰就能把現在的江湖重新洗牌。”他對量子計算機的前景下如此定論,讓我略感驚訝。“量子計算機的出現會讓我們現在的深度學習這些東西變成小兒科。因為它是從根本理論上對世界、對事物的表徵,從非黑即白的0或者1這種二分類的,變成了一個0和1之​​間的一個混合體,這樣所傳遞的信息量是巨大的。它這種數據結構、邏輯結構有可能根本性的顛覆我們現在的所有設計的算法。”說到這裡他有些激動,並坦言這方面還是美國比較超前,NASA以及幾個知名的大學都成立了量子計算機實驗室,不過中國現在也正在趕上來。
“我上次就講搞深度學習的人你要去看一看量子計算機,你不要老以為說到人工智能就是深度學習、神經網絡,那個東西都是暫時的,以後一旦過渡到了量子計算機的層次上,所有東西都重新洗牌,革命性休克。”閔博士補充道。
“強行碰瓷”型人工智能創業
談話進入尾聲,我們從科技的星辰大海,回到了現實世界。不可避免地,我們談到了中國的人工智能創業。
閔博士認為,現階段中國人工智能創業是有泡沫的,“而且有很多人工智能創業其實叫強行碰瓷,他做的真的不是人工智能。”
強行碰瓷?他說得如此直白,讓有同感的我不由得大笑起來:某些創業公司,一兩年前還在做著一些跟AI完全不相關的產品,今年就突然跟人工智能掛上了鉤,融資隨之而來。
“強行碰瓷”型創業的出現,說明人工智能風潮的深入人心,但不同的是,閔博士認為,這一次,泡沫之下的風口並不是“偽風口”。“這一次的人工智能它底層的基礎是OK的,首先大數據是足夠的,然後雲計算的能力,作為提煉價值手段也具備了,所以是可以從中榨出價值的。”
“但是很不幸的是,”他話鋒一轉,“這些數據和計算能力都掌握在巨無霸手裡對,所以我說那些人工智能創業的小公司其實很艱難,一窮二白,只有幾個名校出來會算法的人,巧婦難為無米之炊,就算可以寫出世界上最複雜的數學公式,但是沒數據,沒數據你都不知道這公式寫的對不對、是不是可行的。”
“資本的洪水如果太猛,會淹死人的啊!”說到這裡,閔博士感嘆道。資本過熱帶來的“捧殺”,也是人工智能創業時所要注意的風險,“一旦之後沒有什麼實質性的成果出來的時候,那退潮也是很快的,資本的逐利性是非常明顯的。 ”
閔博士接著總結:中國的人工智能發展的優勢主要體現其巨大的市場潛力,再加上擁有很多國外所沒有的應用場景,某種程度上能夠反向推動技術的發展。但跟國外相比,基礎理論上的短板尤其明顯。“別看現在有新聞講中國的論文投稿量、發表量好像有很多,看看論文內容,講得都是別人的故事。”
說到這裡閔博士有些凝重, “這需要有人在數學上突破,我們國內的教育體係對數學的重視程度不夠,像美國做深度學習做計算機的人,包括做經濟學的人都是經過數學訓練的。”
在我國的教育體系中,中小學為了升學而學的數學、奧數,到了大學反而被棄之如敝履,這不利於基礎理論的突破。
“如果我們下一代,比如說00後的這一幫人,在大學裡能夠接受非常嚴謹的數學訓練的話,以後機器學習、人工智能這方面可能會有些原創性的突破。”
“這需要一代人的努力。”他最後強調。
(作者郵箱:man.yan@ftchinese.com)

沒有留言: