《AI科技評論》專訪楊植麟:從「組織架構」上解決AI落地難題
-
2022-01-13
-
媒體報道
作者 | 陳彩嫻
編輯 | 岑峰
「我想有一條更激進、更徹底的路徑去打破學術界與工業界的壁壘。」被問及創業的原因時,楊植麟這樣答道。
在投資人的眼里,楊植麟與循環智能的其他創始人一樣,有一份絕對拿得出手的光鮮履歷:
本科就讀于臥虎藏龍的清華大學計算機系,師從IEEE Fellow唐杰,2015年以年級第一名的優異成績畢業;
隨后,赴自然語言處理(NLP)研究全球排名第一的卡內基梅隆大學語言技術研究所(LTI)攻讀博士,師從知名學者Ruslan Salakhutdinov與William Cohen;
博士期間,他與圖靈獎得主Yoshua Bengio合作發布「火鍋問答」數據集HotpotQA,又以一作身份發表的 XLNet 與 Transformer-XL在NLP領域產生重要影響,成為 NeurIPS 2019 與 ACL 2019 的最高引論文之一,谷歌學術引用次數直接破萬……

圖注:楊植麟的谷歌學術論文被引主頁
作為一名佼佼的青年AI學者,楊植麟確定自己志在推動人工智能技術在現實生活中的大規模應用。
一般來說,年輕博士生參與技術落地的途徑是進入資金雄厚、牛人云集的大廠,在其中謀得一官半職,比如他的兩位博士導師Ruslan Salakhutdinov與William Cohen并分別在搞學術之余擔任蘋果 AI 研究負責人與谷歌首席科學家。
但楊植麟認為,「科學家加盟大廠」的模式在組織架構上存在局限性,并不能令他更深入地參與到AI落地中,也無法從根本上解決工業界進行AI落地的瓶頸:
「我覺得AI行業面臨的共同問題是學術界與工業界之間的Gap。我們看到老師們在工業界有一些title,但其實本質上他們還是在做研究工作。基礎研究固然重要,但無法打破這種壁壘,研究內容與實際落地之間還有很多步驟。」
具體的表現有:一,高校教師往往更偏向學術研究,與工業界的聯系較少,也缺少工業界落地的思考與驅動力;二,與此同時,雖然許多互聯網大廠也會招入杰出的科學家去解決技術難題,但它們的首要出發點是賦能業務,而非推動AI落地。
從大廠運作的組織架構上來說,這些杰出的科學家沒有足夠的資源或權利去推動產品落地。公司的業務方向會調整,即使科學家有意愿去推動一項產品的落地,成本與代價也會大幅增加,技術的轉化率與效率也會受到企業組織架構的影響。
在楊植麟看來,這是一個非常大的限制,這也造成了在大廠中,許多AI技術的落地周期十分漫長,也不夠敏捷。因此,2019年博士畢業時,他拒絕了谷歌、Facebook與華為等大廠的高薪offer,選擇了回國創業。
楊植麟對AI科技評論回憶,他的本科與博士導師都十分看重技術的實際價值,這給他帶來了很大的啟發。不同的是,他會更激進地去追求落地的結果,深入業務中進行研究。他的計劃是同時進行學術研究與技術落地,并同時取得成果。
循環智能成立于2016年。也就是說,楊植麟從博士二年級開始就一邊搞學術研究、一邊創業。
正是有感于「大廠科學家」的尷尬處境,他一直強調「我們需要新的思考」。在循環智能,他不僅是AI技術負責人,還是產品經理,這無疑是一個「范式層面的革新」,是他心中能夠有效打破技術與價值之間壁壘的最優途徑:
「一方面,我們會去做基礎的研究,如預訓練、多模態等;另一方面,我們也要去進行落地。這兩個事情可以互相提升與促進。」
循環智能最早的三位創始人陳麒聰、楊植麟與張宇韜相識于清華大學的知識工程實驗室,都有一股「用AI創造社會價值」的熱血。三人都是技術出身,后來因為業務發展,循環智能在2018年又引入了另一位擅長技術產品運營的聯合創始人揭發。
自成立以來,楊植麟就是團隊的核心技術骨干。2016年與2017年,他與陳麒聰、張宇韜開始摸索技術的應用方向。
對新一代AI創業者來說,2017年是一個重要的時間節點。
那一年,谷歌團隊在“Attention is All You Need”一文中提出Transformer模型,該模型沒有采用卷積網絡與以往RNN的時序結構,采用編碼機制,編碼端同時包含語義信息(Multi-Head Attention)和位置信息(Positional Encoding),能夠并行計算,大大提升了語言模型的訓練速度。
對于專注技術落地的創業者來說,這無疑是一項利好消息,能夠減少預訓練的時間,節約研發成本,加速技術與場景的匹配速度。Transformer的出現,打破了計算機視覺憑借深度學習在AI創業圈一統天下的壟斷局面,使一大批基于NLP技術的創業公司開始嶄露頭角,循環智能便是其中之一。
循環智能的主要業務是運用NLP、語音、多模態、大模型等人工智能技術打造「銷售科技」方案,幫助企業的銷售團隊提升銷售業績。
楊植麟談道:「我們認為,AI產生價值的過程可以分為幾個階段,而其中一個階段就是幫助每個人變得更好,提升人的能力,從而提升整個社會的運行效率。這個Vision(愿景)是我們公司成立之初就有的想法。」
據他介紹,循環智能選擇將AI用于「提升人的溝通能力」,也是經過了很長時間的探索,與客戶交流、不斷迭代才確定。最終,他們抉擇的原動力是客戶的訴求,以及對整體市場的判斷。比如,根據CB Insights的數據統計,2016年銷售科技初創企業的投資額就超過了50億美元,此后逐漸遞增。這也表明了市場對這個賽道的信心。

圖注:Gartner的銷售科技(SalesTech)技術成熟度曲線2021顯示,銷售賦能一支已經渡過「技術萌芽期」(Innovation Trigger),進入「期望膨脹區」(Peak of Inflated Expectations)
對于這項基礎技術的快速轉化,楊植麟引以為豪:
「在預訓練的過程中,我們將技術部署在產品系統上,讓它能以實際數據集的運行效果為最終目標,驅動中間的研發過程。在將挖掘系統落地時,系統也是以最終的業務結果為目標進行學習與優化。同時,中間過程又可以迭代出很多AI問題與基礎技術,使得之后的產品可以進一步改善。」
AI模型的落地中,一個常見的問題是數據集的真實性與完備性。
一般來說,研究者在改進模型時,往往是基于特定的、人工創造的數據,但這些數據也許并無法完整、正確地描述模型在實際場景中遇到的情況。因此,盡管預訓練的若干技術都已在學術界的許多數據集上得到了測試,且性能優異,但在實際應用中,卻仍需要非常多的技術改進才能部署落地,因為模型會遇到更多更復雜的問題。
目前,在解決這一問題上,學術界仍未有突出進展。但在創業的過程中,由于楊植麟與團隊的預訓練技術研究從一開始就是在實際的數據集中測試,直接與AI產品框架匹配,因此,類似的落地問題便能從根拔起。
除了2017年的Transformer,近年來,人工智能領域又涌現出了許多基于Transformer的大規模預訓練語言模型,比如Bert與GPT-3。此外,還有許多新興技術對AI創業者產生了積極影響,比如少樣本與零樣本的研究突破。
從NLP技術落地的角度來看,這將是一個個革命性時刻。因為通過將這些研究成果有機結合,AI模型的效果與效率能夠得到大幅提升。在某些場景中,研究者甚至只需要通過非常少的樣本、甚至零樣本就可以取得跟以往一樣好的效果。
對于循環智能來說,這意味著,在用AI提升銷售轉化率的過程中,他們能夠做到很多以前做不了的事情,比如會話洞察與分析引擎。隨著NLP落地技術的逐漸成熟,加之企業服務在全球范圍內成為新的投資熱點,楊植麟與團隊憧憬,通過「NLP+銷售」的路徑,循環智能也有成為「中國Gong.io」的可能。
具體來說,用人工智能提升銷售效率的過程可以分為三步:一是對銷售與客戶之間的會話數據進行采集;二,對有價值的會話內容進行挖掘并建模,將非結構化數據轉為結構化數據;三,分析會話數據,找出銷售人員在與客戶溝通的過程中存在的問題,更精確地分析客戶意愿,并給出解決問題的關鍵要素。
歸根到底,就是對大規模的文本數據進行高效分析。
聽來簡單,但事實上,「AI+銷售」是一條同時具備市場剛需與高技術壁壘特征的賽道,因為這要求AI系統具備綜合分析的能力, 除了算法,會話洞察能力、數據分析能力、行業營銷知識等等也缺一不可。這很符合循環智能創始團隊的創業風格:既要創造價值,也要擁有一定的技術門檻,提高競爭難度,減少對手。
從剛需的角度來看,業績增長是每一家企業的發展根基。銷售作為市場營銷中的一環,其會話流量的轉化率對業務目標的影響至關重要。據楊植麟觀察,流量轉化率在許多行業中都是一個突出的痛點問題,尤其是金融行業。
他們曾接觸過一個國內的頭部保險公司X,旗下有一家分公司Y。Y的銷售困境是:雖然Y的銷售團隊賣出了許多保單,數量遠遠高于鄰城的另一個分公司Z,但所收的保費總和卻比Z要低。經過分析,原因很簡單:因為Y的「件均」保費遠遠低于Z。
這時,他們需要通過分析手中已有的數據,來找到拯救萎靡業績的方案。而回顧已有數據,企業的唯一法寶,是保存了大量的溝通語音或文本數據。
對于計算機來說,未經解碼的語音數據猶如黑盒,同時是非結構化的。這時,NLP與語音技術的結合可以對這些非結構化數據進行高效解析,并管理一個企業銷售團隊的溝通過程。換言之,此時AI產品還是一個「管理抓手」的角色,分析銷售人員與客戶的溝通情況,洞察客戶需求,提高銷售管理能力和銷售團隊的工作效率。
「我們提供的產品可以把每位銷售人員在每一天的開口率以非常清晰的、精確的方式呈現出來。它能定位到每一個團隊成員的每一通電話、每一次溝通,據此便可以做很多報表分析,從而知道每個團隊的問題在于何處。」楊植麟介紹。

圖注:循環智能AI產品的原理示意圖
楊植麟解釋:「這幾個行業都有一個共同的特點,就是對銷售技能的要求高,銷售過程非常復雜。同時,相對來說,這些行業有精細化運營的需求,它們的精細化程度達到了一定的閾值,足以支撐他們應用AI系統來優化效率。」
在這個過程中,他們的AI系統后臺也積累了數千個來自不同行業的語義模型,構成了循環智能AI大腦的強大知識庫,有利于NLP模型的進一步落地。去年,他們與華為云合作,開發了大規模中文模型「盤古」,在部分實際場景中達到了優于Bert與GPT系列的效果。
目前,循環智能已進行到B輪融資,連續三年實現了超200%的營收增長。不過,楊植麟談道,創業必須深入業務:「我們現在還屬于將產品打磨成熟的階段,主要任務是擴展與提升銷售溝通場景的覆蓋面。」
楊植麟認為,決定一家技術創業公司是否能立足的兩個因素,一是具備多維度的綜合能力,二是深耕行業,能夠將通用產品與細分的行業方案進行有機結合:
「當我們擁有了一個通用的技術品牌后,我們可以用較低的邊際成本將其擴展到新的行業、新的公司與新的細分場景中。因此,我們需要一個成為『行業專家』的團隊,能夠提供專業的行業方案,再用這個專業方案包裝產品,進行落地。」
循環智能擁有明星創始人團隊,在吸引綜合人才方面并不難。楊植麟也強調,打造用于提升銷售的AI系統并不能僅靠一群「NLPer」或「CSer」的力量,還需要有硬件人才、營銷人才、行業分析師等等。
在科技賦能數字經濟的進程中,NLP的核心價值往往體現在最后一公里。對于任何行業來說,只要有溝通數據與文本數據的場景,NLP技術就可以發揮價值。傳統的NLP場景最大的瓶頸是規模化,但隨著Transformer、少樣本/零樣本學習等研究的突破釋放了極高的邊際價值,楊植麟相信,在未來幾年,NLP的規模化賦能將成為可能。
創業五年,楊植麟總結了自己在技術以外的成長:一是有機會學習到商業邏輯,加深了對行業與場景的認知;二是學習到如何建立與運營一家公司;三則是能有一種更徹底的方式縮短了技術與價值之間的鴻溝。
十年前,也許很多人會認為,進入大廠才是研究實用AI的最佳途徑。但隨著近一兩年來越來越多的技術大牛從互聯網大廠離職,或回歸學術界,或自主創業,人們開始意識到:要推動人工智能技術的大規模落地,需要一種新的運作模式。從這點來看,楊植麟的選擇頗有先見之明。
據了解,目前,楊植麟除了在循環智能創業,同時也在清華大學、智源研究院等機構主導了多個AI研究項目,繼續踐行他對如何打破研究與應用之間壁壘的思考。在創業與學術的雙輪驅動下,楊植麟等新一代實干家,給中國人工智能的未來帶來的不僅是「激進」的應用,還有培養從研究端就開始思考技術轉化的青年人才。
薪火相傳,未來可期。
█ www.xhrsp.com
█ 010-56271640
█ 簡歷投遞:hr@rcrai.com
█ 北京 | 上海 | 無錫 | 深圳