羅征:騰訊為什么要搞算法大賽?
執(zhí)牛耳網(wǎng)編輯Aira 發(fā)表于 2017-08-08 18:13
閱讀數(shù): 3603
人工智能已經(jīng)成為重塑所有行業(yè)的生產(chǎn)效率的利器。在一系列讓人“瞠目結(jié)舌”的戰(zhàn)果之后,隨之而來的是技術(shù)、機(jī)器學(xué)習(xí)以及一切“朝AI進(jìn)化”的熱潮快速來臨。
近年來不少互聯(lián)網(wǎng)企業(yè)都在積極舉辦算法比賽正是“AI熱”的一個(gè)縮影,比賽并非唯一目的,很多公司真正的愿望是接觸到更多的算法人才,這其中就包括了諸如騰訊、京東、滴滴、阿里巴巴等中國(guó)互聯(lián)網(wǎng)領(lǐng)域的佼佼者。
不久前,騰訊首屆高校算法大賽剛落下帷幕,來自南京大學(xué)的三位學(xué)子拿下了本屆大賽的冠軍,并贏得了高達(dá)30萬(wàn)元的冠軍獎(jiǎng)金。為什么騰訊社交廣告要下大力氣舉辦算法比賽?機(jī)器學(xué)習(xí)對(duì)于廣告的意義在哪里?
Morketing對(duì)話羅征,從一場(chǎng)比賽,了解他對(duì)人工智能的態(tài)度。
從轉(zhuǎn)化入題
此次算法大賽的命題是“移動(dòng)APP廣告轉(zhuǎn)化率預(yù)估”,題目并沒有套上一個(gè)與AI有關(guān)的大帽子,而是著眼在了非常實(shí)際的問題上。在羅征看來,這個(gè)命題既有難度,又十分貼近社交廣告最核心的部分:轉(zhuǎn)化率優(yōu)化。“轉(zhuǎn)化率一直是廣告主最關(guān)心的,他們花錢買點(diǎn)擊和曝光,自然希望了解可以帶來多大價(jià)值。這就是轉(zhuǎn)化?!?/p>
從轉(zhuǎn)化率入手,是因?yàn)榱_征希望能讓參賽的學(xué)生們不光在做算法,同時(shí)也能去更深入的了解計(jì)算廣告,特別是社交廣告領(lǐng)域中存在的現(xiàn)實(shí)問題。在與幾個(gè)奪得優(yōu)異名次團(tuán)隊(duì)的交流中,羅征明顯地感到他們不止是“跑了些算法”這么簡(jiǎn)單。
“如果不了解轉(zhuǎn)化的優(yōu)化是為了什么,只是研究機(jī)器學(xué)習(xí),基本沒有可能贏得比賽,獲獎(jiǎng)的前幾名團(tuán)隊(duì)都對(duì)騰訊社交廣告的業(yè)務(wù)和邏輯做了深度的思考?!绷_征說,比賽不僅訓(xùn)練了他們機(jī)器學(xué)習(xí)的能力,更多的是把算法落地在廣告領(lǐng)域中的實(shí)際應(yīng)用。
騰訊社交廣告APP推廣成本優(yōu)化專屬解決方案oCPA
來自冠軍團(tuán)隊(duì)“nju-newbie”的成員在接受采訪時(shí)也談到:“本次賽題的目標(biāo)是轉(zhuǎn)化率預(yù)測(cè),相比于一般的點(diǎn)擊率預(yù)測(cè),轉(zhuǎn)化率預(yù)測(cè)更困難,用戶數(shù)據(jù)更稀疏,影響轉(zhuǎn)化率的因素更多,這都是對(duì)于參賽選手的挑戰(zhàn)。”
在騰訊社交廣告的體系中,最早應(yīng)用人工智能理念和方法的就包括轉(zhuǎn)化率預(yù)估、點(diǎn)擊率預(yù)估和廣告審核等多個(gè)方面。在數(shù)據(jù)挖掘中,也會(huì)利用到AI,例如對(duì)用戶商業(yè)興趣、行為和生活狀態(tài)等進(jìn)行判斷時(shí),機(jī)器學(xué)習(xí)是最好的選擇,可以避免人工參與導(dǎo)致的隱私問題。
數(shù)據(jù),是這次比賽中讓不少參賽團(tuán)隊(duì)印象深刻的一面,幾位受訪的參賽學(xué)生都談到這次比賽的數(shù)據(jù)規(guī)模是他們見過的比賽中體量最大的一次。數(shù)據(jù)規(guī)模,從很大程度上激發(fā)他們使用了不少之前沒有探索過的模型和技巧。獲得比賽亞軍的團(tuán)隊(duì)Raymone在接受采訪時(shí)說:這次比賽的數(shù)據(jù)量是所有團(tuán)隊(duì)幾乎都要面對(duì)的問題,很多小伙伴在此之前都很少有機(jī)會(huì)接觸到幾十GB級(jí)別的數(shù)據(jù),在機(jī)器性能存在瓶頸的情況下,如何高效的處理并構(gòu)建模型是非??简?yàn)?zāi)芰Φ囊幻妗?/p>
數(shù)據(jù)體量既是騰訊的優(yōu)勢(shì)之一,同樣也是考點(diǎn)。羅征談到當(dāng)數(shù)據(jù)規(guī)模越來越大,對(duì)模型和算法的要求就不再局限于“做得好不好”,還要考慮到工程方面“做得快不快”。如今AI的基礎(chǔ)研究已經(jīng)不只是追求結(jié)果,也要追求速度和資源利用率。
這一點(diǎn)也體現(xiàn)了不少團(tuán)隊(duì)的解決方案中,許多隊(duì)伍都強(qiáng)調(diào)在進(jìn)行轉(zhuǎn)化率預(yù)估前,對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,去噪以及特征提取的重要性。
今年比賽的高校學(xué)生讓羅征印象深刻,除了感受到他們認(rèn)真的投入,對(duì)于算法思考的質(zhì)量也出乎意料的高水平,“參賽學(xué)生們的一些想法和思路,確實(shí)值得我們內(nèi)部去借鑒和嘗試”。
產(chǎn)品驅(qū)動(dòng)下的智能時(shí)代
近幾年來,AI的基礎(chǔ)投入越來越多,算法的突破也越來越多。深度學(xué)習(xí)和各種技巧、能力,讓AI的應(yīng)用覆蓋面越來越大。為了更好的應(yīng)用AI,羅征和他的團(tuán)隊(duì)也會(huì)做一些研究性的投入,目的是利用AI來增加廣告效率,增加廣告主的利益。
這在之前是很難想象的,羅征回憶在自己讀書的那個(gè)時(shí)代,一項(xiàng)技術(shù)從科研到工業(yè)界嘗試,最后變成產(chǎn)品實(shí)際應(yīng)用往往需要5到10年的時(shí)間。而在互聯(lián)網(wǎng)公司的時(shí)代,這一速度被迅速加快。
據(jù)悉,如今很多新興的互聯(lián)網(wǎng)公司例如Google和Facebook都已經(jīng)不再像IBM和AT&T那樣設(shè)立大型研究院。許多公司的研究院專精于最前沿的基礎(chǔ)研究,比如騰訊的AI-Lab實(shí)驗(yàn)室,其發(fā)展目標(biāo)是“學(xué)術(shù)有影響,工業(yè)有產(chǎn)出”,因此專注于基礎(chǔ)研究和應(yīng)用探索結(jié)合。而另外一個(gè)人工智能的研發(fā)驅(qū)動(dòng)力已經(jīng)從“學(xué)術(shù)研發(fā)”轉(zhuǎn)向產(chǎn)品驅(qū)動(dòng)。
“以前的技術(shù)研發(fā),先是學(xué)術(shù)界出來很好玩的東西,然后研究下有什么應(yīng)用價(jià)值,再去落地到產(chǎn)品層面,以專利的形式賣給大公司;如今,很多時(shí)候是產(chǎn)品團(tuán)隊(duì)要提升效率,需要這個(gè)功能,反推研究方向?!边@樣的變化讓技術(shù)從理論落地到產(chǎn)品的速度大大加快,周期變得很短。羅征提到在算法大賽中,一些參賽選手直接參考了業(yè)界的一些前沿論文,并直接應(yīng)用在比賽當(dāng)中,這么快的反饋周期,是10幾年前所不可想的。
然而時(shí)間的縮短,并不意味著一切都要朝“AI看齊”。“AI是一個(gè)很重要的提升效率的手段,但不是目標(biāo)。我們不是為了做AI而做AI。作為一個(gè)企業(yè)的CMO來說,最重要的是結(jié)果,我們可以說使用了AI的技巧,提升了廣告的效果,但最重要的還是轉(zhuǎn)化結(jié)果。”
AI在羅征看來是一個(gè)工具,能夠幫助實(shí)現(xiàn)一些人做不到的事情。落地在廣告領(lǐng)域中,一是將人力所能做的事情自動(dòng)化,比如在廣告審核中引入AI技術(shù),將某些步驟自動(dòng)化處理從而起到對(duì)效率提升的作用;另一種是做一些人做不到的事情,比如在轉(zhuǎn)化率預(yù)估中,數(shù)據(jù)的體量可能包含了幾億用戶過去幾個(gè)月的所有點(diǎn)擊,所有轉(zhuǎn)化,體量非常之巨大。要將他們總結(jié)為一個(gè)模型,得出有效的判斷,是人力所不能及的,這也是機(jī)器學(xué)習(xí)等AI技術(shù)在廣告領(lǐng)域中最為關(guān)鍵的應(yīng)用。
Morketing觀察到,近年來AI行業(yè)的發(fā)展速度驚人,許多互聯(lián)網(wǎng)的一線企業(yè)都在加大投入,并且以開源的姿態(tài)鼓勵(lì)更多的開發(fā)者進(jìn)入AI的領(lǐng)域中。Google的Tenser Flow計(jì)劃以及百度的無(wú)人車項(xiàng)目等都把開放平臺(tái)作為主打。整個(gè)業(yè)界投入的加大,對(duì)于羅征所在的產(chǎn)品應(yīng)用層來說,無(wú)疑是件好事。
人工智能的現(xiàn)實(shí)瓶頸
盡管AI正處于風(fēng)口,但羅征認(rèn)為人工智能的應(yīng)用目前有兩大瓶頸。
想要把AI做的更好,人才儲(chǔ)備是第一位的。據(jù)媒體報(bào)道,人工智能在人才方面極為缺乏,例如為了給創(chuàng)新工場(chǎng)AI工程院搶人,李開復(fù)曾親自跑了多場(chǎng)高校招聘會(huì)。而阿里云的人工智能科學(xué)家閔萬(wàn)里表示,團(tuán)隊(duì)里很多年輕技術(shù)人員都被挖走了。
未來人才爭(zhēng)奪戰(zhàn)可能會(huì)更加激烈,因?yàn)樵絹碓蕉嗟墓鹃_始成立人工智能研究部門。據(jù)悉,微軟AI研究院曝光,位于微軟雷德蒙德總部,擁有100多名來自各個(gè)AI研究子領(lǐng)域的科學(xué)家,包括認(rèn)知、學(xué)習(xí)、推理以及自然語(yǔ)言處理。網(wǎng)易也在不久前設(shè)立了人工智能事業(yè)部。
與高校加深合作,從高校層面就開始招攬人才也是這次“算法大賽”的目標(biāo)之一,羅征坦言人才的供應(yīng)永遠(yuǎn)是不足的,每年這個(gè)領(lǐng)域的畢業(yè)的人才數(shù)量有限。招兵買馬是一個(gè)需要持續(xù)下去的工作。
而另一個(gè)AI的門檻,更多的來自于企業(yè)自身的限制。例如在羅征所在的部門,出于對(duì)用戶隱私保密的負(fù)責(zé),所有的機(jī)器學(xué)習(xí)算法所處理的數(shù)據(jù)均不會(huì)利用任何的聊天記錄,這是騰訊為自己定下的規(guī)則。
“雖然騰訊的數(shù)據(jù)很豐富,但是對(duì)于垂直行業(yè)的理解,還是有些合作伙伴比我們更強(qiáng)的,比如說我們跟易車一起探討汽車類的用戶,跟京東會(huì)探討電商類的,美團(tuán)點(diǎn)評(píng)就探討O2O類的。他們對(duì)用戶在垂直行業(yè)上面的行為興趣理解更深入。我覺得下來更進(jìn)一步的突破點(diǎn),主要就是結(jié)合一些行業(yè)數(shù)據(jù),如何與社交數(shù)據(jù)結(jié)合的更好。”
騰訊社交廣告算法大賽由騰訊社交廣告攜手騰訊數(shù)據(jù)平臺(tái)部、騰訊高校合作、騰訊云、應(yīng)用寶、騰訊招聘、T派校園等各大資源與平臺(tái)聯(lián)合舉辦,旨在加速推進(jìn)算法優(yōu)化,持續(xù)提高廣告的效率和投入產(chǎn)出比,為數(shù)字營(yíng)銷提供完整、精準(zhǔn)的解決方案。
1、執(zhí)牛耳新媒體原創(chuàng)文章及翻譯文章未經(jīng)授權(quán)轉(zhuǎn)載必究,如需轉(zhuǎn)載請(qǐng)聯(lián)系官方微信號(hào)進(jìn)行授權(quán)。
2、轉(zhuǎn)載時(shí)須在文章頭部明確注明出處、保留官方微信、作者和原文超鏈接。如轉(zhuǎn)自執(zhí)牛耳新媒體(微信號(hào):zhiniuerall)字樣。
3.本網(wǎng)站所轉(zhuǎn)載的文章資料、圖片、圖表、數(shù)據(jù)僅供參考使用,所刊登的轉(zhuǎn)載信息均為信息來源方與的個(gè)人意見及表達(dá)方式,和本網(wǎng)站無(wú)任何關(guān)系,如有侵權(quán)或違法行為應(yīng)由其相關(guān)信息來源方承擔(dān)全部責(zé)任。
本網(wǎng)編輯。所轉(zhuǎn)載稿件僅代表作者觀點(diǎn),不代表執(zhí)牛耳立場(chǎng),最終解釋權(quán)歸原作者所有。
文章:1478
0條評(píng)論