快手賣pos機(jī),因果推斷在快手推薦場(chǎng)景的應(yīng)用探索

新聞資訊2 | 2023-05-28 12:41 | 投稿人：pos機(jī)之家

網(wǎng)上有很多關(guān)于快手賣pos機(jī),因果推斷在快手推薦場(chǎng)景的應(yīng)用探索的知識(shí)，也有很多人為大家解答關(guān)于快手賣pos機(jī)的問(wèn)題，今天pos機(jī)之家(m.afbey.com)為大家整理了關(guān)于這方面的知識(shí)，讓我們一起來(lái)看下吧!

本文目錄一覽：

1、快手賣pos機(jī)

快手賣pos機(jī)

導(dǎo)讀：推薦系統(tǒng)不可避免地存在偏差（bias）。一個(gè)用戶無(wú)論是在刷視頻、看資訊、還是在線購(gòu)物等基于推薦的場(chǎng)景中作出的選擇通常會(huì)產(chǎn)生各種偏差。比如用戶會(huì)偏向點(diǎn)擊位置靠前的內(nèi)容，也會(huì)偏向于點(diǎn)擊流行度比較高的內(nèi)容；另外由于推薦系統(tǒng)給用戶推薦的候選內(nèi)容只占整體內(nèi)容的一小部分，而用戶的點(diǎn)擊行為都是基于這樣一小部分候選集進(jìn)行的，所以這會(huì)產(chǎn)生選擇偏差。

添加小助手鏈接：https://wpz.h5.xeknow.com/s/3udZfR

1.免費(fèi)資料領(lǐng)?。狐c(diǎn)擊上方鏈接添加小助手回復(fù)【大數(shù)據(jù)合集】免費(fèi)領(lǐng)取《大數(shù)據(jù)典藏版合集》

回復(fù)【算法合集】免費(fèi)領(lǐng)取《互聯(lián)網(wǎng)核心算法合集》

2.添加交流群：點(diǎn)擊點(diǎn)擊上方鏈接添加小助手回復(fù)【大數(shù)據(jù)交流群】加入“大數(shù)據(jù)交流群”

回復(fù)【算法交流群】加入“算法交流群”

與此同時(shí)，用戶交互日志是模型訓(xùn)練的基礎(chǔ)，直接基于這部分觀測(cè)日志數(shù)據(jù)作為訓(xùn)練模型的樣本會(huì)導(dǎo)致訓(xùn)練的模型存在bias，導(dǎo)致給用戶推薦的內(nèi)容同樣存在bias，進(jìn)而整個(gè)系統(tǒng)會(huì)形成bias閉環(huán)，在影響用戶體驗(yàn)的同時(shí)，不利于系統(tǒng)生態(tài)的建設(shè)。

因此我們嘗試結(jié)合因果推斷來(lái)解決推薦系統(tǒng)中的bias問(wèn)題，本次分享的主題是因果推斷在快手推薦場(chǎng)景的應(yīng)用探索，旨在通過(guò)識(shí)別變量之間的因果關(guān)系來(lái)進(jìn)行糾偏。

具體將圍繞以下幾點(diǎn)展開(kāi)：

背景介紹最新研究進(jìn)展因果推斷在快手的應(yīng)用總結(jié)與思考

01背景介紹

首先和大家分享下因果推斷的背景。

添加圖片注釋，不超過(guò) 140 字（可選）

首先我們介紹一下因果推斷的定義。因果推斷主要研究如何更加科學(xué)得識(shí)別變量之間的因果關(guān)系，強(qiáng)調(diào)原因的唯一性。因果性和相關(guān)性是有一定的聯(lián)系與區(qū)別的，從他們的定義來(lái)看：因果性指的是在改變X后Y隨之也發(fā)生變化，我們稱X是Y的因；相關(guān)性指在觀測(cè)到的數(shù)據(jù)分布中，若果我們觀測(cè)到了X的分布就可以推斷出Y的分布。因此從定義可以得出，相關(guān)性是對(duì)稱的，即若X和Y相關(guān)，則Y和X相關(guān)；但是因果性是非對(duì)稱的。相關(guān)性不一定說(shuō)明因果性，但是因果一般會(huì)在統(tǒng)計(jì)層面導(dǎo)致相關(guān)性。我們現(xiàn)有的機(jī)器學(xué)習(xí)中純數(shù)據(jù)驅(qū)動(dòng)的方法其實(shí)更多時(shí)候?qū)W習(xí)的是相關(guān)性，這就導(dǎo)致目前的深度學(xué)習(xí)模型的可解釋性較差。如果我們引入因果性結(jié)合相關(guān)性一起建模，從理論上來(lái)說(shuō)它的效果會(huì)比僅使用相關(guān)性建模要好，即會(huì)使模型的可解釋性變好，模型的魯棒性也有一定的提升。

添加圖片注釋，不超過(guò) 140 字（可選）

因果推斷可以被總結(jié)為三個(gè)層次。從問(wèn)題角度出發(fā)，首先，因果推斷的第一個(gè)層次主要是探索變量之間的關(guān)系，即相關(guān)性。常規(guī)機(jī)器學(xué)習(xí)在應(yīng)用中主要學(xué)習(xí)的就是變量之間的相關(guān)性。第二個(gè)層次是研究實(shí)施某種干擾的效果，這一層次在營(yíng)銷領(lǐng)域使用得較多，典型的例子是uplift model。舉個(gè)例子，我們對(duì)某個(gè)地方或者某一群用戶發(fā)放優(yōu)惠券，我們考慮發(fā)多少優(yōu)惠券、對(duì)哪些人發(fā)放優(yōu)惠券，實(shí)施這一行為后產(chǎn)生的效果或者收益是否符合業(yè)務(wù)預(yù)期。這類方法被稱為干擾或者干預(yù)。第三個(gè)層次是從結(jié)果考慮原因，被稱為反事實(shí)推斷，即如果我想得到某種結(jié)果我們應(yīng)該做什么改變。現(xiàn)在大多數(shù)因果建模都是從這一層次來(lái)進(jìn)行探索。

編輯切換為居中

添加圖片注釋，不超過(guò) 140 字（可選）

常用的因果推斷方法如上圖列舉所示。首先是基于加權(quán)的方法，典型代表是IPW。第二類是基于匹配的算法，這里主要是無(wú)偏匹配。另外，還有基于樹(shù)模型來(lái)做因果推斷的方法，比如因果森林等。當(dāng)然，還有很多其他類型的方法，由于這部分內(nèi)容不是本次分享的重點(diǎn)，這里我就不一一列舉了。

02最新研究進(jìn)展

接下來(lái)我選取幾個(gè)代表性工作介紹一下因果推斷在推薦系統(tǒng)中最新的研究進(jìn)展。

添加圖片注釋，不超過(guò) 140 字（可選）

首先是在WWW21發(fā)表的DICE。DICE這一方法是基于causal embedding的解決方案。論文認(rèn)為用戶的交互行為可以被拆解為兩部分：由于視頻的流行度較高導(dǎo)致用戶基于從眾心理產(chǎn)生交互行為；用戶的純興趣導(dǎo)致的交互行為。我們可以進(jìn)一步抽象為基于interest和基于conformity的兩部分表征。那么問(wèn)題就轉(zhuǎn)化為如何構(gòu)建不同的數(shù)據(jù)集來(lái)分別學(xué)習(xí)interest和conformity的embedding。具體地，在構(gòu)造數(shù)據(jù)集時(shí)可以使用<user,pos_item,neg_item>三元組。當(dāng)用戶點(diǎn)擊了一個(gè)postive item且它的流行度比negative item更小，就認(rèn)為交互行為是基于興趣的；如果點(diǎn)擊的item的流行度大于negative item，那么這次交互是由從眾心理和用戶興趣疊加而成的。

添加圖片注釋，不超過(guò) 140 字（可選）

基于上述想法，可以把數(shù)據(jù)分為O1和O2兩部分，然后使用多目標(biāo)學(xué)習(xí)的框架來(lái)分別學(xué)習(xí)interest embedding和conformity embedding。其中，DICE將兩個(gè)embedding疊加在一起產(chǎn)生的向量表示作為主任務(wù)，其單獨(dú)的2個(gè)embedding學(xué)習(xí)作為輔助任務(wù)。損失函數(shù)是將三個(gè)損失與一個(gè)正則項(xiàng)相加，其中discrepancy損失的目的是為了讓兩類embedding具有區(qū)分性。

添加圖片注釋，不超過(guò) 140 字（可選）

第二個(gè)工作是華為在Recsys21發(fā)表的一篇論文，它的基本思路也是使用了causal embedding方案進(jìn)行建模。它的出發(fā)點(diǎn)是認(rèn)為系統(tǒng)的feedback表征可以分為bias和unbias兩部分，文章并沒(méi)有指出bias具體是哪類bias，而是認(rèn)為bias表征的是所有feedback bias。

添加圖片注釋，不超過(guò) 140 字（可選）

在訓(xùn)練的時(shí)候，論文分別訓(xùn)練兩部分embedding；在infer的時(shí)候，僅僅使用無(wú)偏的embedding。具體來(lái)說(shuō)，這篇工作從信息瓶頸的角度來(lái)構(gòu)造損失函數(shù)。信息瓶頸類似于一個(gè)信息提取方式，該方法認(rèn)為輸入的信息包含很多噪聲，因此使用信息瓶頸將信息進(jìn)行壓縮，使得最后得到的表征信息量足夠大。在實(shí)現(xiàn)過(guò)程中基于互信息實(shí)現(xiàn)，其中，互信息的物理含義是度量?jī)蓚€(gè)變量之間的相關(guān)性，如果兩個(gè)變量是強(qiáng)相關(guān)的，那么它們的互信息很大；反之，如果兩個(gè)變量幾乎相互獨(dú)立，那么它們之間的互信息就很少。作者構(gòu)造了上圖所示的損失函數(shù)，它由四項(xiàng)組成。前兩項(xiàng)屬于信息瓶頸，它希望無(wú)偏表征不能過(guò)度擬合有偏輸入變量x，同時(shí)希望無(wú)偏表征能盡可能擬合目標(biāo)y。但無(wú)偏表征和輸入不能完全不相關(guān)，所以這里在損失函數(shù)前添加了參數(shù)β進(jìn)行控制。第三項(xiàng)表示無(wú)偏表征和有偏表征要保持一定程度的獨(dú)立，使得它們有一定的區(qū)分性。第四項(xiàng)損失函數(shù)是基于bias對(duì)真實(shí)標(biāo)簽的預(yù)估也會(huì)有一定的輔助作用的想法。在推薦領(lǐng)域，bias不一定是完全有害的，其中一部分bias是有意義的，因此這里需要一個(gè)參數(shù)去控制bias的量級(jí)。文章通過(guò)KL散度以及一些理論推導(dǎo)將上述損失函數(shù)轉(zhuǎn)化為信息熵的形式，使得模型可以通過(guò)最小化變換后的損失函數(shù)來(lái)學(xué)習(xí)無(wú)偏表征和有偏表征。

編輯切換為居中

添加圖片注釋，不超過(guò) 140 字（可選）

下面介紹的兩個(gè)工作從因果效應(yīng)的角度來(lái)解決糾偏問(wèn)題。首先是一篇發(fā)表在KDD21上的文章。它的基本想法與第一個(gè)工作相似，構(gòu)造因果圖的時(shí)候?qū)Ⅻc(diǎn)擊行為分為K->Y的用戶興趣匹配、I->Y的物品流行度以及U->Y的用戶從眾心理。論文希望用戶對(duì)item的點(diǎn)擊預(yù)估是基于純興趣匹配，因此我們需要去除存在bias的邊，即去除item流行度與用戶從眾性導(dǎo)致的bias。文章基于因果效應(yīng)理論給出解決方案如下，其中TE是總效應(yīng)、NDE是bias的直接效應(yīng)，我們可以通過(guò)使用TE和NDE的差來(lái)得到無(wú)偏估計(jì)。事實(shí)上，NDE基于反事實(shí)假設(shè)的，即如果沒(méi)有基于興趣匹配的K->Y輸入而只包含U的從眾性和I流行度輸入，那么最終模型的預(yù)估是怎么樣的。

添加圖片注釋，不超過(guò) 140 字（可選）

模型建模方式也是多任務(wù)學(xué)習(xí)。在訓(xùn)練時(shí)，上圖中間的模型作為主任務(wù)，左右兩側(cè)分別是一個(gè)user塔和一個(gè)item塔分別作為輔助任務(wù)。user和item塔分別學(xué)習(xí)用戶特征和物品特征單獨(dú)作用下的預(yù)估輸出，它們的標(biāo)簽值與主任務(wù)使用的一致。根據(jù)前述公式推導(dǎo)，在最終推斷時(shí)我們就需要將總效應(yīng)TE減去NDE即可，最終得到的計(jì)算公式如上圖所示。

添加圖片注釋，不超過(guò) 140 字（可選）

第四個(gè)工作和第三個(gè)工作解決方案相同，它解決的是“標(biāo)題黨”問(wèn)題。當(dāng)一個(gè)用戶點(diǎn)擊一個(gè)視頻，他可能是被標(biāo)題吸引進(jìn)來(lái)，但實(shí)際上他對(duì)視頻內(nèi)容不感興趣。當(dāng)平臺(tái)上這類視頻特別多時(shí)是非常影響用戶體驗(yàn)的。因此為了解決這個(gè)問(wèn)題，文章構(gòu)建了如上因果圖，e代表標(biāo)題，t代表視頻的內(nèi)容表征，u是用戶表征，Y是交互表征。我們的目標(biāo)是去除標(biāo)題e對(duì)Y的邊，使得user與item的匹配是基于純興趣匹配的。類似第三個(gè)工作，文章使用TE減NDE的方式進(jìn)行推導(dǎo)，得到unbias的輸出結(jié)果。另外，這篇工作也使用了多目標(biāo)建模方式。

編輯切換為居中

添加圖片注釋，不超過(guò) 140 字（可選）

下面介紹的工作使用了第三類解決方案，即采用后門機(jī)制結(jié)合貝葉斯概率模型來(lái)解決糾偏問(wèn)題。這篇文章發(fā)表在SIGIR21上，解決的是傳統(tǒng)流行度偏差問(wèn)題。在推薦系統(tǒng)中，流行度會(huì)影響物品是否曝光，也會(huì)影響用戶是否交互。作者認(rèn)為流行度高代表的內(nèi)容質(zhì)量通常比較高，所以流行度到點(diǎn)擊的邊需要被保留。但是物品是否被曝光應(yīng)該基于用戶的真實(shí)興趣，而與該物品的流行度無(wú)關(guān)，所以流行度到物品的邊不應(yīng)該存在，這條邊是一個(gè)bias。文章的解決方案是使用了后門機(jī)制，使得最終的交互條件概率與流行度對(duì)內(nèi)容是否曝光的條件概率無(wú)關(guān)。我們基于這個(gè)工作做了一些改進(jìn)并落地，之后會(huì)詳細(xì)介紹算法的原理。

03因果推斷在快手的應(yīng)用

接下來(lái)介紹一下快手使用因果推斷在推薦場(chǎng)景下的探索。

1. 流行度debias

添加圖片注釋，不超過(guò) 140 字（可選）

首先是流行度debias的工作。流行度偏差在推薦系統(tǒng)中十分常見(jiàn)，我相信大家在各個(gè)業(yè)務(wù)中也面臨了同樣的問(wèn)題。頭部效應(yīng)嚴(yán)重就會(huì)導(dǎo)致熱門內(nèi)容曝光量較大，進(jìn)而導(dǎo)致訓(xùn)練日志被熱門內(nèi)容主導(dǎo)，這對(duì)于長(zhǎng)尾內(nèi)容非常不友好。此外，模型會(huì)過(guò)度曝光頭部的視頻，因?yàn)橛行╊^部的視頻有可能已經(jīng)處于衰退期，它的pxtr已經(jīng)在下降，此時(shí)給予它太多曝光會(huì)導(dǎo)致低效率，浪費(fèi)曝光流量?；谶@兩個(gè)問(wèn)題，工業(yè)界有三種解決方案。首先是使用IPW，但這種方法依賴于流行度具體值，流行度值大小的變化使得權(quán)重值波動(dòng)較大，所以模型的方差很大，訓(xùn)練很難收斂。第二個(gè)方法是使用causal embedding方案，這類方案需要?jiǎng)澐殖鰞煞N數(shù)據(jù)集。如最開(kāi)始的causal embedding論文使用無(wú)偏數(shù)據(jù)集，但是無(wú)偏數(shù)據(jù)很貴，也有其他工作嘗試基于觀測(cè)數(shù)據(jù)進(jìn)行處理后劃分不同數(shù)據(jù)集，但人為劃分?jǐn)?shù)據(jù)也會(huì)引入其他一些偏差。第三種方式是直接通過(guò)加特征或者加debias塔的方案建模流行度對(duì)模型的影響，類似于之前youtube和google提出的建模方法，但是這種方式?jīng)]有完美的理論支撐，而且bias特征很難與其他輸入特征進(jìn)行平衡（bias特征可能被其他特征淹沒(méi)）。

添加圖片注釋，不超過(guò) 140 字（可選）

因此我們引入了因果推斷的思想來(lái)進(jìn)行debias。流行度偏差的核心問(wèn)題是流行度偏差確實(shí)不利于學(xué)習(xí)用戶真實(shí)興趣，但流行度較高的視頻其內(nèi)容質(zhì)量較好；另外用戶有看熱門的需求，比如大家打開(kāi)微博、知乎或者脈脈等軟件都會(huì)去看看熱榜。我們的解決方案是在訓(xùn)練時(shí)去除流行度偏差對(duì)模型的負(fù)向影響，對(duì)應(yīng)于因果圖就是去掉Z到I的這條邊。又由于流行度高的內(nèi)容質(zhì)量其實(shí)是不錯(cuò)的，因此在infer 時(shí)會(huì)保留Z到C這條邊。

添加圖片注釋，不超過(guò) 140 字（可選）

接下來(lái)具體看一下訓(xùn)練的時(shí)候如何去消除流行度對(duì)模型的負(fù)向影響。結(jié)合上圖的因果圖來(lái)看，我們基于后門機(jī)制，使用一個(gè)do算子來(lái)表示消除流行度影響。具體推到過(guò)程如上圖，在公式中，第一步到第二步利用了貝葉斯概率公式，第二步到第三步是源于我們使用do算子消除了I與Z的關(guān)系，所以U和I與Z是獨(dú)立的，第三步到第四步是因?yàn)榱餍卸鹊南闰?yàn)在兩個(gè)因果圖中是不變的。

添加圖片注釋，不超過(guò) 140 字（可選）

另外我們將用戶、視頻與視頻流行度進(jìn)行解耦，將P(C|U,I,Z)條件概率轉(zhuǎn)化為匹配分與流行度的乘積。建模的數(shù)學(xué)公式如上圖所示，其中ELU’是一個(gè)激活函數(shù)，流行度部分引入了γ參數(shù)進(jìn)行控制，并引入了pair loss對(duì)模型進(jìn)行訓(xùn)練。

編輯切換為居中

添加圖片注釋，不超過(guò) 140 字（可選）

進(jìn)一步，我們可以將P(C|U,I,Z)的解藕結(jié)果帶入引入do算子的條件概率公式繼續(xù)進(jìn)行推導(dǎo)，最終的表達(dá)式如上圖所示。我們可以發(fā)現(xiàn)最終的結(jié)果只與流行度的期望有關(guān)，而流行度這個(gè)單變量的期望是一個(gè)常數(shù)，對(duì)排序不產(chǎn)生影響。所以通過(guò)這個(gè)方法，我們已經(jīng)將流行度對(duì)模型的影響消除了。

編輯切換為居中

添加圖片注釋，不超過(guò) 140 字（可選）

在infer階段，我們也使用了do算子，將流行度作為變量引入條件概率。具體地，我們針對(duì)流行度考慮了其變化趨勢(shì)對(duì)推薦的影響。這么做是希望模型與item的生命周期進(jìn)行結(jié)合，因?yàn)閕tem的流行度變化是呈現(xiàn)從逐漸增加到逐漸降低的過(guò)程。最終的模型infer得分是匹配得分與流行度的乘積。

編輯切換為居中

添加圖片注釋，不超過(guò) 140 字（可選）

我們對(duì)比了干預(yù)后流行度對(duì)item的影響變化，上圖左側(cè)是沒(méi)有進(jìn)行糾偏的推導(dǎo)，右側(cè)是進(jìn)行糾偏的推導(dǎo)。它們的主要差別在于因果圖中Z對(duì)I的條件概率，進(jìn)行糾偏操作后U,I與Z式獨(dú)立的，進(jìn)而就去除了流行度對(duì)item的曝光影響。

編輯切換為居中

添加圖片注釋，不超過(guò) 140 字（可選）

在具體落地過(guò)程中，我們對(duì)模型進(jìn)行了進(jìn)一步改進(jìn)。比如損失函數(shù)使用了pointwise來(lái)替代pairwise，當(dāng)然這一選擇是基于業(yè)務(wù)表現(xiàn)的。此外，我們使用RELU來(lái)替代ELU’，因?yàn)橛写罅抗ぷ髯C明RELU+BN的效果好于ELU’。我們還將流行度變化趨勢(shì)從差值替換為計(jì)算梯度，這是因?yàn)椴钪祵?duì)低流行度內(nèi)容十分不友好。另外我們還把控了infer階段注入流行有益部分的內(nèi)容質(zhì)量。

添加圖片注釋，不超過(guò) 140 字（可選）

從實(shí)驗(yàn)結(jié)果來(lái)看，曝光提升或者下降的case是符合預(yù)期的。具體地，曝光下降最快的case大多是一些獵奇的或者低質(zhì)量的內(nèi)容。從實(shí)驗(yàn)結(jié)果圖來(lái)看，上圖橫軸從左至右分別代表的是曝光區(qū)間，越往右的曝光區(qū)間的曝光量越大。從圖中可以看出，對(duì)比各曝光區(qū)間的曝光item數(shù)量，中長(zhǎng)尾的曝光item數(shù)是增多的；對(duì)比各曝光區(qū)間的曝光量，中長(zhǎng)尾item的曝光量也是提升的，而頭部視頻或者流行度較高視頻的曝光量提升主要是因?yàn)閕nfer的時(shí)候我們特意引入流行度導(dǎo)致。另外我們還針對(duì)效率進(jìn)行可視化，發(fā)現(xiàn)中尾部的視頻對(duì)應(yīng)的pxtr的提升更大，這也符合我們的預(yù)期。

2. 因果表征解耦

添加圖片注釋，不超過(guò) 140 字（可選）

第二個(gè)工作我們引入causal embedding思想，基于DICE針對(duì)落地進(jìn)行了一些改進(jìn)。具體地，我們將用戶消費(fèi)視頻的行為拆解為基于興趣(interest)以及基于從眾心理(conformity)。在這樣的假設(shè)下，主要問(wèn)題就轉(zhuǎn)化為如何構(gòu)造訓(xùn)練兩個(gè)embedding的數(shù)據(jù)集。

編輯切換為居中

添加圖片注釋，不超過(guò) 140 字（可選）

首先，針對(duì)feedback相關(guān)的正負(fù)樣本的構(gòu)建，我們會(huì)去統(tǒng)計(jì)用戶點(diǎn)擊視頻的reward，它是由用戶觀看時(shí)長(zhǎng)和互動(dòng)的綜合打分進(jìn)行定義的。對(duì)于conformity相關(guān)的正負(fù)樣本的構(gòu)建，我們使用like數(shù)進(jìn)行定義，如果正樣本的like數(shù)比較多那么就將其作為conformityembedding的訓(xùn)練集，如果一個(gè)正樣本的like數(shù)小于負(fù)樣本，但是它的reward更大，那么我們認(rèn)為用戶是基于興趣去點(diǎn)擊這個(gè)item的，從而得到interest embedding的訓(xùn)練集。我們使用like數(shù)的原因是源于我們認(rèn)為用戶是否喜歡一個(gè)視頻最直觀的感知就是點(diǎn)贊行為。

添加圖片注釋，不超過(guò) 140 字（可選）

在訓(xùn)練的時(shí)候，我們沿用了DICE的多任務(wù)訓(xùn)練范式，其中feedback loss作為主任務(wù)，同時(shí)使用如上所述定義的兩個(gè)數(shù)據(jù)集分別對(duì)conformity和interest embedding進(jìn)行訓(xùn)練。

添加圖片注釋，不超過(guò) 140 字（可選）

上圖展示了我們的實(shí)驗(yàn)效果，可以發(fā)現(xiàn)兩類embedding的可視化表明了它們之間有明顯的區(qū)分性。我們也對(duì)conformity embedding和流行度的相關(guān)性進(jìn)行了可視化，不同的顏色表示不同的流行度。我們也可以觀察到不同流行度的item，他們的embedding也具有一定的區(qū)分性。

3. 視頻完播率debias

添加圖片注釋，不超過(guò) 140 字（可選）

第三個(gè)工作是基于視頻完播率的debias。它的背景是源于我們?cè)诤芏鄻I(yè)務(wù)場(chǎng)景中，如單列短視頻場(chǎng)景，視頻是自動(dòng)播放的，不需要用戶點(diǎn)擊。這種情況下會(huì)導(dǎo)致我們很難去定義什么樣的播放時(shí)長(zhǎng)可以作為正樣本。比較直觀的方法是人為設(shè)定一個(gè)閾值，但是這存在著一定的bias，比如對(duì)于長(zhǎng)視頻而言這種方式偏差很大。因此，我們使用播放完成率來(lái)衡量用戶對(duì)于視頻的偏好。但事實(shí)上，基于完播率的這種做法天然對(duì)短視頻是友好的。如上圖右側(cè)所示，短視頻的完播率比長(zhǎng)視頻高出許多。所以這導(dǎo)致我們?nèi)ニ伎既绾味x正負(fù)樣本以及如何對(duì)不同長(zhǎng)度視頻的完播率進(jìn)行消偏。

編輯切換為居中

添加圖片注釋，不超過(guò) 140 字（可選）

首先，針對(duì)正負(fù)樣本的定義，我們需要設(shè)定一個(gè)對(duì)于各長(zhǎng)度視頻均適用的判別方式。此外，它需要有一定的判別性，并且具有一定的物理意義。上圖右側(cè)是我們對(duì)某長(zhǎng)度視頻的完播率與對(duì)應(yīng)播放日志數(shù)的關(guān)系圖。我們可以看到它是一個(gè)明顯的雙峰分布，也就是說(shuō)如果我們?cè)陔p峰中間選擇一個(gè)閾值對(duì)其進(jìn)行切分是可以很容易地將正負(fù)樣本區(qū)分開(kāi)的。我們?cè)趯?shí)際使用時(shí)統(tǒng)計(jì)了對(duì)應(yīng)視頻時(shí)長(zhǎng)下的平均完播率，使用在這個(gè)數(shù)值來(lái)作為切分閾值。

添加圖片注釋，不超過(guò) 140 字（可選）

第二個(gè)問(wèn)題是對(duì)不同長(zhǎng)度視頻的完播率進(jìn)行消偏。我們認(rèn)為bias的本質(zhì)是樣本分布不均勻，而消偏可以通過(guò)一些加權(quán)的方法使得treatment和control組的分布差異盡量減小。這里我們使用了經(jīng)典的IPW方法，具體來(lái)說(shuō)，我們使用不同視頻時(shí)長(zhǎng)的完播率來(lái)定義IPW的權(quán)重，將其加入損失函數(shù)進(jìn)行加權(quán)從而進(jìn)行debias。

添加圖片注釋，不超過(guò) 140 字（可選）

最終的實(shí)驗(yàn)結(jié)果表明消偏后播放視頻數(shù)以及完播數(shù)都有明顯的提升，另外不同長(zhǎng)度的視頻對(duì)應(yīng)的完播率也有上升。

04總結(jié)與思考

最后，我來(lái)總結(jié)一下我們的工作并提出一些個(gè)人的思考。

首先，我們?cè)诳焓滞扑]場(chǎng)景首次落地因果推斷。上述工作是因果推斷在快手推薦場(chǎng)景的一些成功的探索，它提供了一套糾偏框架落地的pipeline，除了傳統(tǒng)的item側(cè)消偏，我們對(duì)用戶維度的糾偏并也取得了一定收益。目前，因果推斷在推薦中的應(yīng)用目前較少，從學(xué)術(shù)界也很難拿到可以落地的方法，而在營(yíng)銷領(lǐng)域有比較多的落地應(yīng)用，這可能是因?yàn)樵跔I(yíng)銷領(lǐng)域的場(chǎng)景中，它們的treatment很好定義，但是在推薦場(chǎng)景下就很難被定義。此外，推薦中使用的評(píng)估方法和因果評(píng)估不一致。推薦系統(tǒng)的評(píng)估注重排序，例如AUC等指標(biāo)。

目前因果推斷在推薦系統(tǒng)的應(yīng)用存在以下三個(gè)問(wèn)題：

對(duì)于一些bias如流行度、曝光偏差，我們需要掌握好debias的度；現(xiàn)在的糾偏大多是大點(diǎn)進(jìn)行的，缺少一套完整的糾偏系統(tǒng)，目前已有的一些工作很難在工業(yè)界進(jìn)行落地；因果推斷對(duì)于解決信息繭房難題目前還很難去解決。我們現(xiàn)在的推薦系統(tǒng)更多還是迎合式的推薦，即我們會(huì)根據(jù)用戶的喜好推薦內(nèi)容，取悅用戶，進(jìn)而導(dǎo)致我們無(wú)法解決信息繭房的問(wèn)題。如果我們的推薦策略由迎合式轉(zhuǎn)變?yōu)橐龑?dǎo)式，即系統(tǒng)可以引導(dǎo)用戶對(duì)item進(jìn)行交互，那么我們可以在一定程度上解決信息繭房問(wèn)題。

05精彩問(wèn)答

Q：如何驗(yàn)證學(xué)習(xí)到的interest embedding和conformity embedding的準(zhǔn)確性？

A：我們是通過(guò)可視化來(lái)觀察embedding是否符合我們的預(yù)期。從之前展示的embedding可視化結(jié)果圖中我們可以發(fā)現(xiàn)，模型學(xué)習(xí)到的兩類embedding在二維空間上可以被明顯地區(qū)分，與此同時(shí)item的流行度與conformity embedding的相關(guān)性在流行度區(qū)間之間也具有區(qū)分性。

Q：Debias會(huì)不會(huì)在一定程度上對(duì)某些業(yè)務(wù)指標(biāo)產(chǎn)生負(fù)作用？

A：Bias不一定全是對(duì)模型有害的，例如流行度其實(shí)對(duì)推薦是有收益的。假如你糾偏過(guò)度，那么實(shí)際上你會(huì)降低系統(tǒng)的整體收益的；與之相反，如果你糾偏不夠的話有無(wú)法解決bias問(wèn)題。這就是為什么因果推斷很難在推薦中落地，因?yàn)檫@需要根據(jù)具體業(yè)務(wù)不斷地對(duì)糾偏程度進(jìn)行調(diào)整。

Q：點(diǎn)擊行為和like行為都是非常稀疏的，那么對(duì)于長(zhǎng)尾item應(yīng)該如何進(jìn)行糾偏？

A：我們針對(duì)流行度糾偏做了兩個(gè)工作。第一個(gè)工作是基于后門機(jī)制，我們可以看到它對(duì)于中長(zhǎng)尾item是有明顯收益的。而第二個(gè)工作是從輸出表征的角度進(jìn)行糾偏的。我們可以看到這兩個(gè)工作的出發(fā)點(diǎn)不一樣，第一個(gè)工作是在系統(tǒng)層面建模debias，而第二個(gè)工作是從交互中建模用戶不同的意圖。針對(duì)長(zhǎng)尾item的糾偏，我認(rèn)為第一個(gè)工作的方法會(huì)對(duì)長(zhǎng)尾item更友好并且更加可控。

今天的分享就到這里，謝謝大家。

在文末分享、點(diǎn)贊、在看，給個(gè)3連擊唄~

分享嘉賓：

添加圖片注釋，不超過(guò) 140 字（可選）

分享嘉賓：趙煒琪快手算法專家

編輯整理：吳祺堯

出品平臺(tái)：DataFunTalk

添加小助手鏈接：https://wpz.h5.xeknow.com/s/3udZfR

1.免費(fèi)資料領(lǐng)?。狐c(diǎn)擊上方鏈接添加小助手回復(fù)【大數(shù)據(jù)合集】免費(fèi)領(lǐng)取《大數(shù)據(jù)典藏版合集》

回復(fù)【算法合集】免費(fèi)領(lǐng)取《互聯(lián)網(wǎng)核心算法合集》

2.添加交流群：點(diǎn)擊點(diǎn)擊上方鏈接添加小助手回復(fù)【大數(shù)據(jù)交流群】加入“大數(shù)據(jù)交流群”

回復(fù)【算法交流群】加入“算法交流群”