結構性機甲旋風土豆

字數:3003   加入書籤

A+A-


    覺醒失敗後我回山裏種田!
    11 什麽是因果推斷
    因果推斷用於衡量一個行為的價值。即判斷一個“因”能導致多少“果”。
    比如說我今晚複習數學,明天數學考試能提升多少分。這是一個很難回答的問題,因為我無法同時知道不複習和複習後,我分別能考多少分,當前時刻我隻能做一種選擇並得到一個結果,另一個選擇的結果是永遠不可知的,這在因果推斷裏叫做反事實(nterfactual)。
    因果推斷往往會衍生出一個研究方向,因果發現。即判斷一個行為是否和一個事件互為因果(推斷是判斷帶來了多少果,發現是判斷是否為因果)。比如冰棍賣的多和電費高往往同時出現,但他們不是因果關係,因為這種現象主要是天氣熱帶來的。
    12 為什麽要研究因果
    121 因果性 ≠ 相關性[2]
    設想一個場景大數據發現,穿鞋睡覺的人第二天往往會頭疼。因此我們可以得出穿鞋睡覺和頭疼相關,但這顯然是反直覺的,客觀規律告訴我們穿鞋睡覺不應該導致頭疼。那但數據上為什麽會呈現出這個現象呢?
    原來是穿鞋睡覺的人大多都喝酒了,所以,真正導致頭疼的其實是“隱藏”變量是否喝酒。(這在因果推斷裏叫混淆變量,nfounder)
    深入思考一下,我們為什麽會得出”因為穿鞋睡覺所以頭疼“的錯誤結論,那是因為我們隱含的觀察到“不穿鞋睡覺不頭疼“,兩組數據對比下得出結論。但是這個結論錯誤的關鍵是,兩個集合裏喝酒的人分布是不一致的,真實的因果是喝酒所以頭疼,因此這裏會有數學上的“辛普森悖論”。
    因此,這個場景我們隻能說穿鞋睡覺和頭疼有相關性,但不能說他們互為因果。即相關 ≠ 因果
    122 因果推斷 > 相關性分析
    為了對比因果推斷和其他的機器學習問題,學術界提出了三層的因果之梯[3][4]
    相關(asciation,觀察)解釋y|x,即已知x的條件下,y會怎麽樣。這是大部分場景下機器學習所麵對的問題,如上一節所述,相關 ≠ 因果,故常規的機器學習方法無法處理因果問題。以上麵的case為例,假設x  穿鞋睡覺,y頭疼,則該層級會看到兩者相關性很高的“假象”。
    幹預(tervention,行動)解釋y|dox,z,即做某個行為x後,y是怎麽樣的。比如上麵的例子,幹預穿鞋睡覺的行為x,單獨分析穿鞋睡覺(即dox  1)和不穿鞋睡覺dox  0,在不同喝酒狀態下的頭疼(y)分布。這個層麵可以分析出穿鞋睡覺對頭疼可能無影響。但無法判斷每個人穿鞋睡覺會不會導致頭疼,因為觀察不到。
    反事實(unterfactual,想象)解釋行為x對結果y的影響,即我做了x和不做x,對結果y的影響程度。這是因果推斷要解決的問題,比如上麵的例子,我不僅看到每個人不穿鞋睡覺頭不痛的現象,還能反事實的推斷出每個人穿鞋睡覺頭不疼,進而得出穿鞋睡覺對頭疼的具體影響程度。
    上麵的解釋說明,相關 < 幹預 < 反事實(即解決反事實問題的方法可以處理幹預和相關問題,反之不成立)。傳統的機器學習方法是處理相關性問題的,而因果推斷關注反事實層。因此因果推斷能解釋的事情,將比傳統的機器學習方法更“高級”,也更貼合日常的需要
    2 基礎理論
    21 業界流派
    因果推斷是根據一個結果發生的條件對因果關係得出結論的過程。存在兩種研究方法[5]
    實驗性研究通過大量隨機對照實驗(rct)得出結論。因果推斷的難點在於反事實,因此對照實驗需要“足夠隨機”。對上麵的例子而言,我們需要在實驗組和對照組中確保喝酒的比例是均等的。這是代價昂貴且費時費力的。
    觀測性研究對於已有的觀測數據,通過建模進行因果關係的研究。這種方式對數學的要求較高且存在準確率的問題,但可操作性強。
    顯然,實驗性研究是理論上最完美的方式,但實際中我們不可能窮舉類似“喝酒狀態”這種影響因和果的因素,隨機對照試驗的成本是極大的,僅存在理論的可能。業界的研究重點是,如何優化觀測性研究的方法,使其準確度逐步逼近實驗性研究。
    當前,觀測性研究存在兩大流派,分別是earl創立的結構因果圖模型(s)和rub創建的潛在結果模型(r)。[6][7]
    22 變量定義與說明
    為了便於後續介紹,這裏先對因果推斷的常用變量做一個說明。黑色粗體為重要定義,treatnt effect是衡量幹預效果的指標,也是我們期望優化的目標以及模型的輸出[5][7][8][9]
    23 因果分析流程
    介紹推斷的具體方法之前,我們先說明因果分析的流程。如下圖,主要有兩個步驟[1][10]
    identification(因果識別)基於觀測數據,輸出不同幹預下的統計分布(即“原因因子”狀態不同時結果因子的分布),以分布的ga作為衡量因果關係的依據。s模型主要解決這部分問題(並不是說s不能做後續的推斷)
    estia作為效果大小的衡量,這個過程叫estiation。r模型重點在這部分
    想減肥想減肥好吃,防護服減減肥進去刺骨寒風