非酒精性脂肪性肝病(non-alcoholic fatty liver disease,NAFLD)是一種與胰島素抵抗和遺傳密切相關的代謝性應激性肝損傷,疾病譜主要包括非酒精性脂肪肝、非酒精性脂肪性肝炎以及由它們進展所致的肝硬化和肝細胞癌[1-2]。此外,NAFLD還與多種代謝綜合征、2型糖尿病和結直腸腫瘤等多種慢性非傳染性疾病的高發有關[1-2]。最新的研究證據表明,全球NAFLD的患病率為25%[3],且仍在繼續上升,造成了沉重的疾病和經濟負擔[3-4]。特別需要注意的是,NAFLD已成為我國目前的第一大慢性肝病和健康體檢肝臟生物化學指標異常的首要原因[1]。因此,尋找有效的NAFLD防治措施已經顯得非常迫切。
飲食與生活方式干預被認為對于NAFLD的防治有著重要價值[1]。牛奶和咖啡是人們日常生活中最常見的兩種飲品,已經有大量的觀察性流行病學研究調查了牛奶或咖啡攝入對NAFLD發生風險的影響,并已經有多篇基于此類研究的相關Meta分析發表[5-8]。例如,Yuzbashian等[5]研究發現,牛奶攝入與患NAFLD的風險降低有關。Chen等[7]研究表明,越多的咖啡攝入與更低的NAFLD發生風險有關。考慮到觀察性研究易受混雜因素的影響[9-10],而基于此類研究的Meta分析非但不能消除混雜偏倚,甚至會因為方法學上的重大缺陷而導致更大的偏倚[11]。因此,有必要基于可靠的因果推斷方法來明確牛奶及咖啡攝入對NAFLD發生風險的因果效應[12]。孟德爾隨機化研究被認為是“天然的隨機對照試驗”[13],其主要原理是利用遺傳變異在配子形成過程中隨機分裂與組合的特點對研究人群進行模擬隨機分配[14]。其以與暴露因素相關的遺傳變異(例如,單核苷酸多態性,SNPs)作為工具變量,評價暴露與結局事件之間的因果關聯,不僅能夠有效地避免傳統觀察性流行病學研究中存在的混雜因素的干擾,同時還能夠排除可能發生的逆向因果問題[14-15]。近年來,這種方法已經受到國內外不同臨床學科領域研究者的廣泛關注[15-20]。本研究利用兩樣本孟德爾隨機化方法[14,21]分析牛奶、咖啡攝入與NAFLD間的因果關聯,以期為臨床實踐決策提供參考依據。
1 資料與方法
1.1 數據來源
本研究使用的所有數據來自于IEU OpenGWAS數據庫。牛奶(“ukb-b-2966”)、咖啡(“ukb-b-5237”)攝入相關的遺傳變異數據(SNPs)來源于英國生物樣本庫(UK BioBank),數據由Ben Elsworth在2018年發布,分別包含64 943和428 860名歐洲人群樣本,均包含9 851 867個SNPs。結局事件NAFLD(“finn-b-NAFLD”)的全基因組關聯研究數據于2021年發表,包含218 792名歐洲人群樣本(病例組894人,對照組217 898人),共包含16 380 466個SNPs。
1.2 工具變量的篩選方法
為了調查牛奶、咖啡攝入與NAFLD間的因果關聯,本研究中篩選作為工具變量的SNPs具體方法如下:① SNPs與牛奶、咖啡攝入之間應該高度相關,故將顯著性閾值設置為P<5×10?8,由于牛奶攝入在此閾值下未能篩選出SNPs,故將其顯著性閾值調整為P<5×10?6[21];② 通過設置分析參數r2=0.001,kb=10 000以保證不同SNPs之間獨立,從而避免由于連鎖不平衡導致的偏倚[15];③ 利用牛奶、咖啡攝入的全基因組關聯研究數據集SNPs的β和SE值計算每個SNP的F統計量[15,22],即F=β2/SE2。基于F統計量評價弱工具變量,以F=10為界值,將F<10的弱工具變量SNPs從分析中排除。
1.3 統計分析
本研究利用逆方差加權法(inverse variance weighting,IVW)和MR-Egger法估計牛奶、咖啡攝入對NAFLD發生風險的因果效應。IVW法的特點是擬合時使用的權重為結局方差的倒數,回歸時不考慮截距項,是兩樣本孟德爾隨機化研究的標準估計方法[23],本研究中將其作為主要分析方法。當不滿足多效性假定,且工具變量與結局的直接效應獨立于工具變量與暴露因素的關聯效應時,MR-Egger法可計算暴露對結局的因果效應[17],本研究將其作為次要分析方法。通過MR-PRESSO分析判斷是否存在異常值,利用MR-Egger回歸的截距項判斷是否存在基因水平多效性[24],使用Cochran’s Q檢驗評估SNPs間的異質性。此外,采用“留一法”逐一剔除單個SNP進行敏感性分析以評價結果的穩健性。使用β值和比值比(odds ratio,OR)及其95%可信區間(confidence interval,CI)呈現牛奶或咖啡攝入與NAFLD間的因果關聯。基于R 4.2.3軟件,在R Studio中調用“TwoSampleMR”(版本:0.5.7)[25]和“MRPRESSO”(版本:1.0)[26]包進行統計分析,并對主要分析結果進行可視化。設定P<0.05為差異有統計學意義。
2 結果
2.1 牛奶攝入與NAFLD的因果關聯
牛奶攝入與NAFLD因果關聯分析中共納入20個有效的SNPs(表1),其F值范圍為20.937~27.661,均為強工具變量。IVW法分析結果顯示,牛奶攝入與NAFLD間不存在因果關聯(表2和附件圖1、圖2)。MR-Egger法同樣提示牛奶攝入與NAFLD間不存在因果關聯(表2)。異質性分析IVW檢驗(Q=11.386,P=0.910)和MR-Egger檢驗(Q=10.745,P=0.905)均未發現明顯的異質性。MR-PRESSO分析沒有發現離群的SNPs,MR-Egger回歸分析結果表明無水平多效性的證據(截距為0.029,P=0.434)。“留一法”分析結果表明,沒有單個SNP能明顯影響總體的效應估計。


2.2 咖啡攝入與NAFLD的因果關聯
咖啡攝入與NAFLD因果關聯分析中共納入38個有效的SNPs(表1),其F值范圍為30.101~646.735,均為強工具變量。IVW法分析結果顯示,咖啡攝入與NAFLD間不存在因果關聯(表2和附件圖3、圖4)。MR-Egger法同樣提示咖啡攝入與NAFLD間不存在因果關聯(表2)。異質性分析IVW檢驗(Q=46.015,P=0.147)和MR-Egger檢驗(Q=46.014,P=0.122)均未發現明顯的異質性。MR-PRESSO分析沒有發現離群的SNPs,MR-Egger回歸分析結果表明無水平多效性的證據(截距為?0.001,P=0.975)。“留一法”分析結果表明,“rs1421085”和“rs1057868”對總體效應估計有一定的影響,但總體結果仍相對穩定。

3 討論
既往證據[5,27]提示乳制品可以通過改善血液中不同脂質的組合(例如,降低甘油三酯與總膽固醇,提高高密度脂蛋白水平)改善肝臟脂肪堆積。此外,由蛋白代謝產生的活性肽能夠增加抑胃肽和胰高血糖素樣肽-1的活性,進而可能通過上調靶向mTOR途徑的活性,促進胰島細胞釋放胰島素,從而改善肝臟的脂質代謝。也有證據[28]提示咖啡攝入可以抑制NAFLD發生發展中的重要病理過程(例如,炎癥、肝細胞死亡和纖維化)。此外,NAFLD的發生與久坐有關,而咖啡可能通過中樞興奮作用促使人們增加體力活動[28]。近期發表的多篇基于觀察性研究的Meta分析也發現牛奶、咖啡攝入與低NAFLD發生風險相關[5-8]。
然而,鑒于觀察性流行病學研究結果可能會受到的多種混雜因素的影響[10],為了明確牛奶與咖啡攝入與NAFLD間的因果關聯,本研究基于公開可用的全基因組關聯研究數據,分別選取與牛奶攝入和咖啡攝入高度相關的20個和38個SNPs作為工具變量,基于兩樣本孟德爾隨機化方法分別調查了牛奶和咖啡攝入與NAFLD間的因果關聯,不同分析方法的結果均一致表明牛奶或咖啡攝入對NAFLD的發生風險沒有因果效應,這與既往的流行病學研究證據相反。產生這種分歧的主要原因可能包括以下兩點:首先,動物模型等臨床前研究對象與人體本身存在著巨大差異,這常導致有統計學意義的臨床前研究結果未能成功在在人體上復現[29];其次,傳統的觀察性研究容易受到混雜和反向因果的影響,導致其無法得出可靠的結果,同時Meta分析并不能消除納入的觀察性研究的潛在混雜和偏倚,反而會夸大估計結果[10-11]。為了確保研究結果的可靠性,我們基于F統計量評價了是否存在弱工具變量,設定所有納入分析的SNPs的F值均大于10,保證了不存在弱工具變量偏倚;此外基于MR-Egeer回歸分析評價了SNPs多效性,發現分析結果不存在基因水平多效性偏倚。與此同時,異質性分析均未發現明顯的異質性,MR-PRESSO分析沒有發現離群值,“留一法”敏感性分析未發現明顯影響總體效應估計的單個SNP,以上分析均表明我們的研究結果穩健和可靠。
與其他研究類似[15,30-31],本研究具有以下局限性:① 納入人群均來自歐洲國家,人群的單一性限制了結果的外推性[5];② 研究使用的數據均為匯總結果[31],無法獲取患者的年齡、性別、體力活動和疾病嚴重程度等重要信息進行進一步的分析;③ 研究結論僅基于統計學結果,無法進一步探討暴露因素與NAFLD之間的生物學機制;④ 僅分別探討了牛奶、咖啡攝入與NAFLD發生風險的因果關聯,未能探討同時攝入二者對NAFLD的潛在影響。
綜上所述,本研究不支持牛奶或咖啡攝入與NAFLD的發生風險之間存在因果關聯。
聲明 所有作者均聲明無利益沖突。
非酒精性脂肪性肝病(non-alcoholic fatty liver disease,NAFLD)是一種與胰島素抵抗和遺傳密切相關的代謝性應激性肝損傷,疾病譜主要包括非酒精性脂肪肝、非酒精性脂肪性肝炎以及由它們進展所致的肝硬化和肝細胞癌[1-2]。此外,NAFLD還與多種代謝綜合征、2型糖尿病和結直腸腫瘤等多種慢性非傳染性疾病的高發有關[1-2]。最新的研究證據表明,全球NAFLD的患病率為25%[3],且仍在繼續上升,造成了沉重的疾病和經濟負擔[3-4]。特別需要注意的是,NAFLD已成為我國目前的第一大慢性肝病和健康體檢肝臟生物化學指標異常的首要原因[1]。因此,尋找有效的NAFLD防治措施已經顯得非常迫切。
飲食與生活方式干預被認為對于NAFLD的防治有著重要價值[1]。牛奶和咖啡是人們日常生活中最常見的兩種飲品,已經有大量的觀察性流行病學研究調查了牛奶或咖啡攝入對NAFLD發生風險的影響,并已經有多篇基于此類研究的相關Meta分析發表[5-8]。例如,Yuzbashian等[5]研究發現,牛奶攝入與患NAFLD的風險降低有關。Chen等[7]研究表明,越多的咖啡攝入與更低的NAFLD發生風險有關。考慮到觀察性研究易受混雜因素的影響[9-10],而基于此類研究的Meta分析非但不能消除混雜偏倚,甚至會因為方法學上的重大缺陷而導致更大的偏倚[11]。因此,有必要基于可靠的因果推斷方法來明確牛奶及咖啡攝入對NAFLD發生風險的因果效應[12]。孟德爾隨機化研究被認為是“天然的隨機對照試驗”[13],其主要原理是利用遺傳變異在配子形成過程中隨機分裂與組合的特點對研究人群進行模擬隨機分配[14]。其以與暴露因素相關的遺傳變異(例如,單核苷酸多態性,SNPs)作為工具變量,評價暴露與結局事件之間的因果關聯,不僅能夠有效地避免傳統觀察性流行病學研究中存在的混雜因素的干擾,同時還能夠排除可能發生的逆向因果問題[14-15]。近年來,這種方法已經受到國內外不同臨床學科領域研究者的廣泛關注[15-20]。本研究利用兩樣本孟德爾隨機化方法[14,21]分析牛奶、咖啡攝入與NAFLD間的因果關聯,以期為臨床實踐決策提供參考依據。
1 資料與方法
1.1 數據來源
本研究使用的所有數據來自于IEU OpenGWAS數據庫。牛奶(“ukb-b-2966”)、咖啡(“ukb-b-5237”)攝入相關的遺傳變異數據(SNPs)來源于英國生物樣本庫(UK BioBank),數據由Ben Elsworth在2018年發布,分別包含64 943和428 860名歐洲人群樣本,均包含9 851 867個SNPs。結局事件NAFLD(“finn-b-NAFLD”)的全基因組關聯研究數據于2021年發表,包含218 792名歐洲人群樣本(病例組894人,對照組217 898人),共包含16 380 466個SNPs。
1.2 工具變量的篩選方法
為了調查牛奶、咖啡攝入與NAFLD間的因果關聯,本研究中篩選作為工具變量的SNPs具體方法如下:① SNPs與牛奶、咖啡攝入之間應該高度相關,故將顯著性閾值設置為P<5×10?8,由于牛奶攝入在此閾值下未能篩選出SNPs,故將其顯著性閾值調整為P<5×10?6[21];② 通過設置分析參數r2=0.001,kb=10 000以保證不同SNPs之間獨立,從而避免由于連鎖不平衡導致的偏倚[15];③ 利用牛奶、咖啡攝入的全基因組關聯研究數據集SNPs的β和SE值計算每個SNP的F統計量[15,22],即F=β2/SE2。基于F統計量評價弱工具變量,以F=10為界值,將F<10的弱工具變量SNPs從分析中排除。
1.3 統計分析
本研究利用逆方差加權法(inverse variance weighting,IVW)和MR-Egger法估計牛奶、咖啡攝入對NAFLD發生風險的因果效應。IVW法的特點是擬合時使用的權重為結局方差的倒數,回歸時不考慮截距項,是兩樣本孟德爾隨機化研究的標準估計方法[23],本研究中將其作為主要分析方法。當不滿足多效性假定,且工具變量與結局的直接效應獨立于工具變量與暴露因素的關聯效應時,MR-Egger法可計算暴露對結局的因果效應[17],本研究將其作為次要分析方法。通過MR-PRESSO分析判斷是否存在異常值,利用MR-Egger回歸的截距項判斷是否存在基因水平多效性[24],使用Cochran’s Q檢驗評估SNPs間的異質性。此外,采用“留一法”逐一剔除單個SNP進行敏感性分析以評價結果的穩健性。使用β值和比值比(odds ratio,OR)及其95%可信區間(confidence interval,CI)呈現牛奶或咖啡攝入與NAFLD間的因果關聯。基于R 4.2.3軟件,在R Studio中調用“TwoSampleMR”(版本:0.5.7)[25]和“MRPRESSO”(版本:1.0)[26]包進行統計分析,并對主要分析結果進行可視化。設定P<0.05為差異有統計學意義。
2 結果
2.1 牛奶攝入與NAFLD的因果關聯
牛奶攝入與NAFLD因果關聯分析中共納入20個有效的SNPs(表1),其F值范圍為20.937~27.661,均為強工具變量。IVW法分析結果顯示,牛奶攝入與NAFLD間不存在因果關聯(表2和附件圖1、圖2)。MR-Egger法同樣提示牛奶攝入與NAFLD間不存在因果關聯(表2)。異質性分析IVW檢驗(Q=11.386,P=0.910)和MR-Egger檢驗(Q=10.745,P=0.905)均未發現明顯的異質性。MR-PRESSO分析沒有發現離群的SNPs,MR-Egger回歸分析結果表明無水平多效性的證據(截距為0.029,P=0.434)。“留一法”分析結果表明,沒有單個SNP能明顯影響總體的效應估計。


2.2 咖啡攝入與NAFLD的因果關聯
咖啡攝入與NAFLD因果關聯分析中共納入38個有效的SNPs(表1),其F值范圍為30.101~646.735,均為強工具變量。IVW法分析結果顯示,咖啡攝入與NAFLD間不存在因果關聯(表2和附件圖3、圖4)。MR-Egger法同樣提示咖啡攝入與NAFLD間不存在因果關聯(表2)。異質性分析IVW檢驗(Q=46.015,P=0.147)和MR-Egger檢驗(Q=46.014,P=0.122)均未發現明顯的異質性。MR-PRESSO分析沒有發現離群的SNPs,MR-Egger回歸分析結果表明無水平多效性的證據(截距為?0.001,P=0.975)。“留一法”分析結果表明,“rs1421085”和“rs1057868”對總體效應估計有一定的影響,但總體結果仍相對穩定。

3 討論
既往證據[5,27]提示乳制品可以通過改善血液中不同脂質的組合(例如,降低甘油三酯與總膽固醇,提高高密度脂蛋白水平)改善肝臟脂肪堆積。此外,由蛋白代謝產生的活性肽能夠增加抑胃肽和胰高血糖素樣肽-1的活性,進而可能通過上調靶向mTOR途徑的活性,促進胰島細胞釋放胰島素,從而改善肝臟的脂質代謝。也有證據[28]提示咖啡攝入可以抑制NAFLD發生發展中的重要病理過程(例如,炎癥、肝細胞死亡和纖維化)。此外,NAFLD的發生與久坐有關,而咖啡可能通過中樞興奮作用促使人們增加體力活動[28]。近期發表的多篇基于觀察性研究的Meta分析也發現牛奶、咖啡攝入與低NAFLD發生風險相關[5-8]。
然而,鑒于觀察性流行病學研究結果可能會受到的多種混雜因素的影響[10],為了明確牛奶與咖啡攝入與NAFLD間的因果關聯,本研究基于公開可用的全基因組關聯研究數據,分別選取與牛奶攝入和咖啡攝入高度相關的20個和38個SNPs作為工具變量,基于兩樣本孟德爾隨機化方法分別調查了牛奶和咖啡攝入與NAFLD間的因果關聯,不同分析方法的結果均一致表明牛奶或咖啡攝入對NAFLD的發生風險沒有因果效應,這與既往的流行病學研究證據相反。產生這種分歧的主要原因可能包括以下兩點:首先,動物模型等臨床前研究對象與人體本身存在著巨大差異,這常導致有統計學意義的臨床前研究結果未能成功在在人體上復現[29];其次,傳統的觀察性研究容易受到混雜和反向因果的影響,導致其無法得出可靠的結果,同時Meta分析并不能消除納入的觀察性研究的潛在混雜和偏倚,反而會夸大估計結果[10-11]。為了確保研究結果的可靠性,我們基于F統計量評價了是否存在弱工具變量,設定所有納入分析的SNPs的F值均大于10,保證了不存在弱工具變量偏倚;此外基于MR-Egeer回歸分析評價了SNPs多效性,發現分析結果不存在基因水平多效性偏倚。與此同時,異質性分析均未發現明顯的異質性,MR-PRESSO分析沒有發現離群值,“留一法”敏感性分析未發現明顯影響總體效應估計的單個SNP,以上分析均表明我們的研究結果穩健和可靠。
與其他研究類似[15,30-31],本研究具有以下局限性:① 納入人群均來自歐洲國家,人群的單一性限制了結果的外推性[5];② 研究使用的數據均為匯總結果[31],無法獲取患者的年齡、性別、體力活動和疾病嚴重程度等重要信息進行進一步的分析;③ 研究結論僅基于統計學結果,無法進一步探討暴露因素與NAFLD之間的生物學機制;④ 僅分別探討了牛奶、咖啡攝入與NAFLD發生風險的因果關聯,未能探討同時攝入二者對NAFLD的潛在影響。
綜上所述,本研究不支持牛奶或咖啡攝入與NAFLD的發生風險之間存在因果關聯。
聲明 所有作者均聲明無利益沖突。