隨機(jī)矩陣?yán)碚撛诟伟┗蚬δ苣K識別中的應(yīng)用_第1頁
隨機(jī)矩陣?yán)碚撛诟伟┗蚬δ苣K識別中的應(yīng)用_第2頁
隨機(jī)矩陣?yán)碚撛诟伟┗蚬δ苣K識別中的應(yīng)用_第3頁
隨機(jī)矩陣?yán)碚撛诟伟┗蚬δ苣K識別中的應(yīng)用_第4頁
隨機(jī)矩陣?yán)碚撛诟伟┗蚬δ苣K識別中的應(yīng)用_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、生物物理學(xué)報第二十五卷第三期二九年六月ACTA BIOPHYSICA SINICA Vol.25 No.3Jun. 2009隨機(jī)矩陣?yán)碚撛诟伟┗蚬δ苣K識別中的應(yīng)用顏平蘭,李蓉,陳健,李金,張凱旺,鐘建新(湘潭大學(xué)材料與光電物理學(xué)院, 湘潭 410005)摘要: 采用隨機(jī)矩陣?yán)碚摲椒ㄑ芯苛烁伟┑幕虮磉_(dá)網(wǎng)絡(luò)。 通過標(biāo)準(zhǔn)誤差分析, 得到了從富含噪聲的肝癌基 因網(wǎng)絡(luò)中分離出真實(shí)肝癌基因網(wǎng)絡(luò)的、 去躁最充分的關(guān)聯(lián)系數(shù), 分析了由此獲得的基因表達(dá)網(wǎng)絡(luò)的 13 個基因功 能模塊, 發(fā)現(xiàn)這些模塊與肝癌的產(chǎn)生和發(fā)展有密切關(guān)系。 基于隨機(jī)矩陣?yán)碚摰姆椒朔艘酝K識別方法帶有 主觀因素且不能去除噪聲因子的

2、缺陷, 是一種有效去除隨機(jī)噪聲、 識別基因模塊、 簡化基因網(wǎng)絡(luò)的方法。 由于基 因數(shù)目的眾多及細(xì)胞生物過程的復(fù)雜性, 從整體的角度系統(tǒng)研究 HCC 基因表達(dá)譜, 對理解 HCC 分子機(jī)制和探索 新的治療方法有重要的現(xiàn)實(shí)意義。關(guān)鍵詞: 基因功能模塊; 肝癌; 隨機(jī)矩陣?yán)碚?中圖分類號: G633.7, Q6, R730引言肝癌是世界上最常見的惡性腫瘤之一, 平均每 年大約 1 百萬人死于肝癌1。 亞洲和非洲為肝癌的 高發(fā)區(qū), 據(jù)報道, 在過去 20 年, 許多國家, 例如 美國和英國, 肝癌的發(fā)生率一直在逐步增加2。 因 此, 肝癌是嚴(yán)重威脅人們健康的、 急待解決的國際 問題。 大約 90 %的

3、肝癌在慢性炎癥 (慢性肝炎或 肝硬化) 的基礎(chǔ)上發(fā)生。 很多的致肝癌因子已經(jīng)被 識別, 如 HBV 感染、 HCV 感染、 酒精中毒、 化學(xué) 致癌物 (黃曲霉素 B1)、 鐵離子過量等3。研究發(fā)現(xiàn), 癌癥發(fā)生的本質(zhì)是由各種原因引起 的基因表達(dá)的異常, 因此基因研究備受關(guān)注 。 起 初, 由于技術(shù)的限制, 研究主要集中在單個基因。 人們對肝癌單個基因變化進(jìn)行了大量的研究, 也獲 得了一些成功, 如發(fā)現(xiàn) P53、 beta-catenin、 Axin 基 因突變能導(dǎo)致肝癌 4, 發(fā)現(xiàn)轉(zhuǎn)變增長因子 (TGF-)、 轉(zhuǎn)變增長因子 (TGF-) 和細(xì)胞周期控 制基因 cylin D1、 cylin A、

4、 P16 等3可能與肝癌的 發(fā)生和發(fā)展有關(guān)。 然而, 這些基因在肝癌中的突變 頻率較低, 如 P53 只在 10 %20 %的肝癌中出現(xiàn) 突變, beta-catenin、 Axin 在肝癌中的突變率小于 30 %5。 所以, 這些基因改變沒有精確反應(yīng)癌癥細(xì) 胞的生物學(xué)本性以及單個肝癌病人的臨床特性。 與 其他癌癥一樣, 肝癌具有多種多樣的臨床病理和生 物表現(xiàn)型, 如分化級別、 增生比率 、 血管擴(kuò)散能力、 轉(zhuǎn)移潛能、 對化學(xué)制劑的敏感性等等。 因此, 分析大量肝癌基因, 對于闡明肝癌疾病機(jī)制以及發(fā) 現(xiàn)新穎的藥物耙標(biāo)分子是必需的。CDNA微陣列技術(shù)的出現(xiàn), 為同時平行分析成 千上萬的基因提供了

5、條件, 開辟了大規(guī)模基因網(wǎng)絡(luò) 研究的新時代, 已被廣泛應(yīng)用于癌癥研究, 如前列 腺癌6、 乳腺癌7、 卵巢癌8等。 在肝癌研究方面也 取得了很大的進(jìn)步, 如用監(jiān)督和無監(jiān)督學(xué)習(xí)的方法 識別在肝癌樣本與正常樣本中表達(dá)特征不同5,9的基 因, 識別在 HBV 及 HCV 有關(guān)的肝癌中表達(dá)特征 不同6,10的基因, 識別與肝癌生存時間11,12、 發(fā)展級 別9、 轉(zhuǎn)移11,13和復(fù)發(fā)14等有關(guān)的基因。 但是傳統(tǒng)的 方法對肝癌微陣列數(shù)據(jù)的分析, 主要集中在與參考 樣本表達(dá)顯著不同的單個基因, 即與參考樣本相比 表達(dá)顯著上調(diào)或顯著下調(diào)的基因, 找出了大量與肝 癌相關(guān)的基因, 對這些大量的基因進(jìn)行相對獨(dú)立的

6、 分析, 不能揭示肝癌的病理機(jī)制, 也沒有提出有效 的標(biāo)靶和治療手段。由于臨床特征的多樣性和基因數(shù)目的眾多, 而 且以前的方法沒有整體、 系統(tǒng)地研究肝癌, 忽略了 基因表達(dá)網(wǎng)絡(luò)里面一些重要的生物信息, 例如, 一收稿日期: 2009-01-23基金項(xiàng)目: 國家自然科學(xué)基金項(xiàng)目(30570432) 通訊作者: 鐘建新, 電話: (0732)8293749, E-mail: jxzhong第 3 期隨機(jī)矩陣?yán)碚撛诟伟┗蚬δ苣K識別中的應(yīng)用193個基因改變怎樣影響其他基因的變化等。 所以, 肝 癌的分子機(jī)制一直沒有被很好地理解, 迫切需要早 期精確診斷和有效治療肝癌的分子標(biāo)志 。 細(xì)胞系 統(tǒng), 像

7、許多其他工程合成系統(tǒng)一樣, 由無數(shù)功能多 樣的元素組成, 是模塊化的。 細(xì)胞功能的執(zhí)行是由 許多模塊共同作用的結(jié)果, 這些模塊由生理或功能 相似的基因組成, 在細(xì)胞的特殊的條件和時期表 達(dá)。 相同基因功能模塊內(nèi)的基因表達(dá)譜相似。 當(dāng)基 因功能模塊受到影響時, 疾病就可能開始。 微陣列 數(shù)據(jù)是許多基因表達(dá)的結(jié)果, 包括了基因之間的相 互作用和功能模塊的信息。 因此, 分析基因表達(dá)網(wǎng) 絡(luò)中的基因模塊將從微陣列實(shí)驗(yàn)獲取更多的信息, 對理解疾病的機(jī)制及發(fā)展新的生物學(xué)知識很有意 義。 所以, 從大規(guī)模的基因表達(dá)譜中識別基因功能 模塊具有很重要的意義。本文采用隨機(jī) 矩 陣 理 論 ( random mat

8、rix theory, RMT) 方法, 研究受 HBV 及 HCV 感染的 肝癌基因表達(dá)網(wǎng)絡(luò), 發(fā)現(xiàn)當(dāng)逐步移除較小的關(guān)聯(lián)系 數(shù) , 關(guān) 聯(lián)矩陣的本征值步長分布由 P (s) Wigner-Dyson 分布逐漸過渡到 Poisson 分布。 根據(jù) P(s)相對于 Wigner-Dyson 分布和 Poisson 分布的標(biāo) 準(zhǔn)偏差, 得出轉(zhuǎn)變點(diǎn)在關(guān)聯(lián)系數(shù)為 0.66 處。 在轉(zhuǎn) 變點(diǎn), 基因功能模塊自動呈現(xiàn), 但是此時的關(guān)聯(lián)網(wǎng) 絡(luò)不僅包含了真實(shí)的生物信息也包含了一些隨機(jī)因素 。 通 過 做 P (s) 與 Wigner-Dyson 分 布 及 P (s) Poisson 分布的標(biāo)準(zhǔn)誤差比值曲線,

9、 得出比值最大 點(diǎn), 即去躁最充分的關(guān)聯(lián)系數(shù)為 0.78。 在點(diǎn) 0.78, 關(guān)聯(lián)矩陣充分地去掉了隨機(jī)因素, 清晰地反映了體 系最重要的模塊信息。 我們分析了由此獲得的基因 表達(dá)網(wǎng)絡(luò)的 13 個基因功能模塊, 發(fā)現(xiàn)與細(xì)胞的增 殖和分化、 免疫響應(yīng)、 細(xì)胞轉(zhuǎn)移、 脂類代謝、 酒精 代謝等功能有關(guān)的基因模塊的生物過程異常與肝癌 的產(chǎn)生和發(fā)展有密切的關(guān)系。 傳統(tǒng)的藥物耙標(biāo)針對 單個突變的基因, 效果不佳, 如果能針對某個基因 功能模塊治療, 方法更簡單, 效果更佳。1 方 法由于細(xì)胞是由很多不同功能單元相互作用而組 成的復(fù)雜體, 而且 cDNA 微陣列數(shù)據(jù)包含了大量 的、 復(fù)雜的生物信息, 所以從基

10、因功能模塊來理解 基因表達(dá)網(wǎng)絡(luò)具有重要的意義。 迄今為止, 人們提 出了很多識別基因功能模塊的方法, 如布爾網(wǎng)絡(luò)方 法、 微分方程網(wǎng)絡(luò)方法、 貝葉斯網(wǎng)絡(luò)方法和聚類方法等15, 但是這些方法都存在一些缺陷。 如布爾網(wǎng) 絡(luò)16中每一個基因的狀態(tài)用 0/1 來表示, 但是真實(shí) 的基因表達(dá)并不是有或無這兩種簡單狀態(tài), 所以該 方法不能反映各個基因表達(dá)的強(qiáng)度差異, 也沒有考 慮基因作用大小的區(qū)別等; 而且在使用布爾網(wǎng)絡(luò)模 型的算法中, 每個基因的輸入結(jié)點(diǎn)數(shù)量 k 必須人為 指定, 具有主觀性。 微分方程網(wǎng)絡(luò)方法17是在一組 非線性微分方程的基礎(chǔ)上對基因網(wǎng)絡(luò)建模, 但是該 方法計算量大, 且由于訓(xùn)練數(shù)據(jù)不

11、足, 目前在微分 方程中只能使用一階項(xiàng)。 貝葉斯網(wǎng)絡(luò)18是一種表示 多變量聯(lián)合概率分布的圖模型。 該方法也存在局限 性, 如模型并不能較好地處理基因調(diào)控的反饋和時 間延遲問題。 聚類方法是目前采用較為普遍的方 法, 有分層聚類和直接聚類, 分層聚類法19用樹狀 結(jié)構(gòu)顯示基因間功能相似性, 歸入某個聚類的基因 由基因之間的距離來決定, 但是無法反映基因網(wǎng)絡(luò) 的全局結(jié), 且產(chǎn)生的樹狀結(jié)果非常復(fù)雜, 目前尚無 普遍接受的裁剪方法來識別基因模塊; 用直接聚類 方法來劃分基因, 如 k 均值法20、 自組織特征映射 法21等可以克服分層聚類法存在的缺點(diǎn), 但是這些 算法的聚類數(shù)量一般要依賴特定的輸入?yún)?shù)

12、, 而這 些參數(shù)的選擇將會影響聚類的結(jié)果。 總的來說上述 各種方法主要存在以下兩個缺陷: 第一, 包含了若 干個需要人為干涉的步驟, 其結(jié)果在一定程度上依 賴于人們的主觀經(jīng)驗(yàn)和知識, 破壞了結(jié)果的客觀真 實(shí)性。 第二, 包含了一些隨機(jī)因素, 如基因表達(dá)水 平隨實(shí)驗(yàn)時間和樣本條件的變化而變化、 有限的實(shí) 驗(yàn)樣本導(dǎo)致的測量噪音等。 這些隨機(jī)因素的引入會 導(dǎo)致一些虛假的信息, 干擾真實(shí)的信息, 從而影響 結(jié)果的正確性和真實(shí)性。 RMT 方法可以自動、 客 觀地分析基因表達(dá)網(wǎng)絡(luò), 消除了人為的不確定因素 和人為的主觀因素。 而且, 可以通過設(shè)置去噪因子 q 逐步將隨機(jī)因素消除。 所以 RMT 方法克服

13、了以 前方法的困難, 是一種新的、 有效的研究基因表達(dá) 網(wǎng)絡(luò)的方法。RMT 最早于 1960s 由 Wigner 和 Dyson 提 出 , 用來研究復(fù)雜原子核光譜, 已經(jīng)被成功應(yīng)用于許多 復(fù)雜體系, 如: 大原子的光譜特性、 無序系統(tǒng)的金 屬絕緣轉(zhuǎn)變、 準(zhǔn)周期體系的光譜特性、 混沌體系、 大腦響應(yīng)、 股票市場等22, 后來 Luo22等首次應(yīng)用 RMT 來探索基因功能模塊。在隨機(jī)矩陣中, 非零的非對角元素代表相應(yīng)的 對角元 (塊) 之間的相互作用。 RMT 主要研究連續(xù) 本征值步長分布的統(tǒng)計特性。 根據(jù)矩陣本征值之間194生 物 物 理 學(xué) 報2009年的關(guān)聯(lián)性, 實(shí)對稱隨機(jī)矩陣的本征值步長

14、分布遵循 兩個普遍的統(tǒng)計規(guī)律: 強(qiáng)關(guān)聯(lián)本征值步長統(tǒng)計符合 高斯正交系綜 (Gauss Orthogonal Ensemble, GOE) 統(tǒng)計, 此時非零的非對角元素引入了對角元 (塊) 之間的相互作用; 弱關(guān)聯(lián)的本征值步長分布遵循 Poisson 統(tǒng)計, 此時只有對角元 (塊) 有非零值, 無 非零的非對角元素引入對角元 (塊) 之間的相互作PGOE(s) 1 sexp(s2/4)(1)2而 Poisson 統(tǒng)計的 P(s)服從 Poisson 分布PPoisson(s)=exp(s)(2)Wigner-Dyson 分布和 Poisson 分布的區(qū)別表現(xiàn)在 s 很小的時候, PGOE(s0)

15、=0, 而 PPoisson(s0)=1。用。 基因表達(dá)網(wǎng)絡(luò)有富關(guān)聯(lián)網(wǎng)絡(luò)和貧關(guān)聯(lián)網(wǎng)絡(luò)之 分。 富關(guān)聯(lián)網(wǎng)絡(luò), 其基因表達(dá)關(guān)聯(lián)矩陣包含強(qiáng)關(guān)聯(lián)2結(jié)果與討論作用和弱關(guān)聯(lián)作用兩部分, 強(qiáng)關(guān)聯(lián)為子模塊內(nèi)真實(shí)2.1HCC 基因表達(dá)模塊的獲取的基因關(guān)聯(lián), 弱關(guān)聯(lián)則為噪聲引入的子模塊之間的 微小關(guān)聯(lián), 而貧關(guān)聯(lián)網(wǎng)絡(luò)只存在模塊內(nèi)基因間的強(qiáng) 關(guān)聯(lián)。 在基因關(guān)聯(lián)矩陣中, 非零的非對角元素表示 對應(yīng)對角基因 (組) 間的關(guān)聯(lián)。 如果基因關(guān)聯(lián)矩陣 只有對角元 (塊) 有非零值, 其他的非對角塊元素 都為零, 表明基因表達(dá)網(wǎng)絡(luò)只存在對角基因 (組) 內(nèi)的基因之間的強(qiáng)關(guān)聯(lián), 而對角基因 (組) 之間沒 有關(guān)聯(lián), 此時基因表達(dá)

16、網(wǎng)絡(luò)是貧關(guān)聯(lián)網(wǎng)絡(luò), 關(guān)聯(lián)矩 陣的本征值是弱相關(guān)的 , 本 征值步長統(tǒng)計符合 Poisson 統(tǒng)計, 這些對角基因 (組) 形成獨(dú)立的基因 模塊。 如果關(guān)聯(lián)矩陣除了對角塊有非零值之外, 其 他的非對角塊元素有非零元素, 表明基因表達(dá)網(wǎng)絡(luò) 存在對角基因 (組) 內(nèi)基因間的強(qiáng)關(guān)聯(lián), 也存在對 角基因 (組) 之間的弱關(guān)聯(lián), 此時基因表達(dá)網(wǎng)絡(luò)是 富關(guān)聯(lián)網(wǎng)絡(luò), 關(guān)聯(lián)矩陣的本征值是強(qiáng)相關(guān)的, 本征 值步長統(tǒng)計符合 GOE 統(tǒng)計。 設(shè)置一系列去噪因子 q, 逐步去掉了噪聲引入的弱關(guān)聯(lián)作用, 網(wǎng)絡(luò)由富 關(guān)聯(lián)網(wǎng)絡(luò)轉(zhuǎn)變?yōu)樨氷P(guān)聯(lián)網(wǎng)絡(luò), 去除噪聲因子的臨界 值即轉(zhuǎn)變點(diǎn)由 RMT 方法自動確定。我們采用 RMT 方法研

17、究了 HCC 的基因表達(dá)網(wǎng)絡(luò), 其數(shù)據(jù)來源于斯坦福微陣列數(shù)據(jù)庫 , 數(shù)據(jù) 下 載 網(wǎng) 址 : /hcc/ supplement.shtml。 該數(shù)據(jù)由 3180 個基因在 156 個 條件下的表達(dá)情況組成。 156 個條件包含肝組織的 82 個 HCC 樣本 (68 個 HBV+ 肝癌、 4 個 HCV+ 肝 癌) 和 74 個癌旁肝組織樣本 (54 個 HBV+ 感染、 6 個 HCV+ 感染)。 3180 個基因是在肝癌組織和癌旁 組織兩組樣本中表達(dá)變化最大的基因 。 由于大約 90%的肝癌在慢性炎癥 (受 HBV 或 HCV 感染

18、) 的 基 礎(chǔ) 上 發(fā) 生 , 因 此 我 們 所選的數(shù)據(jù)中受 HBV 或 HCV 感染的樣本占主要部分。 為了將我們用隨機(jī) 矩陣?yán)碚摲椒▽ふ业墓δ苣K與 Chen X23用等級 聚類方法尋找的功能模塊做比較, 我們選擇的數(shù)據(jù) 條件和 Chen X23的樣本數(shù)量一致。 數(shù)據(jù)中的空值 用該基因在所有條件下的表達(dá)平均值代替。對 空 值 處 理 過的基因表達(dá)數(shù)據(jù) , 采 用 標(biāo) 準(zhǔn) Pearson 關(guān)聯(lián)計算其基因關(guān)聯(lián)系數(shù), 基因 gi 和基因 gj 之間的關(guān)聯(lián)系數(shù)為在 RMT 中, 我們采用標(biāo)準(zhǔn)譜展開技術(shù)研究基因表達(dá)矩陣的本征值步長分布的統(tǒng)計特性 。 一般c(g ,g )= 1 ( g M )( g

19、 M )(3)i jNk=1,Nikgigijkgjgj地 , 矩陣的本征值密 度 隨 本 征 值 Ei (i=1,2,3,N) (N 是矩陣維數(shù)) 變化, 所以本征值步長分布是 Ei 的函數(shù), 并且是由系統(tǒng)決定。 為了研究不同類型矩 陣的本征值的普遍波動, 需要采用標(biāo)準(zhǔn)譜展開技術(shù) 獲得歸一的本征值密度 。 我 們 可 以 用 展 開 譜 ei (ei=Nav(Ei), 其中 Nav 是通過三次樣條函數(shù)擬合積分 態(tài)密度或者局域平均密度得到的本征值光滑積分密度) 代 替 Ei, 再計算本征值最近鄰步長分布 P(s) (定義為展開本征值步長 s=ei1ei 分布的概率密度)。 通 過 RMT 可

20、以 知 道 , GOE 統(tǒng) 計 的 P (s) 可 由 Wigner-Dyson 分布描述,其中 gik 是 gi 基因在第 k 個實(shí)驗(yàn)條件下的表達(dá)值 , Mgi 和 Mgj 分別是基因 gi 和 gj 的平均表達(dá)水平, gi 和 gj 分別是基因 gi 和 gj 的標(biāo)準(zhǔn)偏差, N 是總的實(shí) 驗(yàn)條件。為了消除隨機(jī)因素的影響, 我們通過設(shè)置去噪 因子 q (0q1) 來去掉關(guān)聯(lián)矩陣中小的關(guān)聯(lián)值, 即將關(guān)聯(lián)矩陣中絕對值小于 q 的關(guān)聯(lián)系數(shù)用 0 代 替。 通過逐步去掉小的關(guān)聯(lián), 關(guān)聯(lián)矩陣的 P(s)由服 從 Wigner-Dyson 分 布 逐 漸 轉(zhuǎn) 變 成 服 從 Poisson 分 布, 這

21、樣隨機(jī)因素的影響也逐漸去掉, 基因功能模 塊自動分離開來。 圖 1 顯示了隨著 q 的逐步增加 P(s)的轉(zhuǎn)變情況。第 3 期隨機(jī)矩陣?yán)碚撛诟伟┗蚬δ苣K識別中的應(yīng)用1951.00.51.0P(s)GOEPoissonq=0.6q=0.780.50.01.0P(s)0.50.001234012340.0q=0.51.0P(s)0.50.001234q=0.72012341.00.5q=0.1q=0.661.00.50.001234S0.001234SFig.1 Nearest neighbor spacing distributions P(s) of gene coexpression c

22、orrelation matrices constructed from gene coexpression matrix of HCC at different cutoff value q (black lines with squares). The red line with dots is the Wigner-Dyson distribution and the green line with triangles is the Poisson distribution從圖 1 可以明顯地看到, 隨著去噪因子 q 的增加, P(s)由 Wigner-Dyson 分布逐漸轉(zhuǎn)變?yōu)?Poi

23、sson 分布。 這樣體系必然存在一個固有的轉(zhuǎn)變點(diǎn), 在此SDPoisson(q)=姨mp(i)PPoisson(i)2i = 1m1(5)轉(zhuǎn)變點(diǎn)之后, 獨(dú)立的基因功能模塊自動呈現(xiàn)。 Luo式中 SDGOE(q)表示 P(s)與 Wigner-Dyson 分布的標(biāo)準(zhǔn)等人22 采用 2 測試來尋找 P(s)由 Wigner-Dyson 分 布逐漸轉(zhuǎn)變?yōu)?Poisson 分布的轉(zhuǎn)變點(diǎn) qc, 但是由于 卡方測試的顯著性水平需要人為依據(jù)經(jīng)驗(yàn)設(shè)定, 不 同的顯著性水平確定的轉(zhuǎn)變點(diǎn)也不同, 因此卡方測 試具有主觀經(jīng)驗(yàn)性。 因?yàn)闃?biāo)準(zhǔn)偏差不但與一系列測 量值中的每個數(shù)據(jù)有關(guān), 而且對其中較大的誤差或 較小的

24、誤差敏感性很強(qiáng), 能較好地反映實(shí)驗(yàn)數(shù)據(jù)的 精確度, 所以我們采用標(biāo)準(zhǔn)誤差分析來尋找轉(zhuǎn)變 點(diǎn)。 標(biāo)準(zhǔn)偏差由下面公式得到:mp(i)PGOE(i)2誤差, SDPoisson(q)表示 P(s)與 Poisson 分布的標(biāo)準(zhǔn)誤 差, m 表示統(tǒng)計點(diǎn)的個數(shù), p(i)表示第 i 個統(tǒng)計點(diǎn) 對應(yīng)的 P(s)值, PGOE(i)和 PPoisson(i)分別表示第 i 個統(tǒng) 計 點(diǎn) 對 應(yīng) 的 Wigner-Dyson 分 布 及 Poisson 分 布 的 值。 通過做 P(s)與 Wigner-Dyson 分布及 Poisson 分 布的標(biāo)準(zhǔn)偏差曲線圖 , 把兩曲線的交 點(diǎn) 即 P(s) 與 Wig

25、ner-Dyson 分布及 Poisson 分布標(biāo)準(zhǔn)偏差相等的 點(diǎn)確定為轉(zhuǎn)變點(diǎn) qc1 (如圖 2)。 在 qc1 點(diǎn), 基因功能 模塊開始自動呈現(xiàn), 此時的基因表達(dá)網(wǎng)絡(luò)包含了大量的真實(shí)生物信息和一些殘余的隨機(jī)因素。為了觀察逐步去躁過程中基因表達(dá)網(wǎng)絡(luò)結(jié)構(gòu)的SDGOE(q)=姨i = 1m1(4)變化, 我們對空值處理過的基因表達(dá)數(shù)據(jù)計算其 Pearson 關(guān)聯(lián)系數(shù) , 構(gòu)建了一系列基因表達(dá)網(wǎng)絡(luò) , 使用 Biolayout 軟件逐步展示網(wǎng)絡(luò)結(jié)構(gòu)的變化。 在196生 物 物 理 學(xué) 報2009年SDGOESDPoisson0.660.3SD(q)0.00.81

26、.0qFig.2 The standard deviation of P (s) from the Wigner- Dyson distribution and the Poisson distribution at differentq. The red line with dots is the standard deviation of P(s) with Wigner-Dyson distribution and the black line with squares is the standard deviation of P (s) with Poisson distributio

27、n. The intersection of the two curves at q=0.66 corresponds to the transition pointBiolayout展示的網(wǎng)絡(luò)圖里面, 節(jié)點(diǎn)代表基因, 節(jié)點(diǎn) 之間的連線代表基因之間的關(guān)聯(lián)。 圖 3 顯示了在不 同去躁程度下的基因網(wǎng)絡(luò)圖。 由圖可以看出, 符合 GOE 統(tǒng)計的網(wǎng)絡(luò)與符合 Poisson 統(tǒng)計的網(wǎng)絡(luò)結(jié)構(gòu)明 顯不同, 在轉(zhuǎn)變點(diǎn)開始出現(xiàn)獨(dú)立的基因功能模塊, 在轉(zhuǎn)變點(diǎn)之后, 網(wǎng)絡(luò)由獨(dú)立的基因功能模塊構(gòu)成, 如圖 3。(A)(B)(C)(D)EGHLA ICMDBK F J由于富含噪聲的基因表達(dá)網(wǎng)絡(luò), 其表達(dá)矩陣的 本征根

28、步長分布 P(s)服從 Wigner-Dyson 分布, 而 真實(shí)的基因網(wǎng)絡(luò)其表達(dá)矩陣的本征根步長分布 P(s) 服從 Poisson 分布, 在逐步去除富含噪聲基因網(wǎng)絡(luò) 隨機(jī)噪聲的過程中, P(s)從服從 Wigner-Dyson 分布 逐 步 過 渡 到 服 從 Poisson 分 布 。 所 以 P (s) 與 Wigner-Dyson 分布的標(biāo)準(zhǔn)誤差 SDGOE(q)值越小, 說 明網(wǎng)絡(luò)所含噪聲越多, 隨著去噪因子 q 的增加, P (s) 與 Wigner-Dyson 分 布 標(biāo) 準(zhǔn) 誤 差 SDGOE (q) 值 變 大, 說明隨著去掉的隨機(jī)因素增多, 網(wǎng)絡(luò)在逐步接 近真實(shí)的基因網(wǎng)

29、絡(luò)。 圖 2 中 P(s)與 Poisson 分布的 標(biāo)準(zhǔn)誤差 SDPoisson(q)值越大, 說明所研究的基因網(wǎng) Fig.3 The gene coexpression networks at cutoff value q=0.6(A), 0.66(B), 0.72(C) and 0.78(D) visualized by Biolayout. Nodes represent genes and lines between nodes represent correlations between genes第 3 期隨機(jī)矩陣?yán)碚撛诟伟┗蚬δ苣K識別中的應(yīng)用197絡(luò)與真實(shí)的基因網(wǎng)絡(luò)相差較大

30、, 隨著去噪因子 q 的 增加, P(s)與 Poisson 分布的標(biāo)準(zhǔn)誤差 SDPoisson(q)值 變小, 也說明隨著去掉的隨機(jī)因素增多, 網(wǎng)絡(luò)在逐 步接近真實(shí)的基因網(wǎng)絡(luò)。 所以我們做出了 SDGOE(q)/ SDPoisson (q) 的 曲 線 圖 ( 圖 4) , 并 選 擇 SDGOE (q)/ SDPoisson(q)曲線的最大值點(diǎn) qc2 對應(yīng)的基因表達(dá)網(wǎng)絡(luò) 來做進(jìn)一步分析 圖 2 和圖 4 顯示出了這兩種臨界 值 : qc1 是這兩種標(biāo)準(zhǔn)偏差曲 線 的 交 點(diǎn) ; qc2 是 SDGOE(q)/SDPoisson(q)曲線的最大值點(diǎn)。我 們 用 biolayout 軟 件

31、展 示 了 qc2=0.78 的 基 因 表達(dá)網(wǎng)絡(luò) (圖 5), 得到了基 因 數(shù) 目 為 5 個 基 因 到0.788SDGOE/SDPoisson64200.00.81.0qEGLHIACMDBKFJFig.4 SDGOE(q)/SDPoisson(q) as a function of q. The maximum value of the ratio occurs at q=0.78Fig.5 Gene coexpression networks at q=0.78. Thirteen functional gene modules are marked by let

32、ters from A to M50 個基因之間的基因功能模塊 29 個。 作為初步的 分析, 結(jié)合 GO 數(shù)據(jù)庫對基因的注釋, 我們重點(diǎn)研 究了其中 13 個基因功能模塊。2.2 HCC 基因模塊的功能分析模塊 A 包含 50 個與細(xì)胞增殖有關(guān)的基因。 細(xì) 胞增殖過程可分為三個部分: 細(xì)胞生長、 DNA 復(fù) 制、 細(xì)胞分裂, 這三部分構(gòu)成一個完整的細(xì)胞周 期。 細(xì)胞周期由 4 個連續(xù)的時期, 即 DNA 合成前 期 (G1 期)、 DNA 合成期 (S 期)、 DNA 合成后期 ( G2 期 ) 和 分 裂 期 ( M 期 ) 組 成 。 按 照 Whitfield 等24的方法, 我們對基

33、因進(jìn)行了周期分配, 發(fā)現(xiàn)模 塊 A 中 在 G1/S 交 界處高表達(dá)的基因有 TCFL1、 PCNA 等, 在 DNA 合成期 (S 期) 高表達(dá)的基因有 FEN1、 RRM2、 ZWINT、 IFIT1、 USP1 等 , 在DNA 合成后期 (G2 期) 高表達(dá)的基因有 KNSL5、 MAD2L1, UBCH10、 CDC2 等, 在 G2/M 交界處高 表 達(dá) 的 基 因 有 RDBP、 C200RF1、 FOXM1、 CDC20、 CKS1 等, 在 M/G1 期交界處高表達(dá)的基 因 有 CLORF2、 CDKN3、 PTTG1、 TROAP、 ILF2等, 模塊 A 中還含有 9 個

34、參與周期不確定的細(xì)胞 周期基因 MYBL2、 LAP18、 G9A、 USP21、 SF3B4、 ZNF261、 PEA15、 SCAMP3、 PRCC 及 20 個 人 類CDNA 克隆及表達(dá)序列標(biāo)簽 。 模塊 A 中 MAD2L1 為細(xì)胞周期檢驗(yàn)點(diǎn)基因 , CDC2、 CDC20、 PCNA、 MYBL2 等為細(xì)胞周期調(diào)控基因, CDKN3、 CKS1 等 為細(xì)胞周期調(diào)控因子。 分析發(fā)現(xiàn), 模塊 A 中無參 與 DNA 合成前期 (G1 期) 的基因, 大部分基因參 與 DNA 合成后期 (G2 期) 及有絲分裂期 (M 期)。 研究認(rèn)為, 細(xì)胞周期調(diào)控異常而導(dǎo)致的細(xì)胞的增值 和分化異常是

35、腫瘤發(fā)生及發(fā)展的主要原因之一, 而 細(xì)胞周期的驅(qū)動力失控 (cyclin、 CDK 和 CDI 表達(dá) 異常)、 G1/S 和 G2/M 交界處監(jiān)控 (檢查) 機(jī)制受 損是細(xì)胞周期調(diào)控異常的兩個主要表現(xiàn) 。 模塊 A 中的 CDC2 基因, 是一種重要的調(diào)控基因, 其表達(dá) 產(chǎn)物 p34cdc2 是一種蛋白激酶, 在 G2/M 交界處起調(diào) 節(jié)作用。 基因 CDC20 也在 G2/M 交界處起調(diào)節(jié)作 用 。 MYBL2 基 因 的 表 達(dá) 在 G1/S 期 較 強(qiáng) 25, 與 E2F1-3 基因一起調(diào)節(jié)參與 G2/M 轉(zhuǎn)換時期的基因 cyclin A2、 cyclin B1 等的 表 達(dá)26, 其

36、表 達(dá) 異 常 與 乳腺癌27、 肝癌27、 卵巢癌27等多種癌癥有關(guān)。 總 結(jié)分析, 我們推測 G2/M 時期基因調(diào)控網(wǎng)絡(luò)異常是 肝癌細(xì)胞增殖的主要原因。模 塊 B 包 含 TRA、 TRB、 TRD、 LCK、 CD37、 T6419 6 個與具有免疫功能的 T 細(xì)胞有關(guān)198生 物 物 理 學(xué) 報2009年的基因, 與 Chen X23識別的 6 個基因的具有免疫 功能的 T 細(xì)胞模塊 C 比較, 有一個基因不同, 即 Chen X23識別模塊 C 的 GZMA 基因被我們識別的 CD37 基因取代, 由于 CD37 基因低密度地存在于 靜止或活化 T 細(xì)胞, 研究發(fā)現(xiàn) CD37 的表達(dá)

37、可能與 某些腫瘤如 Burkitts 淋巴瘤和肝細(xì)胞癌的發(fā)生有 關(guān)28。 因此模塊 B 可能反應(yīng)了 T 細(xì)胞免疫過程的 異常與肝癌的關(guān)系。模塊 C 包含 PSMF1、 IGKC、 IGHG3、 EPB72、 TNFSF10、 IGL、 NAPA、 CSF2RA、 NCF1、 CSF2、 WNT4、 ID4、 SLU7、 EDR2 等 21 個 基 因 , 與 Chen X23識別的 16 個基因的具有免疫功能的 B 細(xì) 胞 模 塊 D 比 較 , 我們識別的模塊多了 CSF2、 WNT4、 ID4、 SLU7、 EDR2 5 個基因。 CSF2 是一 種粒細(xì)胞 - 巨噬細(xì)胞集落刺激因子, 由活

38、化的 T 細(xì) 胞、 B 細(xì)胞、 巨噬細(xì)胞、 內(nèi)皮細(xì)胞等多種細(xì)胞分泌 和表達(dá), 參與機(jī)體的免疫活性29。 WNT4 為 B 細(xì)胞 的增長因子30, 在信號轉(zhuǎn)導(dǎo)中起作用。 ID4 為轉(zhuǎn)錄 協(xié)阻抑因子 , 研究發(fā)現(xiàn)急性淋巴細(xì)胞白血病人 B 細(xì) 胞 內(nèi) t(6;140(p22;q32) 染 色 體 易 位 , 會 導(dǎo) 致 ID4 基因表達(dá)下調(diào)31。 EDR2 基 因 功 能 與 Phc1 基 因 功 能相似, 在 B 細(xì)胞的信號轉(zhuǎn)導(dǎo)中起作用32。 基因 SLU7 為 步剪 接 因 子 , 參 與 mRNA 剪 接 位 點(diǎn) 選 擇, 是控制信號轉(zhuǎn)導(dǎo)因子表達(dá)的一種重要機(jī)制。 研 究發(fā)現(xiàn)此 5 個基因都與

39、B 細(xì)胞免疫過程有關(guān)。 綜 合以上分析, 說明 B 細(xì)胞免疫功能的失常, 與肝 癌有很大關(guān)系。模 塊 D 包 含 SPARC、 IGFBP7、 YARS、 TAGLN、 MYRL2、 AEBP1、 MMP2、 COL6A2、 ZFP92、 THBS2、 EFEMP1、 COL6A3、 COL3A1、 COL1A2、 SPARC、 THY1、 一 個 CDNA 克 隆 和 3個表達(dá)序列標(biāo)簽等 27 個與基質(zhì)細(xì)胞生物學(xué)有關(guān)的 基因。 與 Chen X23識別的基質(zhì)細(xì)胞模塊 E 和 F 比 較 , 我們識別的模塊 D 中 , 14 個 基 因 屬 于 Chen X23識別的模塊 E, 8 個基因?qū)儆?/p>

40、 Chen X23識別的 模 塊 F, 另 外 , SPARC 和 THY1 等 4 個 基 因 在 Chen X23的文獻(xiàn)中屬于在內(nèi)皮細(xì)胞中典型表達(dá)的 基因, 而我們卻發(fā)現(xiàn)這 4 個基因在基質(zhì)細(xì)胞模塊 內(nèi)。 分析這些基因的功能, 我們發(fā)現(xiàn), 他們都分布 于基質(zhì)內(nèi), 因此和基質(zhì)細(xì)胞屬于同一個功能團(tuán)簇。 細(xì)胞外基質(zhì)具有能使細(xì)胞間形成連接、 對坐落在其 上的細(xì)胞起支持作用、 保持組織的完整性等結(jié)構(gòu)作 用。 同時胞外基質(zhì)的密度和成分能影響細(xì)胞的形狀 和極性、 存活與死亡, 控制細(xì)胞的增殖分化和遷 移, 調(diào)控基因的表達(dá), 與癌細(xì)胞的轉(zhuǎn)移具有密切關(guān) 系, 因?yàn)榘┘?xì)胞在轉(zhuǎn)移過程中需多次與細(xì)胞外基質(zhì) 相互作

41、用。 因此模塊 D 與肝癌細(xì)胞的增殖、 分化 和遷移有關(guān)。我們發(fā)現(xiàn)的 A、 B、 C、 D 這 4 個基因功能模 塊都具有特定的功能, 且與 Chen X23發(fā)現(xiàn)的基因 團(tuán)簇基本一致, 證明隨機(jī)矩陣?yán)碚摲椒苡行У匕l(fā) 現(xiàn)基因功能模塊。模 塊 ( E) 包 含 HLA-A、 HLA-C、 HSPF2、MSTP9、 MB 等 7 個 基 因 , 模 塊 ( F) 包 含 HLA-DPA1、 HLA-DRA、 HLA-DQB1、 HLA-DRB5、 HLA-DMA、 HLA-DRB1、 ACTA2 和 HLA-DPB1 等12 個基因。 HLA, 人類白細(xì)胞抗原系統(tǒng), 是人類 組織相容性抗原系統(tǒng)的別

42、名。 模塊 (E) 和 (F) 分 別對應(yīng)人類主要組織相容性復(fù)合體類及類基 因。 人類主要組織相容性復(fù)合體 (MHC)基因是高 多態(tài)性基因, 編碼把抗原呈遞到 T 細(xì)胞有關(guān)的蛋 白質(zhì)。 人類主要組織相容性復(fù)合體類基因在所有 有核細(xì)胞都能表達(dá) , 呈 遞 抗 原 到 CD8+ T 細(xì) 胞 。 人類主要組織相容性復(fù)合體類基因的表達(dá)限于在 抗原提呈細(xì)胞和活性淋 巴 細(xì) 胞 , 類 分 子 (HLA-DR, HLA-DQ and HLA-DP, in humans) 呈 遞抗原給 CD4+ T 細(xì)胞。 MHC 基因在調(diào)節(jié)免疫應(yīng) 答方面有重要作用。 一些研究已經(jīng)發(fā)現(xiàn), MHC 基 因與乳突淋瘤的感染有關(guān)

43、, 如瘤的衰退與對 HPV 抗原決定基的響應(yīng)33。 此外, 有報導(dǎo)發(fā)現(xiàn)主要組織 相容性復(fù)合體類基因與子宮癌有關(guān)33。 主要組織 相容性復(fù)合體類基因在細(xì)胞的易感性、 腫瘤發(fā)展 等方面顯得越來越重要。 受到損害的免疫系統(tǒng)更容 易導(dǎo)致癌癥。模 塊 G 主 要 包 括 RPS20、 RPL30、 RPL13A、 RPS5、 RPLP0、 RPS16、 NPM1、 EIF3S6、 HBG1、 KLK3、 C14ORF4、 SEMG2、 GNB2L1 等 21 個 基因, 這些基因涉及蛋白質(zhì)的合成、 運(yùn)輸及水解等各 種生物過程。 其中以核糖體蛋白基因居多, 他們參 與蛋白質(zhì)的生物合成過程。 核糖體蛋白是編

44、碼細(xì)胞 結(jié)構(gòu)和功能蛋白的管家基因, 對調(diào)控細(xì)胞的分化起 著重 要 作 用 。 紀(jì) 念 Sloan-Kettering 癌 癥 中 心 的 研 究人員通過對一種罕見的遺傳綜合癥先天性角 化 不 良 (dyskeratosis congenita, DC) 的 研 究 , 首 次發(fā)現(xiàn)核糖體功能缺陷可能導(dǎo)致癌癥。 事實(shí)上, 研 究者通過對一些惡性腫瘤 ( 如 結(jié) 腸 癌34、 前 列 腺 癌34和食管癌34) 的研究發(fā)現(xiàn), 一些核糖體蛋白基 因的表達(dá)上調(diào)與癌癥有關(guān)。 除此之外, 最近在檢測第 3 期隨機(jī)矩陣?yán)碚撛诟伟┗蚬δ苣K識別中的應(yīng)用199斑馬魚基因時發(fā)現(xiàn), 各種各樣核糖體蛋白功能的失 調(diào)導(dǎo)致

45、具有不同起源的組織腫瘤形成35。 因此, 核 糖體蛋白功能的失調(diào)有可能與肝癌發(fā)生有關(guān)。模 塊 H 有 10 個 基 因 , ARHGDIB、 G18.2、 HSPC022、 DOCK2、 SLA、 AIF1、 CD53、 COPB2等。 G 蛋白是一個很大的家族 , 包 括 Rho、 Rac、Ras 等小家族, 它們在細(xì)胞中扮演著信號傳導(dǎo)開關(guān) 的角色。 當(dāng)它們與 GDP 結(jié)合時, 呈現(xiàn)失活狀態(tài) 。 在鳥嘌呤交換因子 (guanin exchange factor, GEF) 的作用下, G 蛋白脫離 GDP 并與 GTP 結(jié)合, 進(jìn)入 激 活 狀 態(tài) 。 G 蛋 白 的 GTP 會 被 GTP

46、 酶 激 活 蛋 白 ( GTPase-activating proteins, GAP) 水 解 , 并 釋 放 出其中的能量, 讓 G 蛋白行使其功能。 G 蛋白通 過 GTP/GDP 循環(huán)實(shí)現(xiàn)激活 / 失活狀態(tài)的轉(zhuǎn)換, 從 而起到傳遞信號的作用。 當(dāng) G 蛋白被激活后, 它 下游的多種分子會被激活。 這些下游分子本身會形 成網(wǎng)絡(luò), 相互作用。 它們調(diào)控著細(xì)胞遷移中的各個 方 面 。 模 塊 H 中 的 基 因 ARHGDIB、 HSPC022、 DOCK2、 G18.2、 CD53 (四次跨膜家族的成員, 具 有 和 公認(rèn)的轉(zhuǎn)移相關(guān)基因 KAI1 相 似 的 特 性) 和 AIF1 (炎

47、癥響應(yīng)中的重要基因, 并且 AIF1 是一種 肌動、 Rac1 活性蛋白, 可以促進(jìn)血管平滑肌細(xì)胞 的遷移36) 都在 G 蛋白的信號轉(zhuǎn)導(dǎo)開關(guān)中起作用, 調(diào)控著細(xì)胞遷移。 SLA 基因參與細(xì)胞內(nèi)信號轉(zhuǎn)導(dǎo)和 細(xì)胞間通信生物過程 , 和細(xì) 胞 遷 移 有 關(guān) 。 COPB2 基因參與物質(zhì)的輸運(yùn)。 結(jié)合以上分析可以看出, 模 塊 H 和肝癌細(xì)胞遷移有很大關(guān)系。 阻止細(xì)胞遷移 能抑制疾病進(jìn)展。模塊包含 H1F2、 H2BFB、 H2AFL、 H2BFL、 H2BFQ、 CPS1、 H2BFS 等 8 個與組蛋白有關(guān)的基 因。 在真核細(xì)胞的細(xì)胞核中, 核小體是染色體的主 要結(jié)構(gòu)元件 , 由 4 種組 蛋

48、 白 (H2A, H2B, H3 和 H4) 和纏繞于組蛋白的 DNA 共同組成。 組蛋白被 修飾會引起染色質(zhì)結(jié)構(gòu)的改變, 在基因表達(dá)調(diào)控中 發(fā)揮著重要作用。 組蛋白通過修飾 (包括組蛋白甲 基化、 乙酰化、 磷酸化、 泛素化, ADP- 核糖基化 等) 可以調(diào)節(jié)各種各樣的包括轉(zhuǎn)錄和基因沉默的細(xì) 胞功能。 當(dāng)這些調(diào)節(jié)控制過程出錯的時候, 就會增 加癌癥發(fā)生的危險。 越來越多的證據(jù)表明, 組蛋白 修飾的失衡與癌癥發(fā)生之間存在著密切的聯(lián)系37。 因此, 肝癌的發(fā)生可能和組蛋白模塊的表達(dá)異常有 著很大的關(guān)系。模塊 J 有 TUBA1、 TUBA2、 TUBA3 等 5 個 基 因, 分別表達(dá)微管蛋白

49、 1、 2、 3。 微管蛋白是一種細(xì)胞骨架蛋白, 與染色體的運(yùn)動和有絲分裂有 密切關(guān)系, 細(xì)胞病態(tài)增殖可能是由于微管蛋白的異 常引起的。 此外, 微管蛋白與腫瘤細(xì)胞的生長、 入 侵和轉(zhuǎn)移有密切關(guān)系。 而且在乳腺癌、 前列腺癌、 結(jié)腸癌等癌癥中也發(fā)現(xiàn)了微管蛋白基因表達(dá)發(fā)生變 化。 如, 有研究發(fā)現(xiàn)乳腺癌和 - 微管蛋白 mRNA表達(dá)水平變化有關(guān)38, 而和 - 微管蛋白表達(dá)水平 的變化無關(guān)39, 說明微管動力學(xué)破壞及異常有絲分 裂可能是乳腺癌 進(jìn)展過程中的重要事件 。 Ranganathan 等40研究發(fā)現(xiàn)前列腺癌和 - 微管蛋白 表達(dá)水平的顯著增高有關(guān)。 我們發(fā)現(xiàn)的微管蛋白模 塊中只包含 -

50、微管蛋白, 因此, 我們推測, - 微 管蛋白基因網(wǎng)絡(luò)的異常在肝癌的發(fā)生和發(fā)展中有一 定的作用。模 塊 K 有 C1R、 C1S、 FGA、 LOC51279 等 6個與補(bǔ)體有關(guān)的基因。 補(bǔ)體是存在于血清、 組織液 和細(xì)胞膜表面的、 在宿主細(xì)胞防御過程中起主要作 用的一組經(jīng)活化后具有酶活性的蛋白質(zhì)。 補(bǔ)體具有 促使細(xì)胞溶解的作用。 而且在補(bǔ)體激活過程中產(chǎn)生 一些調(diào)理素, 它們可結(jié)合中性粒細(xì)胞或巨噬細(xì)胞表 面相應(yīng)受體, 發(fā)揮調(diào)理作用, 使原有的吞噬活性加 強(qiáng)。 補(bǔ)體活化過程中產(chǎn)生多種活性片段, 調(diào)節(jié)發(fā)炎 和免疫響應(yīng)。 此外補(bǔ)體可以與細(xì)胞結(jié)合, 使細(xì)胞內(nèi) 某些物質(zhì)活化促使他們細(xì)胞分裂。 血清中大多

51、數(shù)補(bǔ) 體成分均以無活性的酶前體形式存在, 只有在某些 活化物作用下才一次性被激活。 補(bǔ)體活化有 3 條途 徑: 經(jīng)典途徑、 MBL 途徑、 旁路途徑。 我們識別 的模塊內(nèi)基因 C1r、 C1s 參與經(jīng)典途徑識別階段 、 活化階段、 膜攻擊階段等 3 個階段的第一階段。 所 以肝細(xì)胞受細(xì)菌感染可能和補(bǔ)體成分模塊基因的失 調(diào)有關(guān)。模 塊 L 包 含 13 個 基 因 , 其中主要的基因是 ACAA2、 AZGP1、 MMSDH、 FACL2 和 GRHPR。這些基因與脂代謝有密切關(guān)系。 在實(shí)際的臨床表現(xiàn) 中, 有一種病態(tài)肝叫脂肪肝, 這個疾病和 HCC 有 相同的病因, 這個模塊表明 HCC 與脂

52、肪肝之間可 能存在著某種聯(lián)系。模塊 M 顯示了酒精對肝癌產(chǎn)生的影響。 這個 模 塊 包 含 6 個 基 因 , 主 要 是 醇 脫 氫 酶 基 因 ADH2 和 ADH4, 脂代謝有關(guān)基因 UGT2B10、 APOC4 等。 眾所周知, 酒精對肝有很大的危害。 長期飲酒超過 機(jī)體的代謝能力, 可引起酒精性肝病, 包括酒精性 脂肪肝、 酒精性肝炎、 肝纖維化和肝硬化。 其中, 酒精性脂肪肝出現(xiàn)最早, 在一定條件下可以進(jìn)一步200生 物 物 理 學(xué) 報2009年發(fā)展為酒精性肝炎、 酒精性肝纖維化和酒精性肝硬 化, 甚至最后演變?yōu)楦伟?酒精性肝病的發(fā)生主要 是乙醇和乙醛的毒性作用所致。 酒精主要在肝細(xì)胞 的乙醇脫氫酶作用下變成高活性的乙醛, 干擾肝細(xì) 胞多方面的功能, 如影響線粒體產(chǎn)生 ATP、 蛋白 質(zhì)的生物合成和排泌、 損害微管, 導(dǎo)致蛋白、 脂肪 的排泌障礙而蓄積在肝細(xì)胞內(nèi)。 同時, 乙醇、 乙醛 被氧化時, 產(chǎn)生大量的還原型輔酶, 一方面促進(jìn) 脂肪的合成, 另一方面抑制線粒體內(nèi)脂肪酸的氧 化, 從而導(dǎo)致脂肪肝的形成。 模塊 H 中既包含與 乙醇氧化有關(guān)的基因, 又包含有與脂類代謝有關(guān)的 基 因 , 因 此可能和酒精性脂肪肝的出現(xiàn)有很大 關(guān)系。總之, 我們采用 RMT 方法研究了 HCC 的基 因表達(dá)網(wǎng)絡(luò)。 結(jié)果表明, 通過逐漸去掉關(guān)聯(lián)矩陣中 較小的關(guān)聯(lián)系數(shù) , 本征值步

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論