當(dāng)人類(lèi)基因體定序計(jì)劃的重要里程碑完成之后,生命科學(xué)正式邁入了一個(gè)后基因體時(shí)代,基因芯片 (microarray) 的出現(xiàn)讓研究人員得以宏觀的視野來(lái)探討分子機(jī)轉(zhuǎn)。不過(guò)分析是相當(dāng)復(fù)雜的學(xué)問(wèn),正因?yàn)榛蛐酒汕先f(wàn)的信息使得分析數(shù)據(jù)量龐大,更需要應(yīng)用到生物統(tǒng)計(jì)與生物信息相關(guān)軟件的協(xié)助。要取得一完整的數(shù)據(jù)結(jié)果,除了前端的實(shí)驗(yàn)設(shè)計(jì)與操作的無(wú)暇外,如何以精確的分析取得可信數(shù)據(jù),運(yùn)籌帷幄于方寸之間,更是畫(huà)龍點(diǎn)睛的關(guān)鍵。
?0?2
基因芯片的應(yīng)用
基因芯片可以同時(shí)針對(duì)生物體內(nèi)數(shù)以千計(jì)的基因進(jìn)行表現(xiàn)量分析,對(duì)于科學(xué)研究者而言,不論是細(xì)胞的生命周期、生化調(diào)控路徑、蛋白質(zhì)交互作用關(guān)系等等研究,或是藥物研發(fā)中對(duì)于藥物作用目標(biāo)基因的篩選,到臨床的疾病診斷預(yù)測(cè),都為基因芯片可以發(fā)揮功用的范疇。
?0?2
基因表現(xiàn)圖譜抓取了時(shí)間點(diǎn)當(dāng)下所有的動(dòng)態(tài)基因表現(xiàn)情形,將所有的探針?biāo)淼幕蚺c熒光強(qiáng)度轉(zhuǎn)換成基本數(shù)據(jù) (raw data) 后,仿如尚未解密前的達(dá)文西密碼,隱藏的奧秘由絲絲的線(xiàn)索串聯(lián)綿延,有待專(zhuān)家抽絲剝繭,如剝洋蔥般從外而內(nèi)層層解析出數(shù)千數(shù)萬(wàn)數(shù)據(jù)下的隱晦含義。
?0?2
要獲得有意義的分析結(jié)果,恐怕不能如潑墨畫(huà)般灑脫隨興所致。從 raw data 取得后,需要一連貫的分析流程 (圖一),經(jīng)過(guò)許多統(tǒng)計(jì)方法,才能條清理明的將 raw data 整理出一初步的分析數(shù)據(jù),當(dāng)處理到取得實(shí)驗(yàn)組除以對(duì)照組的對(duì)數(shù)值后 (log2 ratio),大約完成初步的統(tǒng)計(jì)工作,可進(jìn)展到下一步的進(jìn)階分析階段。
基因芯片(Gene chip)技術(shù)是指通過(guò)微陣列(Microarray)技術(shù)將高密度DNA片段陣列通過(guò)高速機(jī)器人或原位合成方式以一定的順序或排列方式使其附著在如玻璃片等固相表面,以熒光標(biāo)記的DNA探針,借助堿基互補(bǔ)雜交原理,進(jìn)行大量的基因表達(dá)及監(jiān)測(cè)等方面研究的技術(shù)。 基因芯片具有快速、高通量、自動(dòng)化、使用的試劑少等優(yōu)點(diǎn),本文主要介紹基因芯片數(shù)據(jù)分析和信息挖掘方法,包括聚類(lèi)分析和基因調(diào)控網(wǎng)絡(luò)分析。
詳細(xì)資料請(qǐng)參考:on
基因芯片的原位合成法是基于組合化學(xué)的合成原理[9], 通過(guò)一組定位模板來(lái)決定基片表面上不同化學(xué)單體的偶聯(lián)位點(diǎn)和次序, 把腺嘌呤(A)、鳥(niǎo)嘌呤(G)、胞嘧啶(C)、胸腺嘧啶(T)四種不同堿基的核苷酸按不同次序化學(xué)偶聯(lián)在相應(yīng)的位點(diǎn), 原位合成序列不同的寡核苷酸探針, 形成DNA芯片. 這一技術(shù)是由Affymetrix公司的Fodor及其同事最先發(fā)明的[1], 他們使用含光敏化學(xué)保護(hù)基的DNA合成試劑, 用光脫保護(hù)法直接在基片上合成寡核苷酸探針, 即光導(dǎo)向原位合成法. 該方法的優(yōu)點(diǎn)在于精確性高, 缺點(diǎn)是制造光掩蔽劑既費(fèi)時(shí)又昂貴.。
將基因表達(dá)譜芯片的數(shù)據(jù)按照指定的格式和要求上傳到NCBI 的GEO Datesets 上面的方法
你到GEO上注冊(cè),然后按照他們的步驟做,他們會(huì)有人聯(lián)系你來(lái)確保數(shù)據(jù)質(zhì)量的 。格式等直接問(wèn)他們就可以。通常是SOFT格式。
GEO Database
近年來(lái),利用高通量方法檢測(cè)基因表達(dá)越來(lái)越普及,諸如微陣列雜交和基因表系列分析(SAGE)可以同時(shí)測(cè)量數(shù)以萬(wàn)計(jì)的基因轉(zhuǎn)錄腳本(gene transcript)?;虮磉_(dá)大棚車(chē)(GEO:Gene Expression Omnibus)則是歸檔和自由分發(fā)科研人員提交的高通量基因表達(dá)數(shù)據(jù)的公共倉(cāng)庫(kù)。目前,GEO存儲(chǔ)了大約10億單個(gè)基因表達(dá)的數(shù)據(jù),來(lái)自于100多種生物,內(nèi)容廣泛涉及到各種生物學(xué)問(wèn)題。這些大容量的數(shù)據(jù)可以使用用戶(hù)友好的以Web為基礎(chǔ)的工具進(jìn)行有效的挖掘,檢索和可視化表達(dá)。
當(dāng)人類(lèi)基因體定序計(jì)劃的重要里程碑完成之后,生命科學(xué)正式邁入了一個(gè)后基因體時(shí)代,基因芯片 (microarray) 的出現(xiàn)讓研究人員得以宏觀的視野來(lái)探討分子機(jī)轉(zhuǎn)。
不過(guò)分析是相當(dāng)復(fù)雜的學(xué)問(wèn),正因?yàn)榛蛐酒汕先f(wàn)的信息使得分析數(shù)據(jù)量龐大,更需要應(yīng)用到生物統(tǒng)計(jì)與生物信息相關(guān)軟件的協(xié)助。要取得一完整的數(shù)據(jù)結(jié)果,除了前端的實(shí)驗(yàn)設(shè)計(jì)與操作的無(wú)暇外,如何以精確的分析取得可信數(shù)據(jù),運(yùn)籌帷幄于方寸之間,更是畫(huà)龍點(diǎn)睛的關(guān)鍵。
?0?2基因芯片的應(yīng)用基因芯片可以同時(shí)針對(duì)生物體內(nèi)數(shù)以千計(jì)的基因進(jìn)行表現(xiàn)量分析,對(duì)于科學(xué)研究者而言,不論是細(xì)胞的生命周期、生化調(diào)控路徑、蛋白質(zhì)交互作用關(guān)系等等研究,或是藥物研發(fā)中對(duì)于藥物作用目標(biāo)基因的篩選,到臨床的疾病診斷預(yù)測(cè),都為基因芯片可以發(fā)揮功用的范疇。?0?2基因表現(xiàn)圖譜抓取了時(shí)間點(diǎn)當(dāng)下所有的動(dòng)態(tài)基因表現(xiàn)情形,將所有的探針?biāo)淼幕蚺c熒光強(qiáng)度轉(zhuǎn)換成基本數(shù)據(jù) (raw data) 后,仿如尚未解密前的達(dá)文西密碼,隱藏的奧秘由絲絲的線(xiàn)索串聯(lián)綿延,有待專(zhuān)家抽絲剝繭,如剝洋蔥般從外而內(nèi)層層解析出數(shù)千數(shù)萬(wàn)數(shù)據(jù)下的隱晦含義。
?0?2要獲得有意義的分析結(jié)果,恐怕不能如潑墨畫(huà)般灑脫隨興所致。從 raw data 取得后,需要一連貫的分析流程 (圖一),經(jīng)過(guò)許多統(tǒng)計(jì)方法,才能條清理明的將 raw data 整理出一初步的分析數(shù)據(jù),當(dāng)處理到取得實(shí)驗(yàn)組除以對(duì)照組的對(duì)數(shù)值后 (log2 ratio),大約完成初步的統(tǒng)計(jì)工作,可進(jìn)展到下一步的進(jìn)階分析階段。
聲明:本網(wǎng)站尊重并保護(hù)知識(shí)產(chǎn)權(quán),根據(jù)《信息網(wǎng)絡(luò)傳播權(quán)保護(hù)條例》,如果我們轉(zhuǎn)載的作品侵犯了您的權(quán)利,請(qǐng)?jiān)谝粋€(gè)月內(nèi)通知我們,我們會(huì)及時(shí)刪除。
蜀ICP備2020033479號(hào)-4 Copyright ? 2016 學(xué)習(xí)鳥(niǎo). 頁(yè)面生成時(shí)間:3.171秒