隨著基因組測(cè)序工作的進(jìn)展,日益發(fā)現(xiàn)基因組中存在著數(shù)量龐大的 SNP。SNP是一種最常見的可遺傳變異,在人類DNA多態(tài)性中,SNP約占 90 %。 SNP是指在基因組內(nèi)特定核苷酸位置上存在兩種不同的堿基,其中最少一種在群體中的頻率不小于1 %。 SNP分為兩種形式,一是基因編碼區(qū)的 SNP,稱為 cSNP;二是遍布于基因組的大量單堿基變異。SNP作為一種堿基的替換,大多數(shù)為轉(zhuǎn)換,即一種嘌呤換為另一種嘌呤或一種嘧啶換為另一種嘧啶,轉(zhuǎn)換與顛換之比為 2∶1。研究發(fā)現(xiàn),SNP在人類基因組 CpG序列上出現(xiàn)最頻繁,約占全部SNP的25%,而且多為 C→T,原因在于CpG中胞嘧啶殘基 (C)是甲基化的,能夠自發(fā)地脫氨基產(chǎn)生胸腺嘧啶 (T)。因此,SNP與 RFL P和 STR等 DNA標(biāo)記的主要不同在于:它不再以“長(zhǎng)度”的差異作為檢測(cè)手段,而是直接以序列的差異作為標(biāo)記。但 SNP單個(gè)基因座的多態(tài)性很差,只有二態(tài),為此采用多個(gè)SNP基因座進(jìn)行“單倍型” 分析尤顯重要。與第 1、2代遺傳標(biāo)記相比,醫(yī)學(xué)教|育網(wǎng)|收集整理SNP分析具有以下特點(diǎn):(1 )SNP數(shù)量大,分布密集,平均每 1000bp就有1個(gè) SNP。在 PKD基因內(nèi)部或附近可能會(huì)找到許多 SNP,聯(lián)合用于ADPKD的單倍型診斷;(2 ) SNP比STR擴(kuò)增更可靠,不會(huì)產(chǎn)生假帶;(3 )由于 SNP是二態(tài)的,易于自動(dòng)化批量檢測(cè),易于計(jì)算機(jī)分析結(jié)果。
SNP的研究已受到廣泛的重視,它已成為實(shí)驗(yàn)室和公司爭(zhēng)奪的對(duì)象,也是人類基因組計(jì)劃中的一個(gè)重要補(bǔ)充和研究熱點(diǎn)。用于 RFLP、STR的技術(shù)方法,理論上均可用于 SNP的識(shí)別和檢出。但印跡分析和 PCR方法,如 SSCP、DGGE等,大都需要標(biāo)記和電泳,費(fèi)時(shí)費(fèi)力,難于自動(dòng)化。近年來,采用了微陣列 DNA芯片、飛行質(zhì)譜分析和變性高效液相層析法等非電泳分型技術(shù),大大加快了SNP檢測(cè)效率。
SNP檢測(cè)已廣泛地應(yīng)用于疾病的連鎖分析及關(guān)聯(lián)分析、腫瘤的雜合性缺失研究、疾病遺傳機(jī)制研究、個(gè)性化用藥研究等諸多領(lǐng)域。盡管沒有人懷疑SNP在搜尋疾病基因方面的價(jià)值,但事實(shí)卻比人們想象的要難得多。首先基因中存在著的重組破壞了SNP和增加疾病風(fēng)險(xiǎn)性的變異之間的聯(lián)系,使得相關(guān)分析變得困難。有研究指出關(guān)聯(lián)分析比典型的家系分析需要的樣本要多得多,以便篩除錯(cuò)誤的信號(hào)。因此只有高速率分析數(shù)千個(gè)DNA樣本的新技術(shù)的出現(xiàn)才會(huì)使SNP分析變得真正有價(jià)值;其次,雖然關(guān)聯(lián)分析對(duì)于只有一個(gè)基因位點(diǎn)上的缺陷等位基因的鑒定有實(shí)用意義,但這種情況又不常見,大約 90 %疾病易感基因有 1 0個(gè)以上相關(guān)突變存在,而癌癥及其它一些疾病則常涉及多個(gè)基因。另外,最普遍的SNP也是最古老的,他們可以同時(shí)存在于正常人或患者中,這就意味著SNP和基因的關(guān)鍵突變之間的特定聯(lián)系可能不存在一個(gè)特殊的模式,人們很容易錯(cuò)失一個(gè)很重要的聯(lián)系,或者作出一個(gè)錯(cuò)誤的聯(lián)系。樣本數(shù)量也是SNP應(yīng)用的一個(gè)障礙。盡管大部分SNP出現(xiàn)在各種群體中,但是某一種SNP可能只出現(xiàn)在一個(gè)亞群中,一些有意義的cSNP也以相當(dāng)高的比例出現(xiàn)在某一亞群中。所以要搜尋SNP就要盡可能地采用多種多樣的大樣本。專利問題也限制著SNP技術(shù)應(yīng)用。由于SNP具有的新穎性、實(shí)用性和不明確性等特征,使得許多商業(yè)公司搶先獲得SNP后能夠?qū)ζ渖暾?qǐng)專利,限制了許多研究者對(duì)它們的使用。