近年來,完整質(zhì)體基因組因其包含更全面的遺傳信息,被寄望成為新一代“超級條形碼”,尤其在標(biāo)準(zhǔn)條形碼難以區(qū)分的近緣物種中展現(xiàn)潛力。然而,很少有研究系統(tǒng)性地探討分類復(fù)雜性——特別是那些具有復(fù)雜演化歷史的快速輻射進(jìn)化支系——如何影響質(zhì)體基因組尺度條形碼的有效性。馬先蒿屬(Pedicularis)是被子植物中最大的半寄生植物屬之一,全球有將近700種,有超過60%的馬先蒿物種在喜馬拉雅—橫斷山區(qū)集中分布,該區(qū)域內(nèi)馬先蒿屬物種在地理分布、生境以及花形態(tài)特征上都展現(xiàn)出了極為豐富的多樣性(圖1),并且經(jīng)歷了快速的輻射演化。因此馬先蒿屬是一個(gè)非常理想的范例來探究條形碼的鑒別機(jī)制。

圖1.?馬先蒿屬物種形態(tài)多樣性。(a)?P. salviiflora;(b) P.?rex;(c)?P. integrifolia;(d)?P. leptosiphon;(e)?P. oederi;(f)?P. lutescens;(g)?P. vialii;(h)?P. cranolopha.
為探討這一問題,中國科學(xué)院昆明植物研究所(以下簡稱“昆明植物所”)聯(lián)合中國科學(xué)院西雙版納熱帶植物園(以下簡稱“版納植物園”)、山東農(nóng)業(yè)大學(xué)、美國莫瑟爾大學(xué)(Mercer University)等單位科研人員,對該類群進(jìn)行了系統(tǒng)地條形碼研究。研究團(tuán)隊(duì)采集了主要分布于中國喜馬拉雅—橫斷山區(qū)的96個(gè)馬先蒿屬物種共292份樣品(圖2),通過基因組淺層測序獲取了葉綠體全基因組和核糖體nrITS序列,系統(tǒng)地評估了“超級條形碼”(葉綠體基因組)、傳統(tǒng)的標(biāo)準(zhǔn)條形碼(rbcL、matK、trnH-psbA、nrITS)、葉綠體高變區(qū)等片段及組合的物種鑒定效率,并進(jìn)一步探討了可能影響物種鑒定效率的內(nèi)在遺傳因素。

圖2.?基于質(zhì)體編碼序列構(gòu)建的最大似然樹。系統(tǒng)發(fā)育樹末端未標(biāo)注物種名稱的分支代表利用本數(shù)據(jù)集無法鑒定的樣本;橙色菱形標(biāo)識表示基于本研究中所有數(shù)據(jù)集均未能鑒定的樣本。環(huán)繞系統(tǒng)發(fā)育樹的14層環(huán)形圖依次代表從內(nèi)向外排列的14個(gè)基因:accD、ccsA、ndhA、ndhB、ndhC、ndhD、ndhE、ndhF、ndhG、ndhH、ndhI、ndhJ、ndhK和ycf15。四種顏色對應(yīng)各基因狀態(tài):(0)完整有功能,(1)存在提前終止密碼子的完整序列,(2)部分缺失,(3)完全缺失。最外層的灰色條形環(huán)表示假基因化程度,柱狀圖越高表明假基因化程度越高。
研究結(jié)果表明,標(biāo)準(zhǔn)DNA條形碼在馬先蒿這一半寄生植物屬中具有與質(zhì)體基因組尺度條形碼相媲美的物種鑒定能力。影響物種鑒定能力的關(guān)鍵因素包括序列比對長度和簡約信息位點(diǎn)比例(圖3),同時(shí)受寬松選擇約束的保守基因展現(xiàn)出更強(qiáng)的鑒別能力(圖4?和?圖5)。研究同時(shí)揭示了馬先蒿屬內(nèi)因快速分化、雜交及譜系不完全分選所造成的物種鑒別困境。葉綠體與核標(biāo)記(如nrITS)之間的系統(tǒng)發(fā)育沖突,印證了歷史基因滲入與地理隔離的影響,在近期分化的支系中尤為顯著。形態(tài)特征的趨同演化與隱存物種形成進(jìn)一步增加了分類劃界的難度,例如在形態(tài)上高度一致的物種(如大衛(wèi)氏馬先蒿)中發(fā)現(xiàn)了多個(gè)獨(dú)立支系。

圖3.?基于71個(gè)基因區(qū)域的序列特征與物種鑒別能力相關(guān)性分析。序列特征包括比對長度(AL)、可變位點(diǎn)數(shù)量(NVS)、可變位點(diǎn)百分比(PVS)、簡約信息位點(diǎn)數(shù)量(NPIS)、簡約信息位點(diǎn)百分比(PPIS)以及鑒定物種數(shù)量(NIS)。(A)?六個(gè)變量的相關(guān)性分析。相關(guān)性強(qiáng)度通過每個(gè)方格中的餅圖大小、顏色深淺及對應(yīng)數(shù)值表示:餅圖越大、顏色越深、數(shù)值越高代表相關(guān)性越強(qiáng)(藍(lán)色表示正相關(guān),紅色表示負(fù)相關(guān))。(B)?以NIS作為響應(yīng)變量、其余變量作為預(yù)測因子進(jìn)行的全子集回歸(ASR)分析。縱坐標(biāo)表示不同變量組合模型的調(diào)整后判定系數(shù)(R2adj),橫坐標(biāo)表示變量。不同顏色的矩形代表不同的解釋度水平。
?

圖4.?選擇壓力分析結(jié)果。圖示包含兩個(gè)組成部分:(1)虛線以上展示RELAX軟件的選擇強(qiáng)度評估結(jié)果。柱狀圖顯示選擇壓力類型,藍(lán)色代表強(qiáng)化選擇,紅色代表松弛選擇。(2)虛線以下呈現(xiàn)利用TBtools計(jì)算的非同義替換率(Ka)與同義替換率(Ks)比值結(jié)果。箱形圖描繪Ka/Ks值的分布區(qū)間?;虬磋b別能力從左至右降序排列。
?

圖5.?箱形圖展示了經(jīng)歷不同選擇強(qiáng)度(松弛選擇與強(qiáng)化選擇)的基因在鑒別能力上的差異。66個(gè)CDS基因中,36個(gè)基因經(jīng)歷強(qiáng)化選擇(n=36),30個(gè)基因經(jīng)歷松弛選擇(n=30)??v坐標(biāo)為各基因鑒定的物種數(shù)量。紅色線條代表中位數(shù),綠色三角表示平均值。P值為Mann-Whitney U test結(jié)果(具有顯著差異)。
這些發(fā)現(xiàn)表明,在馬先蒿屬中,單純使用質(zhì)體DNA條形碼可能已接近其理論鑒定極限(約80%),剩余的不確定性很可能反映了分類學(xué)界定的不一致或質(zhì)體數(shù)據(jù)自身的局限性。未來研究需整合核基因組標(biāo)記,以解析雜交導(dǎo)致的復(fù)雜性并驗(yàn)證隱存物種。結(jié)合基因組學(xué)方法,并加強(qiáng)整合分類學(xué)研究,將是準(zhǔn)確界定這一快速輻射演化屬中物種邊界的關(guān)鍵。
該成果以?“High species discrimination in?Pedicularis?(Orobanchaceae):Plastid genomes and traditional barcodes equally effective via parsimony-informative sites”?為題發(fā)表在Plant Diversity上。昆明植物所在讀博士研究生吳優(yōu)為第一作者,王紅研究員、版納植物園郁文彬研究員、美國莫瑟爾大學(xué)Kevin S. Burgess教授為共同通訊作者,山東農(nóng)業(yè)大學(xué)李德銖教授、昆明植物所在讀博士研究生劉榮和已畢業(yè)碩士生王維嘉(現(xiàn)為云南農(nóng)業(yè)大學(xué)博士生)參與了研究。該研究得到中國科學(xué)院先導(dǎo)項(xiàng)目、科技部基礎(chǔ)調(diào)查專項(xiàng)和云南省科技廳、版納植物園“十四五”等項(xiàng)目支持。同時(shí),感謝中國西南野生生物種質(zhì)資源庫保藏中心和分子生物學(xué)實(shí)驗(yàn)平臺、昆明植物所標(biāo)本館等部門的支持與幫助!
文章鏈接(https://doi.org/10.1016/j.pld.2025.09.005)