欢迎访问林业科学,今天是

林业科学 ›› 1999, Vol. 35 ›› Issue (2): 100-117.

• 综合评述 • 上一篇    下一篇

林木数量性状位点定位的统计方法

邬荣领1,2,刘红霞3,韩一凡2   

  1. 1. 美国北卡罗纳州立大学林学系林木生物技术研究组
    2. 北京林业大学森林资源与环境学院
    3. 中国林业科学研究院林业研究所 北京100091
  • 收稿日期:1998-08-14 出版日期:1999-03-25 发布日期:1999-03-25

STATISTICAL METHODS FOR MAPPING QUANTITATIVE TRAIT LOCI IN FOREST TREES

Rongling Wu1,2,Hongxia Liu3,Yifan Han2   

  1. 1. Forest Biotechnology Group, Department Of Forestry, North Carolina State University, Raleigh, NC 98195 USA
    2. Research Institute of Forestry, Chinese Academy of Forestry, Beijing 100091
    3. Department of Forestry, Beijing Forestry University, Beijing 100083
  • Received:1998-08-14 Online:1999-03-25 Published:1999-03-25

摘要:

本世纪初数量遗传学作为一门独立的学科而产生,以研究实验群体或自然群体的数量性状的遗传变异,它主要研究两个基本问题:(1)总的表型变异中有多少比例属于遗传的影响?(2)有多少遗传因子参与这种遗传变异?如遗传力的概念可以反映遗传因子对表型变异的贡献,它可用亲属间的相关性加以估计。这些参数量已在微生物、动植物中有大量的研究,遗传参数估算对于制定适当的育种计划和理解生物性状的表型进化有重要的作用。对于控制数量性状的位点数(QTLs),历史上进行过大量的研究,如Wright(1921)和Sax(1923)提出的估计方法等,但因种种原因没有得到很好地发展,随着分子生物学的发展,基于PCR的技术几乎能提供无限数目的DNA多态性标记,这些标记可用于构建遗传图谱,并进一步研究和确定生物、医学和农业上重要数量性状的位点。在过去的10年内,已研制出许多统计方法用于QTLs定位分析,虽然这些方法适用于已很好设计的多谱交配材料,如起始于2个近交系亲本杂交后的F2和回交等群体,但这些方法也可用于主要为异交的森林树木的QTLs定位分析,最简单的方法就是寻找单个标记与数量性状的关系,若不同标记组之间的数量性状差异显著,那么这种标记有可能与该性状关联,这种方法不能准确地确定QTL的位置,并且常常是过低估计QTL的效应。Lander和Botstein(1989)提出了区间建图方法(Interval mapping),这种方法在区分多个QTLs连锁关系上仍有其缺陷,至今有一些研究人员提出了将区间作图与多重回归分析结合的办法以解决这些问题。本文即是对这些已用于或将用于林木树种中的一些基本方法作一评述,并探讨寻找影响林木数量性状QTL的一些统计方法。至今已有许多遗传标记可用于QTL建图,如同功酶标记及DNA标记等,遗传图谱构建是基于所有可能标记之间的重组比例而进行的,传统的用于构建图谱试验设计是开始两个不同表现的近交系进行杂交,生成F1代,继续自交、及回交形成F2、B1和B2等不同群体,应用这些群体及多态性的标记,依据孟德尔分离组合规律,两个标记间重组率(r)可以估计并检测出来,并依据Haldane(1919)Kosambi(1944)提出的公式对所估计的重组率(r)转化为相应的遗传距离,最后建立连锁图谱群。对于单个标记分析,基本上可用3种方法进行:一是基于分子标记分类间的数量性状均值差异是否显著来判断所用标记的影响(加性或显性效应),若差异显著(如用t测验)说明该标记与所研究性状关联,否则无关;二是回归方法,应用数量性状与分子标记基因型(转化为数量化指标如0, 1)进行回归分析,对所得的回归系数进行测验来判断标记与数量性状的关联性,然而这一方法缺点是假设每一标记组内的所研究的性状分布为正态的;三是似然法,该方法可应用于每个标记类型内的混合正态分布类型,可以估计标记与QTL之间重组率,通过对似然函数进行偏导以取得极大值似然参数估计,并应用仍然比方法或相应的以10为底的对数(LOD值)对所用的标记影响进行测定。与单个标记分析不同,区间作图能够将QTL效应和其在两个标记所包含的区间内位置同时进行分析,其作图过程可用2种方法进行:一是最大似然法,其原理是假设数量性状位点处于两个标记的区间内,根据重组后出现的标记类型,构造出响应的似然函数,对每一参数分别求导,以求得最大似然解,然后用迭代方法求收敛解,并采用似然比测定和根据LOD值大小确定QTL位置;二是回归分析法,即将数量性状对成对标记进行回归分析,对偏回归系数的非零值测定用于推测出QTL在该对标记的相对位置,该法也可推广到同时对多个标记进行定位分析。混合区间作图(Composite Interval Mapping)同时考虑到数量性状对某一对标记区间内和该区间外的其它标记的进行回归分析,其优点是除了对某一特定区间分析外,还考虑其它标记的影响,类似于区间作图一样,根据特定区间标记类型,构造相应的似然函数,并求得最大似然解,然后用迭代法求解直到收敛,用似然比检验确定QTL的位置。考虑到单倍体,如裸子植物的胚乳,由于杂合子的后代在胚乳中会产生1:1的比例,这一规律使得筛选适当的标记成为可能,近年来应用单倍体大孢子构建图谱已在一些针叶树中有报道,并且混合区间作图方法现已被推广到单倍体以用于估计各种参数和QTL定位。比较起来以上3种方法有不同的特点,单个标记分析简单易行,区间作图较准确地估计QTL的效应及确定它在某一特定的区间的位置,但这2种分析方法都存在一个非现实的假设,即在染色体至多存在一个QTL的假设。混合区间作图分析消除了这一假设,该方法还可以考虑某一特定区间外的一些QTLs影响,由于在一已知的染色体上, QTL数量和位置是不知道的,因此混合区间作图较其它两种方法更具优点,然而混合区间作图也不是完备的,如样本大小,标记的数量与密度是一些重要的影响因素。近年来这一方法已得到进一步的拓广,如考虑影响数量性状相关性和遗传与环境互作效应等的QTL作图。研制适合于森林树木的QTL作图方法对于统计遗传学专家来说是一个挑战,这是由于所涉及到的数学和计算技术非常复杂。林木有许多特点,包括长的世代周期、高杂合率、高的遗传负荷及异质环境。首先大多数树种为异交树种,群体内同一位点多个等基因是非常普遍现象,因此随机遗传模型可能更适合解决这一问题。与固定模型不同,随机模型估计可能的QTL位点的方差而非效应值。在森林树种中,遗传分析的推断常常是基于正规的交配涉及而进行的,这是由于从这些设计中所估计出的遗传参数可以拓广到整个群体上,因此如何从一交配设计进行QTLs作图及如何解释它们将是林木QTL定位研究的第二优先考虑的问题,再者,研制一全新的方法以识别外遗传因子(Epigenetic factors),即在一个特定生长发育时期影响生长和形态特征的QTL,将是令人鼓舞的。由根据这些QTLs,我们可以洞察数量性状早晚期遗传相关关系,并为早期选择提供指导。考虑到这些待解决的问题,我们期盼新的有效的适于林木的QTL作图方法的出现。

关键词: 数量性状, 定位方法, 分子标记, 林木

Abstract:

The objective of mapping quantitative trait loci (QTLs) is to search for genes affecting quantitative traits with the aid of genetic linkage maps constructed from molecular markers. As a prerequisite for map-based cloning of important genes in biology, medicine and agriculture, the genetic mapping of QTLs has being brought about a revolutionary change in quantitative genetics. In the past decade, many statistical methods have been developed to estimate the effects of QTLs and locate their positions throughout the genome. Although these methods are based on well-defined pedigrees, such as F2 and backcrosses, initiated with inbred lines, their theoretical framework can be developed to map QTLs in outbred forest trees. In this article, we review the principle of constructing genetic linkage maps and statistical basis for QTL mapping using the maps. Further directions for developing statistical mapping methods in forest trees are discussed.

Key words: Quantitative trait loci, Mapping, Molecular marker, Tree