全基因组选择的流程
首先,需要确定一个研究/育种群体,并将其分为两个子集:训练集(建模群体)和测试集(预测群体)。训练集必须包含用于构建模型的基因型和表型信息——基因型数据通常是通过分子标记技术(如SSR、SNP、DArT、单倍型、基因组结构变异等)获得的,而表型数据可以通过传统的田间评估、遥感技术、无人机监测或其他现代化检测方法来收集。基于基因型与表型之间的线性或非线性关系,拟合一个预测模型。一旦模型建立完成,就可以用它来对只有基因型没有表型的测试集中的个体进行全基因组选择,从而估算出它们的基因组育种值(GEBV)或田间表现(GPFP),这些数据将有助于筛选育种材料。以上内容按照育种中的选系工作描述,杂交种预测略有不同。