Agin games

生物信息学服务
非约束排序(PCoA/NMDS等)
【添加时间:2016-09-12 09:24:27】【来源:】【作者:dggadmin】
        非约束排序是寻求潜在的或在间接的环境梯度来解释物种数据的变化,例如PCA、CA、DCA、PCoA、NMDS等,可以直观的显示不同样品(组)之间的微生物群落差异。

        主成分分析 (principal component analysis, PCA): 基于特征向量的排序方法,分析对象是原始的定量数据,排序图展示样方之间的欧氏距离。

        主坐标分析 (principal coordinates analysis, PCoA): 通过一系列的特征值和特征向量进行排序后,选择主要排在前几位的特征值。分析对象为任意类型的距离矩阵,因此可灵活选择关联测度。PCoA是将聚类分析与主成分分析方法结合起来,用较少的主坐标对分类单元进行有效地排序,并使损失的信息最小。

        非度量多维尺度分析 (nonmetric multidimensional scaling, NMDS): 尝试在预先设定数量的排序轴去排序对象,目标是保持这些对象排位关系不变,反映对象之间的顺序关系。分析对象为任意类型的距离矩阵。该方法不基于特征向量排序,不以排序轴承载更多的变差为目的,对距离缺失的数据有优势。

        在16S rRNA基因扩增子测序分析中,普遍使用基于Unifrac距离的PCoA或NMDS分析。Unifrac距离同时考虑了物种组成差异和系统发育关系。Bray-Curtis距离则更适用于不能构建系统发育树的情况(例如真菌ITS测序、宏基因组分析)。
        此外,Unweighted (非加权)距离只考虑物种是否存在,Weighted (加权)距离考虑了物种丰度的差异。


\
图1 基于Weighted Unifrac距离的PCoA主坐标分析
        图中的点代表样本,点与点之间的距离表示差异程度,括号里的百分比表示该轴能够解释的群落差异比例。建议不分组时,样本数量不少于10个;多组样本时,每组样本数量不少于5个。

\
图2 基于Weighted Unifrac距离的NMDS分析
       注:图2与图1是针对相同数据绘制的。



上一篇:Alpha多样性分析
下一篇:约束排序(RDA/CCA等)Agin games