分化时间或称分歧时间估计,依据的是分子钟假说,即氨基酸或核苷酸替代速率在进化过程中随时间或进化谱系近似地保持恒定,以某几个特定类群的化石时间作为校正,然后通过基因序列间的分歧程度以及分子钟来估算物种间的分歧时间,同时估算系统发育树上其它节点的发生时间,从而推断相关类群的起源和不同类群的分歧时间。目前,采用依据BI树和ML树估计物种分歧时间的程序很多,例如R8S、MCMCTREE、MULTIDIVTIME、BEAST、MEGA等,不同软件通过不同的策略将化石时间信息整合到一个系统发育树中,从而计算得到Divergence time Tree。
进化树的构建与美化
本文字数: 6k 阅读时长 ≈ 5 分钟
构建进化树常常有多种办法,常用的有邻接法(NJ),UMPGA,最大简约法(MP),最大似然法(ML),贝叶斯法,不同方法各有其优缺点,最常用的就是ML和贝叶斯法,各个方法的原理及优缺点不在此处进行赘述,以下仅介绍建树的具体流程
构建进化树一般分为两步,第一步进行多序列比对,第二步对比对结果建树。
Orthofinder查找共有和独有基因
本文字数: 6.6k 阅读时长 ≈ 6 分钟
为什么要查找共有和独有基因?
共有基因一般是同源基因,独有基因是指该物种因为环境而被迫演化出的的基因,这意味这在对应的环境下,必定有一些适应该环境的特殊基因,这可以帮助我们弄清楚物种的之间的演化过程,也可以在育种方面提供原材料。
共有基因往往对应的是一些基因家族,在漫长的演化过程中,基因家族中有一些基因减少,或者增多,这其实就对应着基因家族的扩张收缩,这也是研究物种演化的关键数据之一。
查找共有和独有基因其实就是做基因家族的聚类,分析基因家族的扩张收缩,常有的软件有orthofinder和orthomcl,orthofinder的集成度更好,还可以自动完成建树因此此处我们学习orthofinder的使用。
基因家族扩张收缩
本文字数: 10k 阅读时长 ≈ 9 分钟
基因家族指来自大部份物种的MRCA(最近共同祖先,Most Recent Common Ancestor)的同一个始祖基因演化而来的一组基因。
CAFE(Computational Analysis of gene Family Evolution)是一款以解释系统发育历史的方式分析基因家族大小变化的软件,这种分析常被称为基因家族收缩扩张(Gene family expansions and contractions)分析。2005年该软件相关算法就已经发表,最近一次更新在2023年。CAFE使用出生和死亡过程来模拟用户指定的系统发育树中的基因获得和丢失(获得替换率,λ),2017年时首次提出不同枝基因的出生死亡率不同,这样可以算出父节点到子节点的基因家族大小转移率,也可推断祖先物种的基因家族大小
circos图的绘制
本文字数: 17k 阅读时长 ≈ 16 分钟
绘制circos图可以使用circos软件在服务器中运行,也可以使用TBtools,两者出图没有本质的区别,在此先介绍对小白更友好,操作更简单的TBtools,但是一些文件的获得依旧需要依靠服务器. 后面介绍circos软件的使用
教程来源主要为:https://www.yuque.com/cjchen/hirv8i/b88df7179632c0ee5f86a4b74a58f933
此外含有大量个人经验,仅看本教程完全可以完成全部工作