题目:Haplotype-resolved genome analyses of a heterozygous diploid potato

作者:黄三文团队

杂志:Nature Genetic

文章链接:https://www.nature.com/articles/s41588-020-0699-x#Sec25

pipeline:https://github.com/zhouqiansolab/Merge-assemblies.

1. 组装思路:

v1版基因组:二代+10XG+遗传图谱+ONT

v2版基因组:Pacbio-CCS+遗传图谱

v3终版基因组:merge v1与v2,Hic挂载染色体。

2.转录组与甲基化 

3.F2群体中的偏分离研究

3.1 25.7% of genomic regions (430.8 Mb) 为严重偏分离区段(卡方检验,P<0.001)

3.2 定位到的基因座都位于偏分离区域。

4.方法:(亮点)

4.1  F2群体测了大约1X

4.2  转录组每个样本3G

4.3 软件参数

二代组装:DISCOVAR

10xg 组装:Supernova

遗传图谱辅助组装流程图:(聚类用R中的hclust、未聚类的Contig用R中的cor补回基因组中)

4.4 连锁群内部的组装

  首先,ONT数据用minimap2比对回scaffold;

  其次,每一个连锁群内比上的ONT数据用Smartdeno进行组装,完全比对和少于两个错配的序列被用于组装。

  最后,Racon与Pilon做polish,ARCS与LINKS pipeline用于10x辅助提升。

4.5 CSS组装

Canu组装、plion两轮纠错。

4.6 hic 辅助组装

Hicpro比对、ALLHIC辅助组装。

4.7 bac文库评估

blastr比对、Mummer(mummer show-snp)

4.8 基因组注释

    常规的软件方法

4.9 单倍型比较与进化分析(比较基因组)

    MCScanX、LASTZ、MUMmer的show-diff function用于SV检测、

    PAV的定义:

  snp和indel注释:Snpeff

  检测有害突变:sorting intolerant from tolerant’  (SIFT) algorithm

4.10 转录组-基因表达定量:

  Kallisto软件

  所有组织中TPM和大于1的基因被认为是表达基因。

4.11 甲基化

常规方法

4.12 遗传图谱

snp划分为300kb的窗口,1个窗口作为1个位点。

IciMapping (v4.0)40 with the parameters: LOD≥3 and algorithm = nnTwOpt.

R/qti中的cim算法用于QTL分析,候选区间为LOD最高的bin及相邻的两个bin。

基于snp的QTL定位结果,用区间内的indel位点做了精细定位(indel位点引物设计做验证)

qPCR验证

4.13 统计检验

    卡方检验:R中的chisq.test

    等位基因间的表达差异:R中的binom.test