01.Fst
介绍
本文件概述了使用 VCF tools 计算 Fst(Fixation Index)的两种方法:单点计算和窗口计算。在群体遗传学中,Fst 是用于测量不同群体之间基因分化程度的指标。通过这些步骤,用户可以计算特定位点或窗口中的 Fst 值,来检测群体分化和选择性扫荡的证据。
一般流程如下:

单点Fst:
vcftools --gzvcf XX.vcf.gz --weir-fst-pop Pop1 --weir-fst-pop Pop2 --out Fst --max-missing 0.9 --maf 0.05
--gzvcf 用于计算的VCF文件
--weir-fst-pop 用于计算的群体1个体列表 (每个个体名一行)
--weir-fst-pop 用于计算的群体2个体列表 (每个个体名一行)
--out 输出文件前缀
--max-missing 单个SNP的缺失情况(0完全缺失;1完全不缺失)
--maf 单个SNP的最小等位基因频率 (按实际情况选择是否添加)
窗口Fst:
vcftools --gzvcf XX.vcf.gz --weir-fst-pop Pop1 --weir-fst-pop Pop2 --fst-window-size 50000 --fst-window-step 10000 --out Fst-win --max-missing 0.9 --maf 0.05
--gzvcf 用于计算的VCF文件
--weir-fst-pop 用于计算的群体1个体列表 (每个个体名一行)
--weir-fst-pop 用于计算的群体2个体列表 (每个个体名一行)
--out 输出文件前缀
--max-missing 单个SNP的缺失情况(0完全缺失;1完全不缺失)
--maf 单个SNP的最小等位基因频率 (按实际情况选择是否添加)
--fst-window-size 50000 窗口大小
--fst-window-step 10000 步长大小