首页 > 其他 > 详细

【Plink】Error: Multiple instances of '_' in sample ID.?

时间:2021-04-23 16:55:38      阅读:25      评论:0      收藏:0      [点我收藏+]

前言

将vcf转化为plink格式时,命令如下:

plink --vcf  snp.vcf --recode --allow-extra-chr --out test

出现错误:

Error: Multiple instances of ‘_‘ in sample ID.
If you do not want ‘_‘ to be treated as a FID/IID delimiter, use --double-id or
--const-fid to choose a different method of converting VCF sample IDs to PLINK
IDs, or --id-delim to change the FID/IID delimiter.

原因

报错信息中已有提示。

plink默认使用下划线对样本名进行分隔,分隔的两个字段分别作为ped文件中的family id和sample id, 如果vcf中的样本名含有多个下划线,无法正确进行划分,软件会报错。

解决方法

方法一:修改样本名

假设你的vcf文件样本名在第7行:

sed -i ‘7s/_/-/g‘ snp.vcf

方法二:修改--id-delim

--id-delim参数设定默认分隔符是下划线,可以设置成其他字符,以达到正确区分的目的。

方法三:加入--double_id或--const-fid参数

通过加入参数指定family_id的设定方式,有两种参数。

第一种--double_id, 将family id和sample id保持相同。对于植物基因组分析而言,常忽略父母本,加入这个参数即可:

plink --vcf  snp.vcf --recode --allow-extra-chr --double_id --out test

第二种--const-fid将family id设置成一个常量(默认值是0)。

https://cloud.tencent.com/developer/article/1556166
https://www.cog-genomics.org/plink2/input

【Plink】Error: Multiple instances of '_' in sample ID.?

原文:https://www.cnblogs.com/jessepeng/p/14693161.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!