首页 > 其他 > 详细

为什么UCSC上的基因坐标和ncbi上下载的基因坐标不一样?

时间:2019-04-11 12:30:24      阅读:675      评论:0      收藏:0      [点我收藏+]

刚刚从发ncbi的后台下载了一套hg19的注释文件gff格式的,和ucsc上下载的refseqgene注释进行了对比,发现一个奇怪的问题: 同一个转录本的起始坐标相差10000.

花了一上午的时间对比了下才发现,原来ucsc上的基因组序列都在序列上前后各添加了10000个N.

 

然后又检查了genecode的基因组,也是前后各添加了10000个N.  ncbi提供的hg38也是如此。  

原因找到了,不过用的时候确实需要注意。也就是说在整理注释信息的时候,如果需要添加N则需要对坐标进行平移。

为什么UCSC上的基因坐标和ncbi上下载的基因坐标不一样?

原文:https://www.cnblogs.com/weka/p/10688830.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!