什么是生物信息学中的二级数据库?
来源:学生作业帮 编辑:神马作文网作业帮 分类:综合作业 时间:2024/11/11 01:09:26
什么是生物信息学中的二级数据库?
如题,还希望能够说清楚点具体的定义是什么,
如题,还希望能够说清楚点具体的定义是什么,
根据需要从一级数据库中搜集对象的相关数据集合而成的就是二级数据库.
像genebank,EMBL这种都是不加选择的一级数据库,只要是实验获得的,不管什么东西的序列,哪怕是不完整的序列都能上传,而且它们的数据也有可能有重复.如果有某个人专门研究细菌的鉴定,需要用到正式被认可的16srDNA序列,为了研究方便,把这些一级数据库的各个种类细菌的公认标准16srDNA序列的数据进行整理,重新构建了一个数据库,这就是所谓的二级数据库.如果不构建,直接用一级数据库做blast,就会得出很多未被承认甚至不完整的序列,还要人工一个个看过去,找出公认的标准序列,这样就很麻烦.我举得例子在现实中就是韩国的EzTaxon.
像genebank,EMBL这种都是不加选择的一级数据库,只要是实验获得的,不管什么东西的序列,哪怕是不完整的序列都能上传,而且它们的数据也有可能有重复.如果有某个人专门研究细菌的鉴定,需要用到正式被认可的16srDNA序列,为了研究方便,把这些一级数据库的各个种类细菌的公认标准16srDNA序列的数据进行整理,重新构建了一个数据库,这就是所谓的二级数据库.如果不构建,直接用一级数据库做blast,就会得出很多未被承认甚至不完整的序列,还要人工一个个看过去,找出公认的标准序列,这样就很麻烦.我举得例子在现实中就是韩国的EzTaxon.