当前位置：首页 » 数据共享 » kog数据库

kog数据库

发布时间: 2024-01-26 04:02:31

㈠转录测序中的nr，nt，swissprot，cog，kegg，go分别是什么意思

NR库属于非冗余蛋白序列数据库，是NCBI官方的蛋白序列数据库，数据来源于GenPept、SwissProt、PIR、PDF、PDB以及NCBI RefSeq，是默认的蛋白比对数据库。
NT数据库是美国国家生物技术信息中心NCBI官方的核酸序列数据库，NT库属于非冗余核酸序列数据库,数据来源于GenBank、EMBL 以及 DDBJ，是NCBI默认的核酸blast比对数据库。
SwissProt数据库是检查过的、手工注释的蛋白数据库，我们将Unigene注释到SwissProt数据库，以得到更加高质量的注释结果。
COG (clusters of orthologous groups)主要是原核生物和单细胞真核生物的直系同源物，KOG(clusters of euKaryotic Orthologous Groups)数据库包含了7个完整基因组的真核生物的直系同源家族蛋白, 构成每个 KOG 的蛋白集是被假定为来自于一个祖先蛋白，根据系统发生进行分类，一般COG指原核生物，KOG指真核生物，KOG与COG提供了相似的基因同源物的分类信息。
KEGG (Kyoto Encyclopedia of Genes and Genomes) 是处理基因组、生物通路、疾病、药物和化学物质之间联系的集成数据库。 KEGG用于生物信息研究等，包括基因组，代谢组学等其他组学的数据分析，涵盖了Drug Development(药物开发)、 Cellular Processes(细胞过程)、 Environmental Information Processing(环境信息处理)、Genetic Information Processing(遗传信息处理)、 Human Diseases(人类疾病), Metabolism(代谢)、 Organismal Systems(有机系统)等方面。
GO( Gene Ontology ): 基因本体。生物技术的发展迅速，数据越来越多，不同数据库命名标准不统一，为了解决不同的生物学数据库可能会使用不同的术语的问题，从而基因本体联合会(Gene Onotology Consortium)开发GO来描述基因在分子、细胞和组织水平的功能体现。GO的基本描述单元是GO terms。GO主要包括三个分支: 生物过程(biological processes)、分子功能(molecular function)和细胞组成(cellular components)，用于描述基因产物的功能。GO中使用了is_a、part_of和regulates三种互作关系。

阅读全文

kog数据库

与kog数据库相关的阅读推荐