基因组是指一种微生物(包括细菌和病毒)或其他生物体细胞中的总DNA或RNA(反转录病毒),包括核DNA、细胞器DNA(动植物线粒体DNA和植物叶绿体DNA)和染色体外遗传成分(如细菌的质粒DNA)。随着人类基因组计划(HGP)的实施,产生了大量的基因组信息,分析这些信息是生物信息学的重要内容。
人类基因组共有约30亿个碱基对,对如此大量的信息数据进行搜集、存储及分配是生物学领域从未遇到过的问题。这些数据中包括编码人类全部蛋白质和结构核糖核酸(RNA)的信息,以及调控这些蛋白质和核酸装配成生物体的信息。因此解读这些信息是一个很大的难题。基因组信息学的主要目标就是配合人类基因组计划的各项实验研究,测定人类基因组的完整核苷酸序列,确定约10万个人类基因在染色体上的位置,以及研究包括基因在内的各种DNA片段的功能,也就是“读懂”人类基因组。
基因组信息学涉及基因组信息的获取、处理、存储、分配、分析和解释等所有方面。具体而言,就是要构建研究基因组的数据库,发展包括算法、软件、硬件在内的有效的信息分析工具以及完善与基因组研究相关的国际互联网络。随着基因组信息学研究的不断完善和深入,目前生物信息学涉及的基因组信息学研究主要包括比较基因组学、功能基因组学和药物基因组学等。