中国科学院北京基因组研究所硕士研究生入学考试《生物信息学》考试大纲
本《生物信息学》考试大纲适用于中国科学院大学报考生物信息学专业的硕士研究生入学考试。生物信息学是一门研究生物和生物相关系统中信息内容和信息流向的综合性科学。它采用信息科学、计算机科学、生物数学、比较生物学等学科的观点和方法对生命的现象及其组成分子(核酸、蛋白质等)进行研究,主要研究生命中的本质和规律,包括物质组成、结构功能、生命体的能量和信息交换传递等。通过对生物信息的计算处理,人们能从众多分散的生物学观测数据中获得对生命运行机制的详细而系统的理解。
考试内容
★ 生物信息学概论和数据库
★ 序列数据的收集和存储
★ 基因组序列组装和基因注释
★ 基因结构元件识别和分析
★ 双序列与多序列比对
★ 数据库检索算法
★ 序列变异研究的算法与进化分析
★ 数据可视化
★ 基因表达与调控网络
★ 表观遗传学数据分析
★ 蛋白质分类与结构预测
考试要求
了解生物信息学概念、研究方向、发展趋势和重要事件,包括泛基因组和元基因组的概念,第一个全基因组序列和第一个基因组数据库的产生等。
了解重要的生物信息中心和常用数据库(包括DNA序列数据库、基因组数据库、蛋白质序列及结构数据库)
了解不同类型序列数据的获取方式,掌握常用的序列存储格式及转换方式。
掌握常用序列联配算法及软件,了解打分矩阵及空位罚分算法。
理解多重序列比对与进化分析的关系,掌握常用渐进算法及软件。
掌握FASTA和BLAST系列算法。
理解进化分析与亲缘树的关系,了解三种进化分析算法(最大似然法、距离法和最大简约法)。
掌握多种生物信息数据的可视化软件,包括从头组装数据、变异发掘数据、扩增子深度测序数据、基因表达数据和表观遗传学数据等。
掌握开放阅读框的预测方法,理解重复序列对基因预测的影响,掌握微生物基因组的基因预测,理解真核生物基因预测与外显子识别的关系,了解启动子预测与调控模式的关系,了解转录因子结合位点的概念及作用。
了解原核生物与真核生物基因组分析的异同点,理解同源性识别与蛋白组分析,掌握基因组分析与进化的关系,了解功能基因组研究方法。
掌握序列变异的检测方法、工具、评估及注释流程。
掌握转录组分析基本方法,理解基因表达差异分析及代谢网络分析的算法和软件。
了解染色质免疫共沉淀技术,掌握ChIP-seq数据处理流程。
掌握蛋白质结构的组成和层次,理解序列相似性与结构相似性同蛋白质分类之间的关系,掌握蛋白质结构预测方法,包括二级结构和三级结构。
主要参考书目
序号 | 书名 | 作者 | 出版社 |
1 | 第二代测序信息处理 | S.M.布朗 吴佳妍,肖景发,于军(译) | 科学出版社 |
2 | 基因组III | T.A.布朗 袁建刚(译) | 科学出版社 |
3 | 生物信息学:序列与基因组分析(英文版) | David W. Mount | 科学出版社 |
(责任编辑:田学江)