生物信息学:智慧型化算法及其套用


生物信息学:智慧型化算法及其套用

文章插图
生物信息学:智慧型化算法及其套用【生物信息学:智慧型化算法及其套用】《生物信息学:智慧型化算法及其套用》是2006年化学工业出版社出版的图书,作者是王翼飞、史定华 。本书主要包括生物信息学概述、智慧型化算法等内容 。
基本介绍书名:生物信息学:智慧型化算法及其套用
作者:王翼飞,史定华
页数:283
装帧:平装
基本相信作 者:王翼飞,史定华编 丛 书 名:现代生物技术丛书出 版 社:化学工业出版社ISBN:9787502586195出版时间:2006-07-01版 次:1页 数:283装 帧:平装开 本:16开所属分类:图书 > 科学与自然 > 生物科学内容简介本书作为《现代生物技术丛书》的分册之一,旨在为从事生物信息学研究的学子们提供一个可操作的入门性介绍 。生物信息学是一门涵盖生物学、数学、化学、物理学、计算机科学等学科的年轻科学,也是近年来发展非常迅速的研究领域 。截止2006年,生物信息学研究工作者大都依据各自的知识背景採用擅长的数学方法,独门利器,庖丁解牛,从初等数学到高等数学,可说是“十八般武艺、各显神通” 。本书独闢蹊径,以智慧型化算法为主线逐一介绍了隐马氏模型、神经网路、遗传算法、模拟退火算法、贝叶斯网路等算法,着重阐述了这些算法在生物信息学研究中的套用,力图探索破译生命奥秘的可行之径 。书中介绍的各种算法和生物信息学课题都是笔者多年来实际研究过的工作,相关的论文也都已陆续发表 。因此,从一定意义上说,本书是作者多年研究工作的整理和总结 。国内高校和科研院所生物和数学领域中从事生物信息学教学和研究的教师和学生,阅读本书,将会发现它是一本实用的教材和阅读方便的参考书 。在这本书里,作者就以智慧型化算法为主线逐一介绍各种算法及其在生物信息学研究中的套用,旨在为有志于生物信息学研究的年轻学子提供一个具有可操作性的入门介绍,使他们可以较快地开展实际的研究工作 。生物信息学是一门年轻的学科,也是一门正在急速发展的学科,更是一门青年人可以大显身手的学科 。如果将生物信息学比作大海的话,那幺本书介绍的方法和问题仅是一束小小的、毫不起眼的浪花而已 。作者简介王翼飞,上海大学数学系教授 。博士生导师 。上海市生物信息学会理事 。1975年毕业于上海科学技术大学计算数学专业 。1985年在上海科技大学获理学硕士学位 。曾从事雷射核聚变的计算机模拟研究和奇异摄动问题的数值解法研究 。1991~1994年受日本理化学研究所筑波生命科学中心邀请,赴日本从事计算分子生物学研究 。1994年回国后即致力于计算分子生物学和生物信息学的教学和科研工作 。已出版译着1本,发表论文60余篇 。目录第一章 生物信息学1第一节 生物信息学的内容、方法和意义1一、什幺是生物信息学1二、生物信息学探源2三、生物信息学的内涵和后基因组时代的主攻方向3第二节 有关生物学的背景知识4一、细胞简介5二、基因概述9三、蛋白质解说13第三节 网际网路上可用的生物信息资源18一、生物信息网上资源简介18二、基因组资料库19三、核酸序列资料库21四、蛋白质序列资料库28五、蛋白质结构资料库37六、二次资料库43七、重要网上资源的地址48参考文献49第二章 智慧型化算法50第一节 什幺是智慧型化算法50一、问题的提法50二、程式化算法52三、智慧型化算法54第二节 本书涉及的智慧型化算法55一、蒙特卡罗方法55二、模拟退火算法56三、遗传算法57四、人工神经网路58五、隐马氏模型60六、贝叶斯网路与无标度网路61第三节 评价智慧型化算法的一个理论框架62一、离散吸收马氏过程62二、随机算法的收敛性和複杂性63参考文献70第三章 序列联配与隐马氏模型71第一节 双序列联配71一、序列的同源性和相似性71二、PAM和BLOSUM计分矩阵72三、动态规划算法75四、资料库搜寻的FASTA和BLAST算法77第二节 多序列联配79一、多序列联配的概念79二、多序列联配常用的ClustalW算法80三、多序列联配结果的表示和资料库搜寻81第三节 隐马氏模型84一、马尔可夫链85二、隐马氏模型的形式86三、隐马氏模型的基本问题与算法89第四节 基于剖面隐马氏模型的多序列联配94一、作为多序列联配的剖面隐马氏模型94二、剖面隐马氏模型主状态数的选取96三、现有剖面隐马氏模型软体简介和多序列联配实例102参考文献104第四章 模体识别与神经网路105第一节 模体识别105一、模体的生物学意义105二、序列模体和结构模体106三、模体资料库108四、模体发现的方法109第二节 智慧型神经网路110一、神经网路简介110二、神经网路的结构模型及学习111三、多层前馈神经网路与反向传播算法116四、反向传播算法的局限性及其改进119五、神经网路的两个主要问题121六、贝叶斯神经网路123第三节 基于神经网路的模体识别125一、神经网路在生物分子序列分析中的套用125二、生物分子序列分析中的神经网路编码129三、基于神经网路的蛋白质二级结构预测130参考文献135第五章 蛋白质摺叠与遗传算法137第一节 蛋白质摺叠137一、蛋白质结构及其预测方法概述137二、蛋白质摺叠预测的模型141三、蛋白质摺叠预测的基本方法143第二节 蒙特卡罗方法145一、基本蒙特卡罗方法145二、各种採样方法介绍147三、马尔可夫链蒙特卡罗方法150 第三节 遗传算法152一、遗传算法的有关概念152二、基本遗传算法153三、各种改进的遗传算法158四、遗传算法的数学理论160第四节 蛋白质摺叠预测实例163一、蛋白质摺叠的HP模型163二、基于蒙特卡罗方法的蛋白质摺叠预测165三、基于遗传算法的蛋白质摺叠问题预测167四、结果与讨论168参考文献169第六章 RNA结构预测与模拟退火171第一节 RNA的结构与功能172一、RNA的组成172二、RNA的分类、结构及其功能174三、RNA的二级结构与假结180第二节 RNA二级结构预测建模183一、比较序列分析模型183二、最小自由能算法与自由能参数188三、组合最佳化算法的解决方案192四、进一步提高预测準确度的若干问题194第三节 模拟退火算法195一、Metropolis準则196二、模拟退火的渐近行为198三、冷却进度表的有关问题200四、模拟退火算法的改进和变异202五、Boltzmann机203第四节 RNA二级结构预测实例205一、RNA二级结构的编码205二、混合遗传算法206三、材料与计算结果207参考文献209第七章 微阵列技术与统计推断211第一节 微阵列技术211一、微阵列技术简介211二、微阵列的数据挖掘214三、微阵列技术的套用219第二节 聚类方法221一、距离与相似係数222二、系统聚类法222三、K均值算法224四、自组织映射算法225五、主成分分析225六、聚类效果评估226第三节 模式识别227一、基因选择227二、降维处理229三、判别分析232四、遗失数据处理237第四节 微阵列表达数据分析实例237一、材料与方法238二、计算结果239三、讨论242四、问题与展望242参考文献243第八章 基因相互作用与贝叶斯网路245第一节 基因的表达调控245一、RNA结构调控和剪接编辑调控模型246二、启动子调控和操纵子调控模型247三、感受器应答调控模型249四、功能基因组的基因表达249第二节 基因相互关係网路251一、基因表达数据採集和表达模式分析251二、基因相互关係的一般统计分析框架257三、建立基因调控网路的数学模型259四、基因网路模型分析260五、基因网路的实际套用262第三节 基因相互作用的贝叶斯网路模型266一、贝叶斯网路266二、基于贝叶斯网路的基因相互关係模型及算法实现273 三、贝叶斯调控网路在疾病研究中的套用和前景276参考文献276索引278