文章插图
蛋白质摺叠【蛋白质摺叠】蛋白质的基本单位为胺基酸 , 而蛋白质的一级结构指的就是其胺基酸序列 , 蛋白质会由所含胺基酸残基的亲水性、疏水性、带正电、带负电等特性通过残基间的相互作用而摺叠成一立体的三级结构 。虽然蛋白质可在短时间中从一级结构摺叠至立体结构 , 研究者却无法在短时间中从胺基酸序列计算出蛋白质结构 , 甚至无法得到準确的三维结构 。因此 , 研究蛋白质摺叠的过程 , 可以说是破译“第二遗传密码”——摺叠密码(folding code)的过程 。
基本介绍中文名:蛋白质摺叠
基本单位:胺基酸
特点:亲水性、疏水性、带正电
理论模型:框架模型、疏水塌缩模型等
前言结构决定功能 , 仅仅知道基因组序列并不能使我们充分了解蛋白质的功能 , 更无法知道它是如何工作的 。蛋白质可凭藉相互作用在细胞环境(特定的酸硷度、温度等)下自己组装自己 , 这种自我组装的过程被称为蛋白质摺叠 。蛋白质摺叠问题被列为“21世纪的生物物理学”的重要课题 , 它是分子生物学中心法则尚未解决的一个重大生物学问题 。从一级序列预测蛋白质分子的三级结构并进一步预测其功能 , 是极富挑战性的工作 。研究蛋白质摺叠 , 尤其是摺叠早期过程 , 即新生肽段的摺叠过程是全面的最终阐明中心法则的一个根本问题 , 在这一领域中 , 近年来的新发现对新生肽段能够自发进行摺叠的传统概念做了根本的修正 。这其中 , X射线晶体衍射和各种波谱技术以及电子显微镜技术等发挥了极其重要的作用 。第十三届国际生物物理大会上 , Nobel奖获得者Ernst在报告中强调指出 , NMR用于研究蛋白质的一个主要优点在于它能极为详细的研究蛋白质分子的动力学 , 即动态的结构或结构的运动与蛋白质分子功能的关係 。目前的NMR技术已经能够在秒到皮秒的时间域上观察蛋白质结构的运动过程 , 其中包括主链和侧链的运动 , 以及在各种不同的温度和压力下蛋白质的摺叠和去摺叠过程 。蛋白质大分子的结构分析也不仅仅只是解出某个具体的结构 , 而是更加关注结构的涨落和运动 。例如 , 运输小分子的酶和蛋白质通常存在着两种构象 , 结合配体的和未结合配体的 。一种构象内的结构涨落是构象转变所必需的前奏 , 因此需要把光谱学 , 波谱学和X 射线结构分析结合起来研究结构涨落的平衡 , 构象改变和改变过程中形成的多种中间态 , 又如 , 为了了解蛋白质是如何摺叠的 , 就必须知道摺叠时几个基本过程的时间尺度和机制 , 包括二级结构(螺旋和摺叠)的形成 , 捲曲 , 长程相互作用以及未摺叠肽段的全面崩溃 。多种技术用于研究次过程 , 如快速核磁共振 , 快速光谱技术(萤光 , 远紫外和近紫外圆二色) 。
文章插图
研究概况在生物体内 , 生物信息的流动可以分为两个部分:第一部分是存储于DNA序列中的遗传信息通过转录和翻译传入蛋白质的一级序列中 , 这是一维信息之间的传递 , 三联子密码介导了这一传递过程;第二部分是肽链经过疏水塌缩、空间盘曲、侧链聚集等摺叠过程形成蛋白质的天然构象 , 同时获得生物活性 , 从而将生命信息表达出来;而蛋白质作为生命信息的表达载体 , 它摺叠所形成的特定空间结构是其具有生物学功能的基础 , 也就是说 , 这个一维信息向三维信息的转化过程是表现生命活力所必需的 。自从20世纪60年代 , Anfinsen基于还原变性的牛胰RNase在不需其他任何物质帮助下 , 仅通过去除变性剂和还原剂就使其恢复天然结构的实验结果 , 提出了“多肽链的胺基酸序列包含了形成其热力学上稳定的天然构象所必需的全部信息”的“自组装学说”以来 , 随着对蛋白质摺叠研究的广泛开展 , 人们对蛋白质摺叠理论有了进一步的补充和扩展 。Anfinsen的“自组装热力学假说”得到了许多体外实验的证明 , 的确有许多蛋白在体外可进行可逆的变性和复性 , 尤其是一些小分子量的蛋白 , 但是并非所有的蛋白都如此 。而且由于特殊的环境因素 , 体内蛋白质的摺叠远非如此 。体内蛋白质的摺叠往往需要有其他辅助因子的参与 , 并伴随有ATP的水解 。因此 , Ellis 于1987年提出了蛋白质摺叠的“辅助性组装学说” 。这表明蛋白质的摺叠不仅仅是一个热力学的过程 , 显然也受到动力学的控制 。有的学者基于有些相似胺基酸序列的蛋白质具有不同的摺叠结构 , 而另外一些不同胺基酸序列的蛋白质在结构上却相似的现象 , 提出了mRNA二级结构可能作为一种遗传密码从而影响蛋白质结构的假说 。但目前为止 , 该假说尚没有任何实验证据 , 只有一些纯数学论证[3] 。那幺 , 蛋白质的胺基酸序列究竟是如何确定其空间构象的呢?围绕这一问题科研人员已进行了大量出色的工作 , 但迄今为止我们对蛋白质的摺叠机制的认识仍是不完整的 , 甚至有些方面还存在着错误的观点 。在这方面作出重要贡献的典型研究实例是美国C.B.安芬森小组关于牛胰核糖核酸酶的变性和复性的研究 。牛胰核糖核酸酶含有124个胺基酸残基 , 由8个巯基配对组成4对二硫键 。可以计算出酶分子中8个巯基组成4对二硫键的可能方式有105种 , 这就提供了一个定量估算复性重组的指标 。在温和的硷性条件下 , 8摩尔的浓脲和大量巯基乙醇能使四对二硫键完全还原 , 整个分子变为无规则捲曲状 , 酶分子变性 。透析去除脲 , 在氧的存在下 , 二硫键重新形成 , 酶分子完全复性 , 二硫键中成对的巯基都与天然一样 , 复性分子可以结晶且具有与天然酶晶体相同的X射线衍射花样 , 从而证实 , 酶分子在复性过程中 , 不仅能自发地重新摺叠 , 而且只选择了105种二硫键可能配对方式中的一种 。理论模型框架模型(Framework Model)框架模型[4] 假设蛋白质的局部构象依赖于局部的胺基酸序列 。在多肽链摺叠过程的起始阶段 , 先迅速形成不稳定的二级结构单元; 称为“flickering cluster” , 随后这些二级结构靠近接触 , 从而形成稳定的二级结构框架;最后 , 二级结构框架相互拼接 , 肽链逐渐紧缩 , 形成了蛋白质的三级结构 。这个模型认为即使是一个小分子的蛋白也可以一部分一部分的进行摺叠 , 其间形成的亚结构域是摺叠中间体的重要结构 。塌缩模型(Hydrophobic Collapse Model)在疏水塌缩模型[5]中 , 疏水作用力被认为是在蛋白质摺叠过程中起决定性作用的力的因素 。在形成任何二级结构和三级结构之前首先发生很快的非特异性的疏水塌缩 。粘合机制(Diffusion-Collision-Adhesion Model)该模型认为蛋白质的摺叠起始于伸展肽链上的几个位点 , 在这些位点上生成不稳定的二级结构单元或者疏水簇 , 主要依靠局部序列的进程或中程(3-4个残基)相互作用来维繫 。它们以非特异性布朗运动的方式扩散、碰撞、相互黏附 , 导致大的结构生成并因此而增加了稳定性 。进一步的碰撞形成具有疏水核心和二级结构的类熔球态中间体的球状结构 。球形中间体调整为緻密的、无活性的类似天然结构的高度有序熔球态结构 。最后无活性的高度有序熔球态转变为完整的有活力的天然态 。生长模型(Nuclear-Condensation-Growth Model)根据这种模型 , 肽链中的某一区域可以形成“摺叠晶核” , 以它们为核心 , 整个肽链继续摺叠进而获得天然构象 。所谓“晶核”实际上是由一些特殊的胺基酸残基形成的类似于天然态相互作用的网路结构 , 这些残基间不是以非特异的疏水作用维繫的 , 而是由特异的相互作用使这些残基形成了紧密堆积 。晶核的形成是摺叠起始阶段限速步骤 。拼版模型(Jig-Saw Puzzle Model)此模型[9]的中心思想就是多肽链可以沿多条不同的途径进行摺叠 , 在沿每条途径摺叠的过程中都是天然结构越来越多 , 最终都能形成天然构象 , 而且沿每条途径的摺叠速度都较快 , 与单一途径摺叠方式相比 , 多肽链速度较快 , 另一方面 , 外界生理生化环境的微小变化或突变等因素可能会给单一摺叠途径造成较大的影响 , 而对具有多条途径的摺叠方式而言 , 这些变化可能给某条摺叠途径带来影响 , 但不会影响另外的摺叠途径 , 因而不会从总体上干扰多肽链的摺叠 , 除非这些因素造成的变化太大以致于从根本上影响多肽链的摺叠 。格点模型格点模型(也简称HP模型) , 最早是由Dill等人1989年提出的 。格点模型可分为二维模型和三维模型两类 。二维格点模型就是在平面空间中产生正交的单位长度的格线 , 每个胺基酸分子按在序列中排序的先后顺序依次放置到这些格线交叉点上 , 在序列中相邻的胺基酸分子放置在格点中时也必须相邻 , 即相邻胺基酸分子在格点模型中的距离为1 。但是需要注意的是 , 格线中的每个交叉点最多只能放置一个胺基酸分子 , 如果序列中的某个胺基酸分子已经放置在此位置上 , 则后序的胺基酸分子就不可以再放置在这个格点上 。如果在放置胺基酸分子的过程中出现当前所要放置的胺基酸分子没有位置可以放置了 , 那就说明该构型是不合理的 , 需要重新放置 。三维格点模型和二维格点模型相似 , 它是在三维空间中产生的单位长度的立体格线 。格点中放置胺基酸分子的方法和二维的相同 , 但在二维格点模型中放置胺基酸分子时除了序列前两个胺基酸分子外最多只有三个方向可以选择 , 而在三维格点模型中複杂度提高了很多 , 放置胺基酸分子最多可以有五个方向可选 。分子伴侣1978 年 , Laskey 在进行组蛋白和DNA 在体外生理离子强度实验时发现 , 必须要有一种细胞核内的酸性蛋白———核质素(nucleoplasmin) 存在时 , 二者才能组装成核小体 , 否则就发生沉澱 。据此Laskey 称它为“分子伴侣” 。分子伴侣是指能够结合和稳定另外一种蛋白质的不稳定构象 , 并能通过有控制的结合和释放 , 促进新生多肽链的摺叠、多聚体的装配或降解及细胞器蛋白的跨膜运输的一类蛋白质 [10 , 11] 。分子伴侣是从功能上定义的 , 凡具有这种功能的蛋白质都是分子伴侣 , 它们的结构可以完全不同 。这一概念目前已延伸到许多蛋白质 , 现已鉴定出来的分子伴侣主要属于三类高度保守的蛋白质家族[12]:stress 90 family、stress 70 family、stress 60 family 。其中stress 60 family存在于真核生物的线粒体(在哺乳动物中称为Hsp58)、叶绿体(称为cpn60)中 , 在原核生物的细胞质中 , 它被称为GroEL 。意义蛋白质摺叠机制的阐明将揭示生命体内的第二套遗传密码 , 这是它的理论意义 。蛋白质摺叠的研究 , 比较狭义的定义就是研究蛋白质特定三维空间结构形成的规律、稳定性和与其生物活性的关係 。在概念上有热力学的问题和动力学的问题;蛋白质在体外摺叠和在细胞内摺叠的问题;有理论研究和实验研究的问题 。这里最根本的科学问题就是多肽链的一级结构到底如何决定它的空间结构?既然前者决定后者 , 一级结构和空间结构之间肯定存在某种确定的关係 , 这是否也像核苷酸通过“三联密码”决定胺基酸顺序那样有一套密码呢?有人把这构想的一级结构决定空间结构的密码叫作“第二遗传密码” 。如果说“三联密码”已被破译而实际上已成为明码 , 那幺破译“第二遗传密码”正是“蛋白质结构预测”从理论上最直接地去解决蛋白质的摺叠问题 , 这是蛋白质研究最后几个尚未揭示的奥秘之一 。“蛋白质结构预测”属于理论方面的热力学问题 。就是根据测得的蛋白质的一级序列预测由Anfinsen原理决定的特定的空间结构 。蛋白质胺基酸序列 , 特别是编码蛋白质的核苷酸序列的测定现在几乎已经成为常规技术 , 从互补DNA(cDNA)序列可以根据“三联密码”推定胺基酸序列 , 这些在上一世纪获得重大突破的分子生物学技术 , 大大加速了蛋白质一级结构的测定 。目前蛋白质资料库中已经存有大约17万个蛋白的一级结构 , 但是测定了空间结构的蛋白大约只有1.2万个 , 这中间有许多是很相似的同源蛋白 , 而真正不同的蛋白只有1000多个 。随着人类基因组计画的胜利完成 , 解读了人类DNA的全序列 , 蛋白质一级结构的数据增长必定会出现爆炸的态势 , 而空间结构测定的速度远远滞后 , 因此二者之间还会形成更大的距离 , 这就更需要进行蛋白质结构的预测 。前景同时 , 它还存在重要的潜在套用前景 , 例如以下几个方面:包涵体复性▲利用DNA重组技术可以将外源基因导入宿主细胞 。但重组基因的表达产物往往形成无活性的、不溶解的包涵体 。摺叠机制的阐明对包涵体的复性会有重要帮助 。蛋白质▲DNA重组和多肽合成技术的发展使我们能够按照自己的意愿设计较长的多肽链 。但由于我们无法了解这一多肽将摺叠为何种构象 , 从而无法按照自己意愿设计我们需要的、具有特定功能的蛋白质 。致病机理▲许多疾病 , 如阿兹海默症(Alzheimer's) , 疯牛病(Mad Cow,BSE) , 可传播性海绵状脑病(CJD) , 肌萎缩性脊髓侧索硬化症(ALS) , 还有帕金森氏症(Parkinson's)等正是由于一些细胞内的重要蛋白发生突变 , 导致蛋白质聚沉或错误摺叠而造成的 。因此 , 深入了解蛋白质摺叠与错误摺叠的关係对于这些疾病的致病机制的阐明以及治疗方法的寻找将大有帮助 。揭示功能▲基因组序列的发展使我们得到了大量的蛋白质序列 , 结构信息的获得对于揭示它们的生物学功能是十分重要的 。依靠现有手段(X-ray晶体衍射、NMR及电镜)测定蛋白质的结构需要较长的时间 , 因此结构解析的步伐已落后于发现新蛋白的步伐 。而结构预测的方法虽然速度较快 , 但可靠性并不高 , 只有当我们对于维持蛋白质结构 , 驱动蛋白质摺叠的理化因素更为了解 , 这一方法才可能有根本的改进 。另外 , 我们对于蛋白质相互作用、配体与蛋白质的作用等结构与功能关係的研究也有赖于蛋白质摺叠机制的阐明 。摺叠病人们对由于基因突变造成蛋白质分子中仅仅一个胺基酸残基的变化就引起疾病的情况已有所了解 , 即所谓“分子病” , 如地中海镰刀状红血球贫血症就是因为血红蛋白分子中第六位的谷氨酸突变成了颉氨酸 。现在则发现蛋白质分子的胺基酸序列没有改变 , 只是其结构或者说构象有所改变也能引起疾病 , 那就是所谓“构象病” , 或称“摺叠病” 。大家都知道的疯牛病 , 它是由一种称为Prion的蛋白质的感染引起的 , 这种蛋白质也可以感染人而引起神经系统疾病 。在正常机体中 , Prion是正常神经活动所需要的蛋白质 , 而致病Prion与正常Prion的一级结构完全相同 , 只是空间结构不同 。这一疾病的研究涉及到许多生物学的基本问题 。一级结构完全相同的蛋白质为什幺会有不同的空间结构 , 这与Anfinsen原理是否矛盾?显然这里有蛋白质的能量和稳定性问题 。从来认为蛋白结构的变化来自于序列的变化 , 而序列的变化来自于基因的变化 , 生命信息从核酸传递到蛋白 。而致病Prion的信息已被诺贝尔奖获得者普鲁辛纳证明不是来自基因的变化 , 致病蛋白Prion导致正常蛋白Prion转变为致病的摺叠状态是通过蛋白分子间的作用而感染!这种相互作用的本质和机制是什幺?仅仅改变了摺叠状态的分子又如何导致严重的疾病?这些问题都不能用传统的概念给予满意的解释 , 因此在科学界引起激烈的争论 , 有关研究的强度和竞争性也随之大大增强 。由于蛋白质摺叠异常而造成分子聚集甚至沉澱或不能正常转运到位所引起的疾病还有老年性痴呆症、囊性纤维病变、家族性高胆固醇症、家族性澱粉样蛋白症、某些肿瘤、白内障等等 。由于分子伴侣在蛋白质摺叠中至关重要的作用 , 分子伴侣本身的突变显然会引起蛋白质摺叠异常而引起摺叠病 。随着蛋白质摺叠研究的深入 , 人们会发现更多疾病的真正病因和更针对性的治疗方法 , 设计更有效的药物 。现在发现有些小分子可以穿越细胞作为配体与突变蛋白结合 , 从而使原已失去作战能力的突变蛋白逃逸“蛋白质质量控制系统”而“带伤作战” 。这种小分子被称为“药物分子伴侣” , 有希望成为治疗“摺叠病”的新药 。新生肽的摺叠问题或蛋白质摺叠问题不仅具有重大的科学意义 , 除了上面提到的在医学上的套用价值外 , 在生物工程上具有极大的套用价值 。基因工程和蛋白工程已经逐渐发展成为产值以数十亿美元计的大产业 , 进入21世纪后 , 还将会有更大的发展 。但是当前经常遇到的困难 , 是在简单的微生物细胞内引入异体DNA后所合成的多肽链往往不能正确摺叠成为有生物活性的蛋白质而形成不溶解的包含体或被降解 。这一“瓶颈”问题的彻底解决有待于对新生肽链摺叠更多的认识 。