红外光谱技术在蛋白质动态研究中的进展
doi: 10.11972/j.issn.1672-8785.2026.01.006
钟佳佳 , 周晓洁 , 俞文杰 , 谢鑫成 , 唐雨钊
中国科学院上海高等研究院国家蛋白质科学研究(上海)设施,上海 201210
Advances in Infrared Spectroscopy for Protein Dynamics Research
ZHONG Jia-jia , ZHOU Xiao-jie , YU Wen-jie , XIE Xin-cheng , TANG Yu-zhao
National Facility for Protein Science in Shanghai, Shanghai Advanced Research Institute, Chinese Academy of Sciences, Shanghai 201210, China
摘要
蛋白质动态分析是理解生物功能的核心。红外光谱技术凭借其独特的时间分辨率和结构敏感性,已成为研究蛋白质动态过程的重要工具。本文系统综述了红外光谱技术在蛋白质动态结构分析中的基本原理、前沿技术及应用。该技术的时间分辨能力已实现从飞秒到毫秒级的全时间尺度覆盖,可捕捉蛋白质超快弛豫到构象重排的完整动态过程。二维红外光谱技术则进一步提升了光谱分辨率,增强了对复杂蛋白质体系的解析能力。红外光谱技术已被成功应用于蛋白质折叠、配体结合、膜蛋白动力学研究等多个领域,特别是在淀粉样纤维折叠机制、血红素蛋白配体结合、膜蛋白质子传递等关键生物学过程中取得了重要进展。未来,随着新型红外探针的开发、人工智能技术的融合以及仪器方法的创新,红外光谱技术将在蛋白质动态分析领域展现出更大的应用潜力。
Abstract
Protein dynamics analysis is central to elucidating biological functions. Owing to its unique combination of temporal resolution and structural sensitivity, infrared spectroscopy has emerged as a pivotal tool for investigating protein dynamical processes. This review systematically summarizes the fundamental principles, cutting-edge technologies, and practical applications of infrared spectroscopy in the analysis of protein dynamic structures. The temporal resolution capability of infrared spectroscopy has achieved full temporal scale coverage, ranging from the femtosecond to the millisecond level. This capability enables the capture of complete dynamic processes of proteins, spanning from ultrafast relaxation to conformational rearrangement. Two-dimensional infrared spectroscopy further improves spectral resolution and enhances the analytical capacity for complex protein systems. Infrared spectroscopy has been successfully applied to multiple research fields, including protein folding, ligand binding, and membrane protein dynamics. Notably, it has yielded significant progress in the investigation of critical biological processes such as the folding mechanism of amyloid fibrils, ligand binding of heme proteins, and proton transfer of membrane proteins. In the future, with the development of novel infrared probes and the integration of artificial intelligence technologies, infrared spectroscopy will exhibit greater application potential in the field of protein dynamics analysis.
0 引言
人们对蛋白质的生物物理学理解,已从单一的静态结构跨越到由层级能量图所描绘的多构象互变体系[1]。蛋白质的运动形式涵盖了局域的化学键旋转到整体的亚基移动,时间尺度跨越了飞秒到秒乃至更长。其动力学特征横跨飞秒-皮秒级的氢键涨落与溶剂重排,数十皮秒级的氨基酸侧链运动,到纳秒-毫秒级的二级结构转变与扩散,毫秒-秒级的分子间相互作用、大规模构象变化及结构域重排,进一步延伸至分钟至小时级的分子间聚集与级联反应[2]。蛋白质特定区域结构对功能的贡献各不相同,较大尺度的主链运动在蛋白质错误折叠和别构调节中起着核心作用,而侧链作为进化压力的主要作用位点,通过微小的化学差异,精细调控蛋白质的生物物理特性[3]
红外光谱和核磁共振波谱是两种常见的用于分子结构分析的方法。红外光谱通过捕捉化学键的振动频率来分析分子结构,核磁共振波谱则通过检测原子核自旋频率来解析分子信息。红外光谱的时间分辨尺度要比核磁共振波谱高6个数量级,在快速动态变化的研究中具有优势[4]。在通道视紫红质蛋白的研究中,时间分辨红外光谱在皮秒时间尺度上捕捉到了视黄醛分子光异构化过程中C-C伸缩振动模式产生的瞬态信号,揭示其初始反应动力学。这一快速化学过程远超核磁共振的秒级时间分辨极限[5]。此外,核磁共振波谱技术虽然能以原子级分辨率解析蛋白质的动态变化过程,但对大分子量蛋白的灵敏度和分辨率较低[6]。结构生物学中的X射线衍射技术则需要蛋白质样品能形成高质量的晶体,对于无法结晶的蛋白质失去了表征能力[7]。而红外光谱技术可在溶液环境中获取蛋白质的二级结构信息,且对蛋白质的分子量没有特殊要求,尤其适用于非晶态、大分子量蛋白质的动态研究。β淀粉样蛋白聚集过程与阿尔兹海默症有极大的关联,该体系难以形成单晶,使得X射线衍射技术受限;衰减全反射红外光谱技术则可在蛋白溶液中捕捉到β-折叠特征峰的演变以及寡聚体中间态的形成,实现该类体系的动态解析[8]
尽管红外光谱具有众多优势,但是也存在明显不足。水(H2O)在中红外波段的强吸收是用红外光谱研究蛋白质结构的一个巨大挑战。H2O中O-H键的弯曲振动在1700~1600 cm-1处的强吸收与蛋白质中酰胺I谱带严重重叠,从而干扰了蛋白质二级结构的解析。由于重水(D2O)中O-D键的弯曲振动会移动至1200 cm-1,用D2O替代溶剂中的H2O可以有效避免谱带重叠的问题,但需充分考虑氢氘交换对蛋白质构象的潜在影响[9]。此外,若光程超过10 μm,甚至在更短光程条件下,会产生水饱和吸收现象。衰减全反射技术和微流控芯片技术可有效减小红外光在水中的光程,从而避免水的饱和吸收[10-11]
红外光谱具有从飞秒到毫秒的时间分辨尺度,涵盖了大部分蛋白质结构的运动时间尺度。现代时间分辨红外光谱技术也呈现出蓬勃的发展趋势,已被广泛用于蛋白质折叠、配体结合、酶催化以及膜蛋白动力学研究。本文将综述红外光谱的基本原理、时间分辨红外光谱技术及其在蛋白质动态研究中的应用。
1 基于红外光谱的蛋白质结构探测原理
红外吸收的本质是分子在红外辐射激发下振动或转动能级发生跃迁的物理过程。当红外光照射分子时,其能量可被特定的化学键或官能团选择性吸收,引发振动跃迁。分子振动与化学结构紧密关联,使得红外光谱对分子的质子化状态、氧化还原、键级及键构象变化具有高度敏感性。振动频率、吸收强度、谱带宽度等特征参数,会受到分子内及分子间非共价相互作用的影响,如氢键作用、偶极与偶极相互作用以及局部电场效应等[12-13]。蛋白质分子具有多个振动跃迁吸收峰,主要涉及主链肽键的振动、侧链振动和外源性非天然氨基酸探针的振动(见表1)。
1 蛋白质主要分子振动模式及峰位[14,16-17]
Table 1 Major molecular vibrational modes and peak positions of proteins [14,16-17]
注:ν为伸缩振动,νas为反对称伸缩振动,δ为面内弯曲振动
主链肽键的酰胺I带(1700~1600 cm-1)主要涉及C=O伸缩振动和少量的C-N伸缩振动及N-H弯曲振动,其对分子几何形状和氢键模式的微小变化极为敏感,常被用于分析蛋白质的二级结构[14]。蛋白质的二级结构是肽链主链原子通过分子内氢键形成的局部空间规整(或非规整)构象,常见的二级结构包括α-螺旋、β-折叠和无规卷曲等。氢键结合模式以及空间构象的差异导致酰胺I带发生不同程度的位移。α-螺旋通常位于1655~1650 cm-1,β-折叠位于1640~1620 cm-1和1690~1670 cm-1,无规卷曲则位于1650~1640 cm-1。酰胺II带(1580~1520 cm-1)主要源于N-H弯曲振动和C-N 伸缩振动,对氢键和骨架构象变化敏感,但信号强度弱于酰胺I带。被氘化后的蛋白酰胺II带会红移至1480~1450 cm-1。利用该特性可研究蛋白质二级结构的稳定性和折叠动力学[15]。酰胺A带(3350~3200 cm-1)对应N-H的伸缩振动,该振动频率对氢键作用高度敏感。
侧链基团也能够提供丰富的结构信息。酪氨酸在1270~1235 cm-1处有特征峰,色氨酸在1435~1412 cm-1处有吸收。半胱氨酸的S-H伸缩振动发生在2600~2500 cm-1之间,其对氢键环境敏感,可作为构象变化的光谱探针[16-18]。羧基(COO-)和氨基(NH3+)的振动模式能够直接反映质子化状态,对理解酶催化、信号转导等过程中的质子传递机制具有重要意义[19]。天然氨基酸侧链的特征吸收峰通常位于酰胺带或指纹区,有可能导致光谱重叠严重而分析困难。为克服这个局限,通过遗传密码子扩展技术或化学修饰引入氰基(-C≡N,2280~2210 cm-1)、叠氮基(-N=N=N,2140~2080 cm-1)以及硫氰酸酯基(-S-C≡N,2160~2040 cm-1)等基团。这些非天然氨基酸的振动频率通常位于2800~1800 cm-1,可避免其他吸收峰的干扰,同时可以用作监测蛋白质折叠、局部静电场和溶剂化动力学的灵敏探针[20]。抑制剂、辅因子等配体的结合会诱导蛋白质局部构象重排,因此配体振动信号与蛋白质官能团的振动耦合也可用作解析蛋白质内部结构变化的光谱探针。
2 时间分辨红外光谱技术
时间分辨红外光谱技术是研究蛋白质动态过程的核心工具,关键前提在于通过光脉冲、pH值变化、温度跃变等外部触发使反应体系同步变化。时间分辨红外光谱技术已实现了从飞秒到毫秒全时间尺度覆盖,使研究人员能够捕捉蛋白质飞秒-皮秒超快的振动弛豫以及微秒-毫秒慢的构象重排完整动态过程。基于傅里叶变换红外(Fourier Transform Infrared, FTIR)光谱仪的快速扫描和步进扫描技术,可捕捉蛋白质结构变化在纳秒至毫秒时间尺度上的动力学过程。该技术常与差分红外光谱分析方法联用,以监测蛋白质特定振动频率的变化特征。差分光谱通过测量蛋白质两种状态间的吸收差异,从复杂、重叠的红外吸收光谱中提取特定谱带的变化信息[19,21-22]。基于泵浦-探测技术的二维红外光谱技术则可实现飞秒尺度的蛋白质动态研究。
2.1 触发方式
同步触发是时间分辨测试的关键前提,常见的触发方式有光脉冲激发、快速混合和温度跃变等。
光驱动的质子泵蛋白细菌视紫红质(Bacteriorhodopsin, BR) [23-24]或含有发色团的光合反应中心[25-26]。在这些生物体系中,特定波长的脉冲激光可直接激活发色团,引发辅因子的异构化或氧化还原反应,进而启动后续一系列反应。此外,脉冲激光也可使一些包裹有生物活性分子的笼状化合物发生光解反应,快速释放活性分子而触发后续的生物化学过程[27-29]
停流和连续流技术可实现蛋白质溶液、配体溶液、变性剂等快速混合以触发蛋白质结构的变化。停流装置可将两组或多组液体同时注入观察室;待样品充满后,瞬间关闭截止阀,使流动骤停;红外光谱仪即刻同步记录光谱变化。停流技术受限于装置的死时间,通常只适用于毫秒级的蛋白质动态研究[30-31]。连续流技术通过微流控芯片技术弥补这个缺陷,可实现微秒级的混合。连续流微流控芯片装置中,两种待混合溶液形成层流模式。由于层厚较薄,反应物分子可快速从一种溶液扩散到另一种溶液中实现微秒的快速混合[32]
温度跃变是一种通过激光脉冲瞬间加热溶剂(通常激发水的泛频振动)来触发分子体系偏离平衡态的技术。传统的纳秒脉冲激光触发虽然升温极快,但受限于热扩散,观测窗口局限在毫秒以内[33]。强度可调的连续波激光加热技术,通过精密的波形控制来抵消热耗散,可实现长时间的恒温观测,用于捕捉蛋白质在毫秒至秒级时间范围内的大尺度重排等生物过程[34]
2.2 快速扫描红外光谱技术
快速扫描红外光谱技术适合于毫秒至秒时间尺度的动态过程监测,且特别适用于不可逆过程或者单次发生的变化监测。在快速扫描模式下,动镜被驱动进行高速的匀速运动。动镜每完成一次行程,检测器就记录下一张完整的干涉图。通过快速连续地记录干涉图,经傅里叶变换就可获得一系列随时间变化的红外光谱。快速扫描模式的时间分辨率取决于动镜的扫描速度和光谱分辨率。降低光谱分辨率可进一步缩短单张光谱的获取时间。时间分辨快速扫描 FTIR技术首次用于蛋白质研究是在室温条件下获得了细菌视紫红质光循环中间体的差分红外光谱[35]
2.3 步进扫描红外光谱技术
步进扫描红外光谱技术适用于纳秒至毫秒时间尺度的蛋白质动态研究。快速扫描模式受限于动镜的移动速度,通常只能分辨毫秒级的变化。通过改变干涉仪的工作模式,可将时间分辨率提升至纳米级。在步进扫描模式下,动镜不是连续移动,而是移动到一个特定的光程差位置后停下来。此时,通过外部扰动触发蛋白质反应,同时探测器开始记录下该位置光强随时间的变化情况。完成一次记录后,动镜移动到下一个干涉位置,重复上述过程直到走完整个干涉图所需的行程。
1 二维红外光谱技术的基本原理图
Fig. 1 Basic principle diagram of two-dimensional infrared spectroscopy technology
采集到的原始数据是每个特定光程差位置上信号随时间的衰减曲线。为得到一张完整的光谱,需要进行数据重组。在所得到的三维数据矩阵中提取出所有在同一时刻记录的强度数据点,再将该时刻动镜不同位置的数据点连接起来,就构成了一张在这个时刻的完整干涉图。对重构的干涉图进行傅里叶变换,可得到该时刻的红外光谱图;对所有的时间点重复此操作,可得到一系列随时间变化的红外光谱图。
因此,步进扫描的时间分辨率由探测器的响应速度和数据采集卡的带宽所决定。配合液氮制冷的碲镉汞光伏型探测器,时间分辨率可到纳秒级。但是,其原理决定了被激发的反应过程必须是高度重复可逆的。
2.4 基于泵浦-探测的二维红外光谱技术
二维红外光谱技术结合了时间分辨与频率分辨的优势,利用多束超快红外激光脉冲,在两个频率维度上同时探测分子响应,从而揭示不同振动模式之间的耦合与能量转移[36]。随着超快红外激光技术的发展,基于泵浦-探测的二维红外光谱技术,已成为解析蛋白质动态结构的关键手段。该技术能够有效捕捉从皮秒到毫秒时间跨度的蛋白质构象变化及振动耦合信息。
基于三阶非线性光学原理,泵浦光选择性激发样品的特定分子振动,使其从基态跃迁至激发态;探测光则在不同延迟时间后记录分子在激发态下的响应,从而获得振动模式的耦合、能量转移以及分子与周围环境的相互作用等。如图1所示,两束相互独立却相干的泵浦脉冲光先后作用于样品:第一束泵浦脉冲光激发分子的特定振动;第二束泵浦脉冲光在延迟时间t1后到达样品,进一步调制分子的振动和耦合。经延迟时间t2(t2为泵浦脉冲光与探测脉冲光的时间间隔)后,探测脉冲光到达样品,记录分子在激发态下的响应。t2可通过机械延迟线精确控制。通过傅里叶变换,可分别得到以激发频率和探测频率为横纵坐标的二维红外谱图[4]。过去二十年以来,二维红外光谱技术的仪器设备和方法学取得了显著进步,为研究不同的科学问题提供了有力的技术支撑[37-38]
二维红外光谱图中的对角峰对应分子自身特定的振动模式,与一维红外光谱中的吸收峰对应;交叉峰则是二维红外光谱特有的信号,峰位置和强度可定量反映不同振动模式间的耦合强度。蛋白质多种频率相近的振动模式在一维光谱中通常会高度重叠,导致分辨困难。二维红外光谱可实现重叠吸收带的解卷积,提升光谱分辨率[3]。结合延迟时间依赖的谱峰强度衰减可区分均匀和非均匀展宽,用于解析蛋白质所处的微环境以及不同构象转化动力学。泵浦-探测技术所具备的飞秒至皮秒级时间分辨能力,使二维红外光谱可实时追踪体系内分子的动态演化过程,为解析生物分子功能提供了直观的动态表征手段。
3 蛋白质动态研究中的应用
3.1 蛋白质折叠与聚集动态研究
二维红外光谱技术具有飞秒至毫秒级的时间分辨率,借助酰胺I带振动信号的构象依赖性以及同位素特异性标记技术,可有效分离目标氨基酸残基的振动信号,实现蛋白质折叠与聚集过程中残基级分辨率的结构动态追踪。这一技术已成为解析淀粉样病变相关蛋白错误折叠机制的核心手段。
在淀粉样蛋白聚集研究中,与2型糖尿病发病机制相关的人胰岛淀粉样多肽(human Islet Amyloid Polypeptide, hIAPP)的聚集机制一直是研究热点,其聚集过程中瞬态中间体的结构特征难以通过静态技术捕获。Zanni M T课题组通过13C=18O特异性标记单个氨基酸残基,结合二维红外光谱技术将目标残基的信号从主链整体信号中分离出来,捕捉到了聚集过程中的瞬态中间体结构,并解析了聚集滞后阶段与成熟纤维阶段的结构差异[39]。如图2所示,在滞后阶段,F23的标记峰出现在1587 cm-1处,对应平行β-折叠的特征信号;而在成熟纤维阶段,该特征峰强度减弱且峰形宽化,提示F23残基所处区域转变为无序构象。这一发现直接证实了FGAIL区域在中间态和终态具有不同结构,为揭示蛋白质错误折叠和聚集的分子机制提供了关键的信息。
聚谷氨酰胺(polyQ)片段存在于多种蛋白中,其重复次数的异常扩展与多种神经退行性疾病(如亨廷顿病)相关。由于序列的均一性及其易于聚集形成淀粉样纤维的特性,polyQ肽段的结构和动力学研究面临较大困难。polyQ肽段形成淀粉样纤维时,其单体的排列方式存在两种主要模型:β-arc模型和β-turn模型。由于振动模式在纤维内高度离域,常规红外光谱技术无法区分这两种结构。研究者将12C和13C 标记的polyQ肽段(序列为K2Q24K2W)混合,共同组装成纤维。13C的标记导致酰胺I谱带频率移动,并使其振动模式仅局限于单体内部[40]。光谱研究结果结合分子动力学模拟,证实polyQ淀粉样纤维的主导结构为β-turn模型,并揭示了其高度协同的聚集机制。
3.2 配体结合及酶催化机制研究
配体结合与酶催化是蛋白质核心生物学功能的重要部分,其动态过程跨越飞秒至秒的时间尺度,涵盖配体的识别、结合、解离,以及酶活性中心的构象重排、底物转化等一系列分子事件。通过实时追踪上述动态过程的光谱变化,解析配体-蛋白相互作用模式及酶催化的微观调控机制。
作为一类重要的生物功能蛋白,血红素蛋白与NO、CO、O2等双原子分子的结合动力学决定了其生理功能。CO与游离血红素蛋白结合的能力非常强,但在肌红蛋白中该结合作用被明显抑制,这被认为具有重要的生理意义。传统光谱技术难以同时捕获配体结合态的取向信息与解离后的动态行为,而时间分辨偏振红外光谱技术的出现则有效解决了这一难题。研究者利用该技术,发现结合到血红素铁上的CO与血红素平面法线的夹角小于等于7°,形成几乎线性的Fe-C-O结构;而当CO从铁上解离后,会被捕获在一个血红素口袋内的停靠位点,其取向被约束在大致平行于血红素平面的方向上。由于结合态与解离态CO的取向近乎正交,CO从停靠位点重新结合受到抑制。这项溶液环境下的结果为理解血红素蛋白的配体选择性机制提供了关键动力学证据[41]
2 同位素标记的hIAPP结构与二维红外光谱数据[39]:(a) hIAPP纤维的序列结构;(b) hIAPP的核磁共振模型,其中β-折叠结构用黑色箭头标出,同位素标记位置用小圆点表示;(c)~(f) V17和F23组分在滞后相及平衡相下的二维红外光谱图以及对角线强度切片图
Fig. 2 Structure and two-dimensional infrared spectral data of isotopically labeled hIAPP [39]: (a) Sequence structure of hIAPP fibers; (b) NMR model of hIAPP, where β-sheet structures are marked with black arrows andisotopic labeling positions are indicated by small dots; (c)-(f) Two-dimensional infrared spectra and diagonalintensity slices of V17 and F23 components in the hysteresis and equilibrium phases
在混合溶剂体系中,溶剂环境对配体结合动力学的调控作用同样可通过时间分辨红外光谱解析。研究者以微过氧化物酶-8(Mp-8)为模型,研究了甘油/水混合溶液中光解后的NO与Mp-8再结合动力学[42]。通过追踪NO伸缩振动的瞬态吸收信号,可得到NO再结合的时间常数等动力学参数。NO与Mp-8在粘性溶液中的重新结合过程极为高效且迅速,其反应速率几乎不受溶液粘度的影响。该研究为溶剂环境调控蛋白-配体相互作用的机制提供了直接的光谱证据。
HemAT蛋白作为含血红素的氧传感器蛋白,其配体结合过程伴随构象转变:开放型A0构象(1967 cm-1)到闭合型A1构象(1925 cm-1)的转变。研究者结合步进扫描红外光谱技术揭示了CO配体在光解后与血红素铁重新结合的双相动力学特征,同时通过定点突变技术修饰远端(Y70、L92、T95)与近端(Y133)关键残基,系统探究了残基对配体结合动力学的调控作用。研究证实L92和T95作为配体进出通道的“门控开关”,调控配体和蛋白的结合速率;而近端Y133与H123之间的氢键网络则对结合过程的相数(单相/双相)和路径起决定性的调控作用[43]
3 细菌视紫红质中的光反应过程及质子传输途径[45]:(a)在细菌视紫红质中,主要发生从全反式结构向13-顺式结构的光异构化反应;(b)由细胞质侧向胞外区质子泵送的过程
Fig. 3 Photoreaction processes and proton transport pathways in bacterial rhodopsin [45]: (a) In bacterial rhodopsin, the photoisomerization reaction from all-trans structure to 13-cis structure mainly occurs; (b) The process of proton pumping from the cytoplasm to the extracellular region
酶的动态行为跨越了飞秒至秒级的时间尺度。虽然研究者对毫秒至秒级的慢速动态过程(如底物的结合)已有较充分的认知,但飞秒至皮秒时间尺度酶催化活性的调控机制仍不明确。二维红外光谱技术凭借其超高时间分辨率,已成为监测蛋白质周边水合层及离子动力学的关键技术。Wang L等人利用基因编码技术在一种铁依赖性的金属酶DddK的活性中心引入红外探针3-叠氮-L-酪氨酸(N3Y),观测了活性位点所处微环境在飞秒-皮秒时间尺度上的涨落[44]。通过频率-频率相关函数(FFCF)分析,发现酶的催化效率直接受控于活性中心水分子的受限程度,活性位点构象柔性及水分子受限环境对维持酶催化功能有重要作用。
3.3 膜蛋白动力学研究
细菌视紫红质作为嗜盐杆菌细胞膜上的光驱动质子泵,通过7个跨膜α螺旋来捕获光线。光照激发后伴随着视黄醛发色团由全反式异构化为13-顺式(见图3(a)),从而触发系列中间态(J、K、L、M、N、O)的产生。作为经典的研究体系,通过探测不同时间尺度的红外光谱变化来研究视黄醛、关键氨基酸残基构象变化以及质子转移动力学[45]
细菌视紫红质中的质子从细胞质侧穿过膜到达细胞外侧的路径如图3(b)所示[45]。图中同时标出了可被质子化的基团以及质子转移的顺序:(1)从Schiff碱转移到Asp85处;(2)质子释放;(3)质子从Asp96向Schiff碱转移;(4)质子被吸收;(5) Asp85将质子传递给质子释放基团。
4 细菌视紫红质光循环过程中1800~1000 cm-1信号强度随时间的变化情况[46]
Fig. 4 Changes in signal intensity over time at 1800-1000 cm-1 during the photocycle of bacterial rhodopsin [46]
通过步进扫描及差分光谱技术可揭示质子传递的分子路径及时序(见图4)。在L态到M态的转化过程中,1188 cm-1处的强度变化反映了Schiff碱的去质子化过程;1762 cm-1则表明Asp85发生了质子化;而1739 cm-1与1742 cm-1体现了Asp96所处环境的变化;1542 cm-1到1562 cm-1处的谱带位移,反映了L态到M态转化过程中C=C双键的振动模式所发生的变化[46]。在BR突变体D96N中,可清晰观察到质子从Schiff碱转移到Asp85的过程,以及随后从Asp96转移到去质子化Schiff碱的动力学过程[47]。D96N突变体光循环过程中具有独特的MN中间态,同时具有M态(Schiff碱去质子化)和N态(蛋白质构象)的特征。这表明在野生型中,蛋白质构象重排(向N态转变)可能在Schiff碱重新质子化之前就已开始[47]
Lorenz-Fonfria V A等人采用MES缓冲液及其氘代衍生物作为pH敏感振动探针,以6 μs 的时间分辨率追踪了质子释放与摄取的动力学,发现了与过去普遍接受的质子摄取机制不一致的证据[48]。在细胞质域区域存在一个质子摄取复合物,为质子传递提供中间载体。研究者通过pH依赖的光谱差异揭示了质子转移的动力学调控机制;同时,借助野生型与E194D、E204D突变体的差谱对比,验证了Glu194、Glu204 在维持水簇稳定性和质子转移路径中具有关键作用[49]
时间分辨红外光谱技术同样适用于其他视紫红质的光循环研究。通道视紫红质(Channelrhodopsin, ChR)是自然界中已知的唯一光门控离子通道,其离子通道活性依赖于视黄醛发色团的光异构化及其后续的光循环。红外光谱技术揭示了通道视紫红质变体(ChETA)纳秒级“预门控”的构象变化过程[50]。太阳视紫红质(Heliorhodopsin, HeR)是一个通过功能宏基因组学新发现的视紫红质蛋白[51],其光循环过程相对较慢,会依次形成K、M和O中间态。其中,O中间态寿命较长,被认为是传递信号或调节酶活性的潜在功能态。时间分辨红外光谱技术被用于探测HeR光循环过程中蛋白质二级结构的动态变化[52]。通过分析不同HeR变体(48C12和TaHeR)在M态和O态衰变过程中的光谱差异,发现位于跨膜螺旋3(TM3)的Ser112与跨膜螺旋4(TM4)的Asn138之间的关键氢键,对蛋白质结构动力学和光循环速率具有调控作用。
时间分辨红外光谱技术也被用于在高温(30~70 ℃)下研究嗜热菌视紫红质(Thermophilic Rhodopsin, TR)光循环中的质子协同转移反应机制[53]。D95作为质子受体,其质子化对应的特征谱带为1753 cm-1处的正峰;E106作为质子供体,其去质子化对应的特征谱带为1398 cm-1处的正峰。通过酰胺I带1697 cm-1和1628 cm-1的变化揭示质子转移过程中同步发生了转角到β-折叠的转变。结合奇异值分解(Singular Value Decomposition, SVD)和全局拟合分析,量化了不同温度下的反应动力学。
4 展望
尽管红外光谱技术在蛋白质动态分析中取得了显著进展,但仍面临光谱重叠、水峰干扰、定量分析精度等方面的挑战。随着新型红外探针的开发、人工智能技术的发展以及仪器方法的创新,这些挑战正在逐步得到解决。
基于同位素标记、非天然氨基酸嵌入等技术,蛋白质结构中引入特异性红外探针是提高红外光谱技术灵敏度和特异性的关键。目前,这些特异性红外探针已被广泛应用于蛋白质折叠机制解析、配体结合与催化过程监测、膜蛋白动态构象追踪等领域,实现了对蛋白质特定位点微环境变化与构象动态的实时追踪。红外探针的未来发展趋势是将进一步提升位点标记效率、信号区分度与空间分辨率。
人工智能技术在红外光谱数据解析、模式识别和结构预测等方面正在发挥重要的作用。已有研究者基于Transformer架构预训练模型,建立了模拟光谱与结构之间的关联,可从二维红外光谱中自动、快速预测蛋白质二级结构(螺旋、折叠、无规卷曲)的动态变化(准确率达90%以上),并适用于微秒到毫秒级折叠轨迹分析(见图5)[54]。采用DeepLabV3模型以及大量的蛋白质结构数据,可由二维红外光谱数据识别并预测蛋白质三维骨架结构,并通过迁移学习适配不同的蛋白质尺寸与温度条件[55]。未来发展趋势是将建立更大规模的蛋白质红外光谱数据库,为机器学习提供更丰富的训练数据,同时开发更先进的机器学习模型,提高对复杂光谱模式的识别能力。
5 预测蛋白质动态二级结构的工作流程[54]:(a)整个实验过程自上而下进行,包括构建二维红外光谱数据集、对模型进行预训练,将预训练得到的模型应用于蛋白质折叠轨迹的预测。Trp-cage结构中的 “螺旋部分” 以及WW结构域中的 “链状结构部分” 分别代表了蛋白质二级结构中这些构象成分所占的比例。(b) 在预训练数据集中,每个快照生成之前,相关蛋白质样本都会先经过分子动力学模拟,以此来生成二维红外光谱并确定其二级结构组成。(c)机器学习模型的详细架构
Fig. 5 Workflow for predicting the dynamic secondary structure of proteins [54]: (a) The entire experimentalprocess proceeds from top to bottom, including constructing a two-dimensional infrared spectroscopy dataset, pre-training the model, and applying the pre-trained model to predict protein folding trajectories. The "helicalpart" in the Trp-cage structure and the "chain-like structure part" in the WW domain represent the proportions of these conformational components in the protein secondary structure, respectively. (b) In the pre-training dataset, before each snapshot is generated, the relevant protein samples are first subjected to molecular dynamics simulations to generate two-dimensional infrared spectra and determine their secondary structure composition. (c) Detailed architecture of the machine learning model
仪器方法的创新将为用红外光谱研究蛋白质动态结构提供更强大的技术支撑。表面增强红外吸收光谱(Surface-Enhanced Infrared Absorption Spectrum, SEIRAS)具有显著的表面信号增强效应,可解决界面及膜蛋白动态结构研究中信号弱、水峰干扰大的问题,在微量蛋白的检测上具有广泛的应用前景。纳米红外光谱技术则将原子力显微镜的高空间分辨率与红外光谱的化学识别能力相结合,突破了红外光的衍射极限。该技术实现了纳米空间分辨尺度的红外光谱表征,为蛋白质结构研究提供了全新的技术手段。此外,微流控装置与红外光谱的联用,则可实现微量蛋白质在不同环境条件(如pH值、温度、浓度梯度)下的动态响应监测。
5 结束语
红外光谱在蛋白质动态研究中起着重要的作用。从基础原理到先进的技术方法,从传统的一维光谱到二维光谱,红外光谱技术正在不断突破自身局限,为理解蛋白质动态结构和功能提供理论依据。该技术具有从飞秒到毫秒的时间尺度,涵盖了蛋白质局域的化学键旋转到整体亚基移动的多尺度结构单元的运动。与其他表征技术相比,红外光谱技术具有高时间分辨特性以及可在溶液环境中获得蛋白质二级结构信息的能力。蛋白质的主链肽键、氨基酸侧链以及外源性的红外探针具有特定吸收谱带,能够反映构象变化、质子化状态和局部电场等微环境的改变。
现代时间分辨红外光谱技术包括基于傅里叶变换的毫秒级快速扫描模式、纳秒-微秒尺度的步进扫描模式以及基于泵浦-探测技术的飞秒二维红外光谱技术。通过光脉冲激发、快速混合和温度跃变等方式触发反应开始,同步进行时间分辨红外光谱采集。目前,红外光谱技术已被成功应用于蛋白质折叠与聚集动态研究、配体结合与酶催化机制解析以及膜蛋白动力学研究等多个领域,并在淀粉样纤维折叠机制、血红素蛋白配体结合、膜蛋白质子传递等关键生物学过程的研究中取得了重要进展。但是,红外光谱技术仍旧面临光谱重叠、水峰干扰、定量分析精度等方面的挑战。未来,随着新型红外探针的开发、人工智能技术在光谱数据解析上的融合以及仪器方法的创新,红外光谱技术将为蛋白质动态结构-功能的研究提供更强大的支撑。
1 二维红外光谱技术的基本原理图
Fig. 1 Basic principle diagram of two-dimensional infrared spectroscopy technology
2 同位素标记的hIAPP结构与二维红外光谱数据[39]:(a) hIAPP纤维的序列结构;(b) hIAPP的核磁共振模型,其中β-折叠结构用黑色箭头标出,同位素标记位置用小圆点表示;(c)~(f) V17和F23组分在滞后相及平衡相下的二维红外光谱图以及对角线强度切片图
Fig. 2 Structure and two-dimensional infrared spectral data of isotopically labeled hIAPP [39]: (a) Sequence structure of hIAPP fibers; (b) NMR model of hIAPP, where β-sheet structures are marked with black arrows andisotopic labeling positions are indicated by small dots; (c)-(f) Two-dimensional infrared spectra and diagonalintensity slices of V17 and F23 components in the hysteresis and equilibrium phases
3 细菌视紫红质中的光反应过程及质子传输途径[45]:(a)在细菌视紫红质中,主要发生从全反式结构向13-顺式结构的光异构化反应;(b)由细胞质侧向胞外区质子泵送的过程
Fig. 3 Photoreaction processes and proton transport pathways in bacterial rhodopsin [45]: (a) In bacterial rhodopsin, the photoisomerization reaction from all-trans structure to 13-cis structure mainly occurs; (b) The process of proton pumping from the cytoplasm to the extracellular region
4 细菌视紫红质光循环过程中1800~1000 cm-1信号强度随时间的变化情况[46]
Fig. 4 Changes in signal intensity over time at 1800-1000 cm-1 during the photocycle of bacterial rhodopsin [46]
5 预测蛋白质动态二级结构的工作流程[54]:(a)整个实验过程自上而下进行,包括构建二维红外光谱数据集、对模型进行预训练,将预训练得到的模型应用于蛋白质折叠轨迹的预测。Trp-cage结构中的 “螺旋部分” 以及WW结构域中的 “链状结构部分” 分别代表了蛋白质二级结构中这些构象成分所占的比例。(b) 在预训练数据集中,每个快照生成之前,相关蛋白质样本都会先经过分子动力学模拟,以此来生成二维红外光谱并确定其二级结构组成。(c)机器学习模型的详细架构
Fig. 5 Workflow for predicting the dynamic secondary structure of proteins [54]: (a) The entire experimentalprocess proceeds from top to bottom, including constructing a two-dimensional infrared spectroscopy dataset, pre-training the model, and applying the pre-trained model to predict protein folding trajectories. The "helicalpart" in the Trp-cage structure and the "chain-like structure part" in the WW domain represent the proportions of these conformational components in the protein secondary structure, respectively. (b) In the pre-training dataset, before each snapshot is generated, the relevant protein samples are first subjected to molecular dynamics simulations to generate two-dimensional infrared spectra and determine their secondary structure composition. (c) Detailed architecture of the machine learning model
1 蛋白质主要分子振动模式及峰位[14,16-17]
Table 1 Major molecular vibrational modes and peak positions of proteins [14,16-17]
Frauenfelder H, Sligar S G, Wolynes P G. The energy landscapes and motions of proteins [J]. Science, 1991, 254(5038): 1598-1603.
Hunt N T. Biomolecular infrared spectroscopy: making time for dynamics [J]. Chemical Science, 2024, 15(2): 414-430.
Tumbic G W, Hossan M Y, Thielges M C. Protein dynamics by two-dimensional infrared spectroscopy [J]. Annual Review of Analytical Chemistry, 2021, 14: 299-321.
郑俊荣. 二维红外光谱 [J]. 物理, 2010, 39(3): 162-183.
Zheng J R. 2D IR spectroscopy [J]. Physics, 2010, 39(3): 162-183.
Hedegård E D, Olsen J M H, Knecht S, et al. Polarizable embedding with a multiconfiguration short-range density functional theory linear response method [J]. The Journal of Chemical Physics, 2015, 142(11): 114113.
Karunanithy G, Shukla V K, Hansen D F. Solution-state methyl NMR spectroscopy of large non-deuterated proteins enabled by deep neural networks [J]. Nature Communications, 2024, 15(1): 5073.
Chayen N E, Saridakis E. Protein crystallization: from purified protein to diffraction-quality crystal [J]. Nature Methods, 2008, 5(2): 147-153.
Cerf E, Sarroukh R, Tamamizu-Kato S. Antiparallel β-sheet: a signature structure of the oligomeric amyloid β-peptide [J]. Biochemical Journal, 2009, 421(3): 415-423.
Yang H, Yang S, Kong J. Obtaining information about protein secondary structures in aqueous solution using Fourier transform IR spectroscopy [J]. Nature Protocols, 2015, 10(3): 382-396.
Tintor D, Ninkovic′ K, Miloševic′ J, et al. Gaining insight into protein structure via ATR-FTIR spectroscopy [J]. Vibrational Spectroscopy, 2024, 134: 103726.
Suryana M, Produit T, Yang H, et al. Infrared imaging with visible light in microfluidic devices: the water absorption barrier [J]. Analyst, 2025, 150(2): 405-413.
Fried S D, Boxer S G. Measuring electric fields and noncovalent interactions using the vibrational Stark effect [J]. Accounts of Chemical Research, 2015, 48(4): 998-1006.
Nibbering E T J, Elsaesser T. Ultrafast vibrational dynamics of hydrogen bonds in the condensed phase [J]. Chemical Reviews, 2004, 104(4): 1887-1914.
Krimm S, Bandekar J. Vibrational spectroscopy and conformation of peptides, polypeptides, and proteins [J]. Advances in Protein Chemistry, 1986, 38: 181-364.
Clarke J, Itzhaki L S. Hydrogen exchange and protein folding [J]. Current Opinion in Structural Biology, 1998, 8(1): 112-118.
Koutsoupakis C, Kolaj-Robin O, Soulimane T, et al. Probing protonation/deprotonation of tyrosine residues in cytochrome ba3 oxidase from Thermus thermophilus by time-resolved step-scan Fourier transform infrared spectroscopy [J]. Journal of Biological Chemistry, 2011, 286(35): 30600-30605.
Barth A. The infrared absorption of amino acid side chains [J]. Progress in Biophysics and Molecular Biology, 2000, 74(3): 141-173.
Koziński M, Garrett-Roe S, Hamm P. 2D-IR spectroscopy of the sulfhydryl band of cysteines in the hydrophobic core of proteins [J]. The Journal of Physical Chemistry B, 2008, 112(25): 7645-7650.
Kötting C, Gerwert K. Proteins in action monitored by time-resolved FTIR spectroscopy [J]. ChemPhysChem, 2005, 6(5): 881-888.
Fafarman A T, Sigala P A, Schwans J P, et al. Quantitative, directional measurement of electric field heterogeneity in the active site of ketosteroid isomerase [J]. Proceedings of the National Academy of Sciences, 2012, 109(6): E299-E308.
Haris P I. Infrared spectroscopy of protein structure [M]//Roberts G C K. Encyclopedia of Biophysics. Berlin: Springer, 2013.
Radu I, Schleeger M, Bolwien C, et al. Time-resolved methods in biophysics. 10. Time-resolved FT-IR difference spectroscopy and the application to membrane proteins [J]. Photochemical & Photobiological Sciences, 2009, 8(11): 1517-1528.
Bondar A N, Smith J C. Bacteriorhodopsin proton-pumping mechanism: successes and challenges in computational approaches [J]. Biophysical Journal, 2025, 124(22): 3813-3826.
Shibata M, Kandori H. FTIR studies of internal water molecules in the Schiff base region of bacteriorhodopsin [J]. Biochemistry, 2005, 44(20): 7406-7413.
Remy A, Gerwert K. Coupling of light-induced electron transfer to proton uptake in photosynthesis [J]. Nature Structural & Molecular Biology, 2003, 10(8): 637-644.
Mezzetti A, Schnee J, Lapini A, et al. Time-resolved infrared absorption spectroscopy applied to photoinduced reactions: how and why [J]. Photochemical & Photobiological Sciences, 2022, 21(4): 557-584.
Cepus V, Ulbrich C, Allin C, et al. Fourier transform infrared photolysis studies of caged compounds [J]. Methods Enzymol, 1998, 291: 223-245.
Kötting C, Gerwert K. Time-resolved FTIR studies provide activation free energy, activation enthalpy and activation entropy for GTPase reactions [J]. Chemical Physics, 2004, 307(2): 227-232.
Zhang L, Buchet R, Azzar G. Interactions of caged-ATP and photoreleased ATP with alkaline phosphatase [J]. Biochemical and Biophysical Research Communications, 2005, 328(2): 591-594.
Fabian H, Naumann D. Methods to study protein folding by stopped-flow FT-IR [J]. Methods, 2004, 34(1): 28-40.
Troullier A, Reinstädler D, Dupont Y, et al. Transient non-native secondary structures during the refolding of α-lactalbumin detected by infrared spectroscopy [J]. Nature Structural Biology, 2000, 7(1): 78-86.
Kauffmann E, Darnton N C, Austin R H, et al. Lifetimes of intermediates in the β-sheet to α-helix transition of β-lactoglobulin by using a diffusional IR mixer [J]. Proceedings of the National Academy of Sciences, 2001, 98(12): 6646-6649.
Chung H S, Khalil M, Smith A W, et al. Transient two-dimensional IR spectrometer for probing nanosecond temperature-jump kinetics [J]. Review of Scientific Instruments, 2007, 78(6): 063101.
Ashwood B, Lewis N H C, Sanstead P J, et al. Temperature-jump 2D IR spectroscopy with intensity-modulated CW optical heating [J]. The Journal of Physical Chemistry B, 2020, 124(39): 8665-8677.
Braiman M S, Ahl P L, Rothschild K J. Millisecond Fourier-transform infrared difference spectra of bacteriorhodopsin′s M412 photoproduct [J]. Proceedings of the National Academy of Sciences, 1987, 84(15): 5221-5225.
Zheng J, Kwak K, Asbury J, et al. Ultrafast dynamics of solute-solvent complexation observed at thermal equilibrium in real time [J]. Science, 2005, 309(5739): 1338-1343.
Ghosh A, Serrano A L, Oudenhoven T A, et al. Experimental implementations of 2D IR spectroscopy through a horizontal pulse shaper design and a focal plane array detector [J]. Optics Letters, 2016, 41(3): 524-527.
Shim S H, Strasfeld D B, Ling Y L, et al. Automated 2D IR spectroscopy using a mid-IR pulse shaper and application of this technology to the human islet amyloid polypeptide [J]. Proceedings of the National Academy of Sciences of the United States of America, 2007, 104(36): 14197-14202.
Buchanan L E, Dunkelberger E B, Tran H Q, et al. Mechanism of IAPP amyloid fibril formation involves an intermediate with a transient β-sheet [J]. Proceedings of the National Academy of Sciences, 2013, 110(48): 19285-19290.
Buchanan L E, Carr J K, Fluitt A M, et al. Structural motif of polyglutamine amyloid fibrils discerned with mixed-isotope infrared spectroscopy [J]. Proceedings of the National Academy of Sciences, 2014, 111(16): 5796-5801.
Lim M, Jackson T A, Anfinrud P A. Binding of CO to myoglobin from a heme pocket docking site to form nearly linear Fe-C-O [J]. Science, 1995, 269(5226): 962-966.
Lee T, Kim J, Park J, et al. Rebinding dynamics of NO to microperoxidase-8 probed by time-resolved vibrational spectroscopy [J]. Physical Chemistry Chemical Physics, 2016, 18(7): 5192-5202.
Pavlou A, Loullis A, Yoshimura H, et al. Probing the role of the heme distal and proximal environment in ligand dynamics in the signal transducer protein HemAT by time-resolved step-scan FTIR and resonance Raman spectroscopy [J]. Biochemistry, 2017, 56(40): 5309-5317.
Wang L, Zhang J, Han M J, et al. A genetically encoded two-dimensional infrared probe for enzyme active-site dynamics [J]. Angewandte Chemie International Edition, 2021, 60(20): 11143-11147.
Kandori H. Retinal proteins: photochemistry and optogenetics [J]. Bulletin of the Chemical Society of Japan, 2019, 93(1): 76-85.
Rammelsberg R, Hessling B, Chorongiewski H, et al. Molecular reaction mechanisms of proteins monitored by nanosecond step-scan FT-IR difference spectroscopy [J]. Applied Spectroscopy, 1997, 51(4): 558-562.
Rödig C, Siebert F. Distortion of the L→M transition in the photocycle of the bacteriorhodopsin mutant D96N: a time-resolved step-scan FTIR investigation [J]. FEBS Letters, 1999, 445(1): 14-18.
Lorenz-Fonfria V A, Saita M, Lazarova T, et al. pH-sensitive vibrational probe reveals a cytoplasmic protonated cluster in bacteriorhodopsin [J]. Proceedings of the National Academy of Sciences, 2017, 114(51): E10909-E10918.
Wolf S, Freier E, Potschies M, et al. Directional proton transfer in membrane proteins achieved through protonated protein-bound water molecules: a proton diode [J]. Angewandte Chemie International Edition, 2010, 49(38): 6889-6893.
Lórenz-Fonfría V A, Schultz B J, Resler T, et al. Pre-gating conformational changes in the ChETA variant of Channelrhodopsin-2 monitored by nanosecond IR spectroscopy [J]. Journal of the American Chemical Society, 2015, 137(5): 1850-1861.
Pushkarev A, Inoue K, Larom S, et al. A distinct abundant group of microbial rhodopsins discovered using functional metagenomics [J]. Nature, 2018, 558(7711): 595-599.
Nakamura T, Singh M, Sugiura M, et al. SNap bond, a crucial hydrogen bond between Ser in helix 3 and Asn in helix 4, regulates the structural dynamics of Heliorhodopsin [J]. Journal of Molecular Biology, 2024, 436(16): 168666.
Kuroi K, Tsukamoto T, Honda N, et al. Concerted primary proton transfer reactions in a thermophilic rhodopsin studied by time-resolved infrared spectroscopy at high temperature [J]. Biochimica et Biophysica Acta (BBA)-Bioenergetics, 2023, 1864(3): 148980.
Wu F, Huang Y, Yang G, et al. Unraveling dynamic protein structures by two-dimensional infrared spectra with a pretrained machine learning model [J]. Proceedings of the National Academy of Sciences of the United States of America, 2024, 121(27): e2409257121.
Ye S, Zhu L, Zhao Z, et al. AI protocol for retrieving protein dynamic structures from two-dimensional infrared spectra [J]. Proceedings of the National Academy of Sciences of the United States of America, 2025, 122(7): e2424078122.