这是一个生物学和计算机科学结合的典范,麻省理工学院的科学家利用基因编辑技术将细胞变为微型计算机,可实现读取、写入和执行的功能。
DNA 计算机在 1990 年代就出现了,与电子计算机用“0”和“1”来储存信息不同,DNA 计算机将信息储存在构成 DNA 分子的A、C、G、T中。只是这些 DNA 信息在活细胞中不容易改变,因而计算缓慢。于是麻省理工学院的科学家希望加速这一过程,发明了一种称作DOMINO的技术,该技术全称是基于 DNA 的有序存储器和迭代网络运行者。它建立在 CRISPR 基因编辑技术基础上,旨在响应小分子或光照等生物信号。
8 月 22 日,这篇文章以《活细胞中单核苷酸分辨率的计算和储存》为题发表在《分子细胞》期刊(Molecular Cell)。通讯作者是来自麻省理工学院的施密特科学博士后研究员 Fahim Farzadfard 与电气工程与计算机科学系、生物工程系副教授卢冠达(Timothy K. Lu)。
这是 Fahim Farzadfard 做的艺术图。他们开发的 DOMINO 是一种记录生物信息并在活细胞中进行逻辑和计算的技术,该技术通过 DNA 写入事件的级联(类似于多米诺骨牌),为活细胞中的信息传播、计算和存储提供了强大且可扩展的方法。来源:Fahim Farzadfard
利用碱基突变实现单核苷酸分辨率,无需破坏细胞
因其普遍存在的持久性和生物功能兼容性,DNA 成为人工生物信息储存的理想介质,特别是随着 DNA 测序效率的提升以及成本下降,其信息储存优势日渐明显。
如今基因组编辑技术让人们能更便捷改变遗传信息。DNA 编辑器可以对活细胞内所含 DNA 进行插入、删除、倒位或碱基替换突变等形式,并可用于区分不同 DNA 记忆状态。短暂的细胞事件,例如蛋白质-蛋白质相互作用,可以作为转录输出被 DNA 信息储存。
此前的活细胞 DNA 技术只能读取或写入,也就是说,在一两个分子事件后该细胞就停止了数据储存,其编码容量和可扩展性受到限制,不能用来连续监控动态信号或长时间历史信号,并且缺乏便捷的读写和监控操作模式。
因此,人们需要一种高效且稳健的分子记录和 DNA 记忆平台,像硬盘一样能够进行信息存储和计算,Fahim Farzadfard 等人构建的活细胞 DNA 分子记录仪则能够编码更多信息。
这是一种非破坏性的 DNA 报告基因回路,可以响应细胞内的指导 RNA(gRNA)突变储存状态,最后以不同水平输出。因此系统读取只需要测定回路状态,而无需破坏细胞和 DNA 测序读数。
DOMINO 存储器架构的示意图。来源:Molecular Cell
为了达到更高的精确度,研究人员将一种 Cas9 与最近开发的碱基编辑酶融合,该酶可以将核苷酸胞嘧啶转化为胸腺嘧啶而不破坏双链 DNA。具体而言,研究人员利用基因编辑技术构建了一个单核苷酸分辨率的读写头,这个读写头由与胞苷脱氨酶融合的 Cas9 切口酶与尿嘧啶 DNA 糖基化酶抑制剂组成。Cas9 切口酶用来读取,由 gRNA 指向特定的 DNA 靶标并将其切割,胞苷脱氨酶用来写入,而尿嘧啶 DNA 糖基化酶抑制剂则可以通过阻断细胞修复机制提高写入效率。
一旦 12 碱基对的 gRNA 序列定位到靶标,编辑器模块可以让靶标序列5’末端(5’末端表示 DNA 复制或转录的方向)附近的脱氧胞苷脱氨基,之后引入胞嘧啶-胸腺嘧啶突变,从而在 DNA 中产生永久记录。也就是说,只有细胞中存在特定 DNA 序列时,胞嘧啶转换为胸腺嘧啶才会发生,那么通过测量这种突变即可得到细胞遇到的信号。
读写头在诱导型启动子控制下,可以通过内部或外部输入控制该系统中的 DNA 写入。这里读写头的表达可看作是操作信号,而控制 gRNA 表达的信号则是独立可控的输入。
研究人员还可以通过设计 DOMINO 系统来实现每套输入得到一个独特的识别标志,那么从这个识别标志也能推测出原来的系统输入是什么。依据研究人员的设计,最终的输出结果会激活绿色荧光蛋白表达,那么通过测量绿色荧光的表达水平,即可得知细胞内发生了多少突变,这就避免了测序破坏细胞。
通过这样的操作,DOMINO 系统实现了超越 DNA 只能读写而输出只能破坏细胞来测序读取的做法,并且实现长期持续记录和监测。
这是 Fahim Farzadfard 做的艺术图。DOMINO 可以实现活细胞中 DNA 计算的各种逻辑。来源:Fahim Farzadfard
此外,DOMINO 系统还能够通过分层多个 DOMINO 运算符来构建各种形式的逻辑。具体而言,DNA 事件写入逻辑可以与顺序无关,可以与顺序有关,也可与时间有关。还可与基于 CRISPR 的基因调控策略结合,比如 CRISPR 干扰(CRISPRi)和 CRISPR 激活(CRISPRa),实现模块化和通用的储存以及基因调控功能。
存储器的进化
数年前,卢冠达实验室开发了一种基于称为 DNA 重组酶的记忆存储系统。当特定事件发生时,它可以翻转 DNA 片段。然而,这种方法在规模上是有限的:它只能记录一个或两个事件,因为必须翻转的 DNA 序列非常大,并且每个都需要不同的重组酶。
之后,卢冠达和 Farzadfard 开发了一种更具针对性的方法。他们将新 DNA 序列插入基因组中的预定位置,但这种方法仅适用于细菌细胞。2016 年,他们开发了一种基于 CRISPR 的记忆存储系统,但它依赖于细胞自身的 DNA 修复机制,以便在 Cas9 切割 DNA 后产生突变。这意味着突变结果并不总是可预测的,因此限制了可以存储的信息量。
如今,他们的 DOMINO 系统使用的是 CRISPR-Cas9 酶的变体,它可以产生更明确的突变,因为它可以直接修改和存储 DNA 碱基中的信息,而不是切割 DNA 并等待细胞修复损伤。研究人员证明,这个系统可以在人体和细菌细胞中正常工作。
这个系统与其他使用多种蛋白质的精确 DNA 读写系统不同,DOMINO 仅仅使用短小的 gRNA 和少量蛋白质,这会减少细胞的代谢负担。
通过读写头,DOMINO 将基因组 DNA 转换为可寻址、可读和写入的介质,可以在活细胞中加工和存储信息。仅仅通过改变 gRNA 序列即可构建各种 DOMINO 操纵子,这样该系统的应用范围就具备了极大的扩展空间。同时,由于该系统分辨率高,那么可以构建多个 gRNA 的操纵子。
为下一代存储器铺路
活细胞可以变成信息记录装置,这些记录装置将自身信号动态历史储存为永久的 DNA 记录,反过来为研究人员提供它们在自然过程发展的证据。要知道,人们不仅仅需要生物反应的快照。在生物系统中,许多分子事件非常短暂,因此很难在自然环境下检测和研究。而 DNA 编辑可以用来创建分子记录仪,累积下来的突变可通过 DNA 测序或功能分析加以检索,以推断原始信息。
这些策略已经有了。例如,通过信号-响应启动子,诸如是否存在、持续时常、强度、时序和时间相关的生物线索(如代谢物和细胞因子)或者环境线索(如光、污染物、噬菌体或温度变化)等记录信息都可被写入 DNA。
DOMINO 系统就是这个分子记录仪。研究人员指出,DOMINO 系统提升了活细胞中进行分子记录和计算的能力,这就提高了监测和控制细胞表型的能力。这些类型的复杂存储器电路的应用包括跟踪在细胞分化时代代相传的变化,或者创建可以检测并可能治疗患病细胞的传感器。
DOMINO 中的诱导型启动子是可以替换的,那么这就带来了各种应用的可能。比如可以在该系统中记录各种生物学信号或生理学信号,如糖、重金属如铜离子以及暗室效应,也可以记录胃肠道炎症的生物标志物,如血红素、过氧化氢和一氧化氮。
其中的一个应用是检测糖。将响应乳糖的 DNA 编码插入到细菌中,当细菌遇到糖时,DOMINO 会改变细菌的 DNA。此外,这些事件印迹会留在 DNA 里,不会随着事件发生后而消退。
同样,DOMINO 可以设计出检测癌症相关基因的路径,也可以编程打开抗癌分子的基因,使系统能够检测和治疗癌症。
卢冠达说,本研究试图克服以前的局限性,它使我们更接近最终愿景,即拥有强大、高度可扩展和可定义的内存系统,这类似于硬盘驱动器的工作方式。
研究人员认为,该研究解决了当前体内记录和计算技术的许多局限性,并为用于活细胞中的信息处理和存储的下一代存储器架构铺平了道路。
在 Farzadfard 和卢冠达于 2018 年 8 月 31 日在Science发表的综述文章中,他们论述了这个分子记录仪的未来。
在将来,发育生物学家可以使用 DNA 记录仪研究分化和发育途径;癌症生物学家可以使用这些 DNA 记录仪来研究肿瘤发展,并深入了解肿瘤微环境中与癌症异质性有关的细胞和环境线索;免疫学家可以使用 DNA 记录仪来研究免疫细胞成熟、记忆形成和免疫应答过程中的信号转导;微生物学家可以利用其来研究细菌群落和生物膜内的信号动力学和分子相互作用。
专访第一作者兼通讯作者 Fahim Farzadfard 博士:我们刚开始进行细胞编程的入门
DeepTech:在这项研究中,DOMINO 系统的最大创新是单碱基突变,即让胞嘧啶变成胸腺嘧啶,这也是细胞无需被破坏的关键,是这样吗?
Fahim Farzadfard:是这样。这项研究工作的其他突破是,我们可以在活细胞中即时进行读取和写入,这就可以让我们实现多个读取事件和写入事件的分层,以便让我们记录或控制 DNA 分子事件的发生顺序和发生时间。另外,DOMINO 实现的分子记录规模、模块性和鲁棒性(稳健)也显著胜过此前的方法。
DeepTech:我们很想知道,你是如何找到这么巧妙的方法的?
Fahim Farzadfard:我一直致力于开发 DNA 分子的信息处理和记录技术。我开发的第一个系统是 SCRIBE 系统,该系统于 2014 年在Science上发表,并证明了使用 DNA 书写记录 DNA 中的生物信息的可能性。之后,我一直试图实现使用 DNA 作为生物细胞存储器的最终愿景,希望它的使用类似使用计算机硬盘,而 DOMINO 是这项工作的继续,也是接近这一愿景的最新努力。
DeepTech:当前的 DOMINO 系统还有哪些局限吗?
Fahim Farzadfard:我们还需要在两个方面进行改进,即时间分辨率和并行处理方面,这会对神经记录这样的应用非常有帮助。
DeepTech:计算机是物理信号的计算过程,DNA 计算则是化学反应过程,我们应该如何理解基于这两种不同反应的计算系统的差异?我们应该对 DNA 计算有什么期望?
Fahim Farzadfard:与硬盘驱动的“0”和“1”存储器不同,这里我们使用遗传编码A、C、G、T的读写头来操作 DNA 存储器。
一旦有了存储系统,我们就可以根据各种形式的逻辑用于数字计算或其他形式的计算(如模拟计算)来处理存储的信息,就像我们使用硬盘驱动器和处理器来执行复杂的硅计算一样。
我认为基于硅的计算机和基于 DNA 的活细胞计算机之间肯定存在差异。活细胞中的回路反应缺乏联网区域化的相互作用,因为所有的反应发生在同样的隔断区中。
另一个大的区别是,因为至少在当前 DNA 计算依赖于生物化学过程,例如基因表达,所以它比电子计算机的运算要慢得多。这个限制与时间尺度有关,因为许多生物过程如细胞信号转导、分化和发育的过程是有限制的。
需要强调的是,在基于 DNA 的计算中,我们无法接近电子计算机的处理能力。然而,基于 DNA 的计算机提供了强大的与生物系统交互的计算工具,这是电子计算机无法实现的。
在这里,即使些微的计算都可能对疾病诊断和医学应用有非常强大的助推,尤其是在传统技术无法实现的领域。
DeepTech:你认为 DOMINO 系统在 DNA 计算发展中处于什么位置?总的来看,DNA 计算目前发展到了哪个阶段?
Fahim Farzadfard:随着 CRISPR-Cas9 和碱基编辑技术的发展,DNA 分子记录和计算的技术也在迅速发展。如今有了 DOMINO 系统的帮助,我们证明了采用精确的 DNA 编辑可以实现各种形式的计算操作,因为不同的突变状态是可以被 DNA 编辑器精确控制的。
我认为先前的技术瓶颈在于,DNA 编辑太随机,一些突变是不可预测的,并且缺乏固有的信息读取技术。那么这实际上就不能用于计算,因为计算需要可预测的结果,举个例子就是,如果事件A发生则事件B就会发生,如果事件B发生则事件C就会发生。
因此人们需要一个精确的 DNA 编辑器以及固有的信息读取途径。对于前者,在某个突变发生时,会导致级联逻辑运算产生,而后者则是对于动态读取活细胞信息所必需的。DOMINO 系统正是满足了上述要求。
我认为 DOMINO 是在活细胞中构建通用读写操作的重要一步,可将其视为一种理想的通用图灵机。
如果我们将细胞视为生物计算机,那么对这些细胞进行稳健编程的能力将为我们提供无与伦比的方法来研究和控制活细胞中分子事件的变化。
我想我们刚开始进行细胞编程的入门。
Fahim Farzadfard 简介
Fahim Farzadfard,生于伊朗,毕业于德黑兰大学生物技术专业,并在麻省理工学院获得博士学位。博士期间,他为活细胞的分子记录和计算开发了多个基础平台, 他引入了基于 DNA 分子记录和模拟储存的概念,并发明了一个模块化和可扩展的平台 SCRIBE(Synthetic Cellular Recorders Integrating Biological Events),后者可用于将信号动态记录到细胞自身的基因组 DNA 中。
作为施密特科学博士后研究员,Fahim Farzadfard 同时在哈佛大学 George Church 和麻省理工学院 Ed Boynton 两个实验室工作,他的目标是进一步推进分子记录技术并将其应用于大脑研究。