DNA图书或成现实?

作者:赵雅敏 分类:文化 时间:2014-02-24 12:14
优府信息技术股份有限公司 - 运营编辑部

与传统图书和数字图书相比,DNA图书拥有巨大的优势。它的体积更小,蕴藏量几乎是无限的,且可以长久保存。根据DNA的半衰期,如果在理想条件下保存,DNA的四个碱基可以保存680万年。这意味着,制成的DNA图书也可以保存上百万年。

历史上,图书经历了石头书、龟甲书、竹简书、布书(养蚕业与织布提供了布料)、纸书(蔡伦发明纸之后)和数字图书的历程。现在,一种新的图书——DNA图书已经通过了初步的试验,有朝一日将会进入人们的日常生活。

两种技术的结合

DNA图书是数字(信息)技术与生物遗传技术结合的新结晶。

数字图书是当今最先进的图书,由数字技术编辑加工而成的。数字技术的本质是电子计算机和网络信息技术,借助这些技术和设备,可以将信息转化为电子计算机能识别的二进制数字“0”和“1”后进行加工、制作和出版。通过这种技术出版的图书也可称为数字图书。

DNA是包括人在内的高级动物的细胞的细胞核,其蕴藏的遗传信息不仅是海量的,且是有序的。这种有序就是其中的四个碱基的互补排序。DNA的稳定双螺旋结构是由4种不同的碱基来支撑的。它们英文名称的首字母分别称之为A(Adenine,腺嘌呤)、T(Thymine,胸腺嘧啶)、G(Guanine,鸟嘌呤)和C(Cytosine,胞嘧啶)。这四种碱基的每一种分别与另一种碱基的化学性质完全互补,因此,便形成了A总是与T配对,G总是与C配对,当然从DNA转录到RNA(核糖核酸)时,A是与U(尿嘧啶)配对。

根据DNA的这种稳定搭配,研究人员设想,可以把数字技术与生物技术结合起来,编撰成一种全新的图书——DNA图书。编撰DNA图书的可行性在于,可以利用计算机的二进制数字“0”和“1”与四种碱基进行转化编码、编程,把数字图书所编码的所有文字、图像、符号等再编码进DNA中,制作成DNA图书。在阅读时,再利用DNA测序技术把DNA密码还原为数字编码,就可以解码和阅读。

当然,DNA图书最吸引人的还是它的巨大优势。它的蕴藏量几乎是无限的,其体积更小,远比光盘、U盘、硬盘更小,而且信息可以长久地在DNA中保存。根据DNA的半衰期,如果在-5℃的最理想条件下保存,DNA的四个碱基可以保存680万年。这也意味着,制成的DNA图书可以保存上百万年。

相反,数字技术(图书)保存信息的弱点之一是存储时间较短。目前数字信息的载体都是磁盘(软盘、硬盘)和光盘。虽然数字生产厂商称硬盘保存信息、数据的寿命不低于10万小时,但这只是理论值,在实际使用过程,有许多因素会缩短这个时间。

DNA《再生》

哈佛大学维斯生物工程研究所的乔治·丘奇(GeorgeChurch)等人在2012年9月28日的美国《科学》杂志上发表文章称,他们成功地编码出一本5.27兆比特的DNA图书,这本书不仅有文字,还有图,是图文并茂的DNA图书,书名叫做《再生》。这本书有5.34万个单词,还有11张JPG格式的图片和一段JavaScript程序。

DNA图书编撰的原理是,把需要编撰的内容先转化为数字信息(电子文件),然后把数字信息按DNA的碱基顺序编码并合成,读取时再用DNA测序仪按编码规则将DNA图书转换解读为数字文件,就能在电脑上阅读和使用了。

根据这个原理,研究人员编撰了DNA图书《再生》后,再利用DNA测序来阅读这本书,内容可以成功地读出,这证明DNA能够被用来长期储存数字信息,也即可以用DNA来生产图书。这种新图书所储存的信息量是DNA原来储存的生物遗传信息量的一千多倍。也就是说,DNA图书不仅比传统的纸质图书储存的信息要多得多,也比DNA本身储存的遗传信息要多很多。

DNA图书的具体制作是,首先将《再生》这本书的文字内容和图片转化为HTML格式的文件,然后将这些文件编译为由0和1组成的大小为5.27兆比特的二进制序列。然后再用DNA的一个核苷酸(一个碱基)对应一个比特,把这个5.27兆比特的二进制序列按照顺序分配到多个96比特长的核苷酸片段中。

用于编码和储存信息的DNA不过是一滴DNA液滴,当《再生》的全部信息被编码到DNA之中后,DNA液滴被放置到微阵列芯片上储存。这些芯片在4摄氏度下保存三个月,然后溶解它们并测序,以便降低储存信息时的错误。每个核苷酸片段的每个拷贝被测序高达3000次,利用这种方式可以把这个5.27兆比特内容的书籍中的错误降低到只有12个。也即是说,存储在DNA中的内容能被准确无误地读取出来。

DNA《莎士比亚诗集》

在《再生》问世后一年,另一本DNA图书《莎士比亚诗集》也诞生了。这本DNA图书是由欧洲生物信息研究所(EBI)的尼克·戈尔德曼(NickGoldman)等人编撰而成。该书编入的内容有,莎士比亚所有的154首十四行诗、一篇沃森和克里克DNA双螺旋论文的副本、一张戈尔德曼等人所在研究机构EBI大楼的彩色照片,一段这次试验使用的软件算法,还有一段长达26秒来自马丁·路德·金的演讲“我有一个梦想”的剪辑音频。信息总量约739千字节。

显然,这本DNA《莎士比亚诗集》内容更丰富,而且包含了一个音频文件,也更符合数字图书的标准。与《再生》相比,DNA《莎士比亚诗集》的编撰更优化、更完善、操作性更强,也更实用。

当数字内容编写进DNA后,再用专门设备合成为DNA《莎士比亚诗集》。在读取或阅读时,先把合成的DNA《莎士比亚诗集》放入标准化学试剂,然后用DNA测序仪根据索引标识,将各个DNA片段依顺序粘贴成原来的DNA序列,再转译到数字文件的二进制码,从而形成电子文件,就可阅读了。

合成的DNA《莎士比亚诗集》只有砂粒般大小,静静地躺在试管的底部,连戈尔德曼还是经同事指点才发现了这本DNA《莎士比亚诗集》。在阅读时,研究人员用DNA测序仪把DNA诗集中的信息还原为数字文件,结果它与原始数字文件的内容百分之百重合。这种从DNA程序到数字程序百分之百的重合靠的是巧妙的设计。

在阅读DNA《莎士比亚诗集》时,研究人员发现有两个25个碱基对的小节不见了。由于在设计时就考虑到这一点,拷贝了4个副本,利用这些副本完全还原了漏掉的内容。另外,戈尔德曼等人也发现了碱基对丢失的原因,在未来只要修改一下程序,就不会发生类似的问题。

DNA《莎士比亚诗集》的诞生也获得了丘奇等人的好评,他认为,戈尔德曼等人的研究让“我们终于有了一个真实的领域”。图书非常稳定,更容易保存,只需放在冷、暗、干燥处,没有恒温、恒湿的苛刻要求。同时,编撰DNA诗集的设备和方法都是生物学研究的常规工具,这可以让DNA图书的存储和阅读也更方便。

与《再生》一样,DNA《莎士比亚诗集》同样有费时费力和成本高昂的弱点。数码信息编入DNA目前只能由专门的DNA合成设备来做,而从DNA中取读信息,重组复原为数码文件,也很费时。戈尔德曼等人用了整整两个星期才完成739千字节的复原。

由于不能重复使用、昂贵和读取时间长,DNA图书目前还不可能像数字图书一样被人们广泛使用,其市场化也需要时日。不过,有朝一日,当研究人员克服这些弱点之后,DNA图书也将走进人们的生活。


当前用户暂时关闭评论 或尚未登录,请先 登录注册
暂无留言
赵雅敏推荐
版权所有:拓荒族 晋ICP备17002471号-6