写论文的同时,曾凡大脑也在不断思考运转,这次实验向他打开了一个全新世界的大门。
假如把人类基因组序列当做一个程序,一对对碱基就是组成机器语言的一串串零和一,只是它们的组合方式比现在计算机的二进制复杂的多,破解起来难度也更大。
自己这个超级程序员能不能破解开人类基因组这个超级程序呢?
从目前来看,他还需要收集更多更详细的数据,单纯这一个基因包含的信息还远远不够。
就是这一个基因包含的几千个碱基序列,他也还没搞明白呢,这些天的实验也是在前人总结的经验基础上,做了一些简单的假设求证,
目前能得出的结论也只是基因会影响机体脂肪消耗能力,容易造成脂肪累积,从而造成肥胖引发一系列并发症。
至于这个基因如何造成这种现象,其中的碱基序列各部分都发挥了什么作用,还完全两眼一抹黑。
就好像对一个未知程序做黑盒测试,只是知道了程序具备的一部分功能,内部的运行机制,编程算法还没搞明白。
从这个角度看,破译基因功能,和破解一个未知程序很相似,不同的是它的编码规则更复杂,破译过程也更艰难。
破解普通程序只需要在计算机上面对屏幕敲键盘就行了,破解基因序列则必须在显微镜下操作,还需要进行很长时间的实验验证,难度可想而知了。
能不能写一个模拟生命基因功能的程序,在计算机上进行模拟破译呢?
现在已知数据太少,精确度不会很高,随着破解进度的增加,未来精确度会越来越高,当突破某个临界值后,或许不再需要细胞实验,动物实验,在计算机上就能破译基因的功能了。
到时候,不但人体所有基因功能都可以破译出来,还可以修改某些基因,看看能不能达到预期效果,然后再进行实验求证,完成一次基因的进化。
到那时候,甚至可以通过软件设计,用基因编辑重组制造出一个全新物种,那可是神才能拥有的能力!
想想就觉得激动,曾凡被自己这个大胆想法震惊到了,反复思索其中的可能性,越想越觉得值得一试。
人类基因组测序就相当于破解生命程序的源代码,他写的计算机程序就相当于将这些源代码在计算机上重新编译一遍,可以模拟真实人体情况运行起来。
现在的计算机虽然强大,算力方面估计仍然难以支撑,初始的程序架构不能太庞大,功能也不能太复杂,可以根据需要一点点逐步扩展。
人类基因组的测序工作已经进行了大半,他可以尝试根据破解出来的这些序列,总结规律写一个反编译程序,加快测序进度。
测序流程这段时间他天天都在做,已经熟悉的不能再熟悉了,基因碱基序列的组成规律不敢说完全掌握,至少也摸清了大半,对他的程序来说已经够用了。
被这个想法所驱动,曾凡没有像往常那样按时睡觉,熬夜把自己的构想变成了代码。
光有程序代码还不行,还需要把测序完成的基因序列导入进行计算,这些在他宿舍的电脑上做不了。
将程序刻录到光盘上,曾凡凌晨三点多跑到实验室,在实验室的电脑上开始操作,实验室的工作站比他的宿舍电脑当然算力高多了,更主要的可以高速获取基因组数据,还可以调用学校超级计算机的算力进行运算,效率提升可不是一星半点。
由于数据量庞大,导入过程就需要几个小时,程序运行总结规律也不是一时半会能完成,曾凡盯着屏幕困意上涌,趴在桌子上面睡着了。
“喂,醒醒!醒醒!”
曾凡被叫醒的时候实验室外面已经天光大亮,看看计算机的时间,才刚刚五点多钟,计算机还在运行之中。
叫醒他的是实验室的负责人帕米拉教授,看他醒过来问道:“曾,你在搞什么?学校超算中心管理员给我打电话,说我们突然调用了大量超算资源进行计算,是你弄的吧?”
“教授,我昨天睡觉前突然萌生想法,写了一个程序,可以根据已经测出来的基因序列推算后面未知的序列,正在进行验证!”曾凡赶紧从座椅上站了起来说道。
“哦,你有多大把握?”帕米拉好奇的问。
“一半一半吧,第一步估计需要超算中心支持五到十个小时,后面的实际演算还需要一到两天时间,不太确定!”曾凡挠挠头说道。
“咱们的进度已经超前了很多,可以给你三天时间尝试,超算中心那边我会让他们配合!下次再有这事你提前通知我,别再这么鲁莽!”帕米拉笑着说道,这个学生总给她带来惊喜,必须得支持啊。
“知道了,谢谢教授!”
接下来的两天,曾凡大部分时间都泡在实验室的电脑前,盯着程序的运行,这个基因组测序软件,只是他的一个尝试,为后面的基因功能模拟程序做的一个前期测试。
那个程序不仅要包含这个测序部分,还要能模拟基因的分裂复制,怎么样
通过基因转录生成不同的氨基酸,再根据碱基序列用氨基酸组成结构不同的肽链,最后将肽链转换成特定功能的蛋白质。
通过这些不同的蛋白质来调控生物体内各种不同的生物酶,激素,抗体的产生,进而控制生物体的生长,发育,新陈代谢和其他本能行为。
程序的最终状态曾凡不知道什么时候能完成,需要的数据太多了,涉及到的算法也太庞杂,他初步目标是先模拟一部分基因的功能,模拟实现转录生成氨基酸,再到产生蛋白质的过程,也就是基因功能测试中,最复杂的细胞实验这部分。
假如这部分功能可以实现,即便后面不能完成,也可以大大提升以后基因功能测试的效率,降低参与这项研究的门槛,加快基因功能破解的整体速度。
基因序列的推算比预想中顺利,第三天的早上就全部完成了。
根据最开始公布的基因组草图,这两年多几个国家的几十个实验室互相配合已经完成了百分之七十以上的测序工作,未知的只有百分之二十多。
程序推算出来的结果当然不能当作测序结果,可以对这个结果进行测试,如果准确率能得到验证,那将提升整个测序工作进度,好处不言而喻。
帕米拉随后调整了各小组的测序任务,对这个推测出来的结果进行验证,证实了程序的可靠性,那就可以向上提交,测序工作有望今年内全部完成。
“曾,结果验证你就别参与了,这几天你专注你那个基因功能测试实验吧,论文好好写,别浪费这次机会!”帕米拉对曾凡说道。
“教授,我对一些基因转录的细节不太了解,想重做一遍细胞实验,你看可以吗?”曾凡问道。
“当然可以,该有的实验计划也要有!”
“我已经写好了!”
看了曾凡的实验计划后,帕米拉签字表示同意,对他的实验给予了全力支持。