双超所
科普

解读: 众包57000人完成的Nature大作 世界上作者最多的论文

发布时间:2015-03-15    作者:丁香园    来源: yl23455永利官网http://www.biodiscover.com/new    浏览次数:    打印


解读: 众包57000人完成的Nature大作 世界上作者最多的论文

2015/03/05 丁香园

分享:

导读

“如果无数多的猴子在无数多的打字机上随机地乱敲,并持续无限久的时间,那么在某个时候,必然有只猴子会打出莎士比亚的全部著作。”2008年,天才科学家,蛋白结构领域大佬级人物,华盛顿大学的 David Baker因实验不顺受到了这个idea启发开发了一款游戏,在给定一个目标蛋白的情况下,用各种氨基酸进行组装,最终拼凑出这个蛋白的完全体。

给你讲述一个有57000位作者的Nature大作的故事:“如果无数多的猴子在无数多的打字机上随机地乱敲,并持续无限久的时间,那么在某个时候,必然有只猴子会打出莎士比亚的全部著作。”

20 世纪初,法国数学家 Emile Borel 为了更好地阐述“无穷”的概念,将这一著名思想问题发扬光大。

想想与它齐名的几个思想问题:薛定谔那只生死不明的猫,火车与两条铁轨上的熊孩子们,光速奔跑的爱因斯坦等等,至少在三维世界中,目前是没办法知道对错了。

众包之路

在 2008 年,天才科学家,蛋白结构领域大佬级人物,华盛顿大学的 David Baker ——不知那几个月他是否实验不顺——大概受到了这个启发,转念一想,全世界有 60 亿智商远高于猴子的人类,如果人人都能这么瞎试试的话,是不是也能搞出什么黑暗科技?

于是,他找到了计算机系的哥们,设计出一款游戏:Foldit。

Fold 在蛋白领域里就是折叠的意思,顾名思义,这款游戏就是让你来组装蛋白。玩家要做的,就是在给定一个目标蛋白的情况下,用各种氨基酸进行组装,最终拼凑出这个蛋白的完全体。

Foldit 游戏画面

很明显,这借鉴了目前时下大热的“众包”思想,正所谓山野之中遍地大神,将任务丢给全世界,坐等这些大神们出手解决。

2008 年 5 月,Foldit 正式对全球开放下载,可以在线联网进行游戏,还能上传自己的成绩与全世界玩家进行比拼。一经发布就立刻大红大紫,吸引了全世界闲的蛋疼且有志于蛋白组装事业的好青年们的目光,注册玩家数量迅速达到了24 万人。

很快,一个个蛋白就在全世界玩家的围攻之下沦陷,被迫将自己的精准结构展现在世人眼前。

全民狂欢

2010 年的 7、8 月,Baker 研究组先后在两大顶级期刊《Nature》和《Science》上,发布了这款游戏的研究成果。

在此不得不提一下《Nature》上的这一篇:

multiplayeronline game(多人联机游戏)这样的标题出现在《Nature》这样的杂志上肯定是前无古人了,颇有种“顶级期刊啥时候也学会了一本正经的胡说八道”之感。

更亮点的是,在作者栏,“>57000 Foldit players”,平时看《NEJM》发布的大型联合研究动辄几百个作者塞满一个屏幕就已经让人叹为观止了,而这篇一口气就扔出了将近60000个作者……更威武霸气的是,作者单位写的是“Worldwide”,目测妥妥拿下史上最牛论文作者称号。

在随后的几年中,Baker 再接再厉,于 2011 年在 Nature 系列的子刊《Nat Struct Mol Biol》上发布了一种猴类艾滋病毒相关蛋白 M-PMV 结构的解析。

据说这个蛋白的结构已经困扰了研究者 15 年之久,然后作为任务发布到 Foldit 上仅仅 10 天后就被草根大神们破解……

当然,不变的是霸气依旧的标题,开门见山表明是玩家们搞定了这一切,作者中也放入了两个玩家小组:

这也引发了一阵追捧热潮,《纽约时报》、《Nature》等各大知名媒体全部对此进行了狂轰滥炸式的报道。更有苦逼的 postdoc 在采访文中感慨,这种全民狂欢式的破解之路比他们天天在实验室熬生活有效率多了。

Baker 也趁热打铁,在其后的几年间又在《Science》《Nature》和《PNAS》上灌水,哦不对,发表了数篇大作,详细阐释了 Foldit 的游戏现状和算法设计。

而全世界的玩家也不甘寂寞,纷纷请战,就在去年,世界各地 13 个实验室联合发表了文章,详细记录了自己在玩 Foldit 中合作与竞争的心路历程:

百花齐放

时至今日,已有数款游戏在科研领域发光发热,除了上述的 Foldit 以外,还有和它齐名的 phylo ,让玩家通过排列 DNA、RNA 和蛋白质,寻找功能相似序列。这也是产出了不少好文章。

phylo 游戏图像

再比如英国癌症中心 2012 年 10 月设计的游戏 CellSlider,让普通群众参与到医疗中来,分辨活检数字图像中的癌细胞的类型和数量,发布至今才两年多,就已经分析了超过 250 万张图像,这数量,哪怕是中国再大的三甲医院病理科也要被轻松秒杀。

CellSlider 游戏图像

让我们回到猴子身上,自古以来,就不缺脑洞大开的壮士。在 2003 年,英国科学家们在某动物园进行了这项实验,将一台电脑和一个键盘(科技进步了啊!)放进了灵长类园区,在各种不同款式不同品种的猴子猩猩们轮番上阵之后,最具天赋的猴子也不过是打出了 5 页基本全是“s”的废纸。

想来不要说莎士比亚,估摸着随便打个“hello”都要付出无数猴族天才的心血。

然而我们可以看见,当把试验品从猴子换成了更加智慧的人类,整个故事就完全不一样了。

大数据、云计算、众包,这样的概念已经席卷 IT 届。同样,在未来的科研和临床领域,也许全民参与会愈发频繁,或许在数十年后,现在“博导-博后-博士”这样门派作坊式的单打独斗将成为历史,大规模集团化团队作战甚至这样的全世界人民的超大规模介入才是主流。

六十亿只猴子估计敲烂了键盘也敲不出啥玩意,但要是六十亿人类一起敲,即使不会再有莎士比亚,想必莫言村上春树马尔克斯这样的大师,也是会如同黄河之水,延绵不绝。




分享到:0