译者前言:科学论文之于人类持续进化的重要性不言而喻,每年,全世界范围有数百万篇论文会被发表,它们代表着人类智慧的最新成果,但其中只有一小部分真正带来了新的产品和服务,人们可真正从中获益。以下是译文内容,原文标题为《Ideas on how to improve scientific research》。然而,传统的学术环境在为人类带来创新的同时,也存在着大量的落后特性,我们不禁思考,能否改善学术界的环境,使得人类发展能够变得更快、更开放?
来自区块链独角兽公司Coinbase的首席执行官Brian Armstrong,为我们提供了一些非常棒的想法,我们或许可结合区块链token和市场上已存在的技术,使得学术研究变得像Github那样开放,人人都可参与学术研究和讨论,倘若实现这一想法,学术研究者们将变得不再苦逼,人类文明因此而将更好地发展……
(图片来自:pexels.com)
如果解决以下这些问题,学术研究可能会变得更为有效:- 工作的优先顺序;
- 结果可重现性;
- 与市场激励保持一致;
- 获得资助的问题;
- 学术期刊的成本和延误;
全世界每年有数百万篇学术论文被发表,但其中只有一小部分真正带来了新的产品和服务,人们可真正从中受益
科学家们通常生活在自己的世界当中,他们会撰写一些只有其他科学家才能阅读的见解。同时,商界人士也经常生活在自己的世界当中,他们会创造出缺乏真正技术创新的产品。这两大人群之间没有太多的信息交流[1]。大多数新产品都是靠市场营销和品牌推广来区分的。这在化妆品、食品和健身/饮食行业中很常见,例如,在这些行业中,自有品牌制造商生产的很多相同产品都有不同的标签。
这是全食超市出售的一批饮料。它们被营销成能够提供能量,激情甚至具有治疗功用,但实际上它们都是重新包装了几个由食品药品监督管理局(FDA)批准的相同成分(咖啡因,茶氨酸,糖等)。哪种饮料中含有某种专利分子或知识产权?
例外情况证明了这一规则。跨越鸿沟(或成功地将技术与企业结合)的公司往往是最有价值的:例如特斯拉、谷歌、苹果、SpaceX等。这些公司往往需要一个技术型创始人(或创始团队),其对一些新技术和业务有充分的了解[2]。
了解技术和商业的人是很少的。他们是两个已罕见群体的交集。很多科学家对商业有过敏反应,很多商业人士也无法区分真正的科学和伪科学。也许,如果我们不必依赖这些稀有的双语人,我们会看到世界上更多的创新产品。也许我们可以创建一些翻译工具,以帮助改进学术研究与商业之间的思想交流。
今天科学研究所存在的一些挑战
学术界存在于一个奇怪的替代现实世界当中,金钱和传统的市场激励似乎并不重要。Tenure制、引用和同行的意见是导致补助金的原因,因此,这已经成为学术界的货币[3]。
以下是我今天在研究中看到的一些问题:
1、可再现性
在某些领域,超过50%的实验是无法复制的。很多论文不包括基础数据集,研究人员有时会有动机地在论文中隐藏关键细节,以试图领先于竞争者。此外,负面结果[5]不太可能会被研究者公布。
2、优先次序
我们通常不资助或追求最有益的工作[6]。虽然很难判断一系列调查最终会导致什么结果(很多重大发现发生在寻找不相关的事物时),但如果私营企业对他们面临的最重要挑战有一个更好的反馈机制,那就太好了。这与下面的“市场激励”有关。在写这篇文章的时候,我和一位科学家分享了一个轶事:“在我阅读到的论文当中,我看到超过70%的出版物都是关于技术的,而这些技术永远不会接近商业化。”[最近发生的一次1亿美元的大资金推动,在我看来,什么都不会发生。”
3、市场激励
研究有时似乎与现实世界脱节,也许这是因为,科学家们不经常捕捉到他们工作的财务好处。相反,他们会使用备用货币(如引文)。或许可简化许可证发放,使研究更符合市场激励,可以帮助科学家从发明中获得更多的好处。
4、接受资助
研究人员申请补助金和接受资助需要花费大量时间[8]。他们经常不得不改变他们的想法[9],使之适合拨款提议(也就是说,我能说这与国防开支有某种关系吗?)很多钱都花在了大学本身的运营上(例如,斯坦福大学的比例为50%左右)。此外,很多国家卫生研究院/国家自然科学基金的资助可能过于保守。写这些赠款的人正试图最小化不利因素,而不是最大化有利因素,这意味着他们可能会忽视(逆向)突破性想法。
5、速度
创造一个新的发现已经够困难的了,即便有了新的发现,它仍然需要很多年才能看到曙光。申请期刊和同行评审的过程,增加了很多延误。此外,人们对于发布正在进行中或完成了一半的工作(尽管“预印”服务网站有助于实现这一点)是会迟疑的,所以有一种倾向,就是等到“完成”了某件事情之后再去共享它。
6、可理解性
学术论文使用了非常多的行话,而这些术语只有在这个领域内的其他专业人士才能够理解。这其中有些是不可避免的(研究是关于复杂的主题),但这也使得该领域之外的人,不太可能了解新发现的潜力。
7、大量的重复性工作
市场上存在着大量的论文,其中有部分并没有太多的原创内容。这可能会使你很难涉过所有的材料,看看什么可能与你有关。
8、成本和可访问性
很多研究是由纳税人的钱资助的,可以说理应是对公众免费开放的,但它们却被锁在了期刊的付费墙后面。对此有一些解决办法 (例如Sci-Hub, 不过这是非法的,或者直接给作者发邮件要求一份副本)但是这些期刊给研究增加了很多摩擦,而它们并没有增加多少价值。
9、象牙塔
研究可以在任何地方进行,从欧洲核子研究中心的大型强子对撞机到车库,任何人都可进行研究工作,从终身教授到业余爱好者(甚至是匿名人士)。它也可以在私人公司和任何语言中发生(现在,以中文和英文发表的机器学习论文之间存在障碍)。
10、期刊
学术期刊似乎在时间和金钱上都放慢了速度,以换取提供一些管理和认证。学术期刊每年的总收入约为200亿美元,但它们却几乎没有增加价值。
提议的解决方案
指出问题很容易,创建解决方案却很困难。我会试试后者。
如果研究更像开源软件,更符合市场激励,那就更好了。如果其能够实现像reddit这样的优先顺序,像google docs这样的评论,以及像github这样的拉动请求,那也会很好。
我提出的解决方案是一个应用程序或网站,它以一种新颖的方式将一群研究人员聚集在一起。它试图提高研究的质量和速度,实现让研究者和企业家和商界人士沟通,以及解决科学家如何获得资金和优势的问题。
这算不上是一个新鲜的想法,我只是觉得它还没有被执行。
你将看到Reddit、Github、维基百科、StackExchange、RapGenius和Kickstarter的元素。其中的一部分,就是充分利用已在网上工作的资源。
另一部分是提供一种可行的科学期刊替代品。要做到这一点,我们需要复制期刊的积极方面(内容和出版者的地位/声誉的管理),并消除消极方面(成本和延误)。
以下是我提出的解决方案的每个核心的组成部分:
排名/优先顺序
每天,全世界发表的论文数量之多令人应接不暇。如果我们能让可信的人给论文打分,我们就可以把它变成类似排行榜的东西。想象一下,我们将能够看到“今年/月/周的生物学顶级论文”,这是基于知识渊博人士投票的结果。如果你一个月内只有几个小时的时间阅读论文(像我一样),这会有很大的帮助。
也许出于某种礼貌,学术界人士似乎不愿意在公共论坛对其同行发表批评或赞同的声音。期刊通常不公布同行评审人员的身份。我觉得这是问题的关键部分。
评分可能类似于谷歌的页面排名算法,这意味着他们的权重取决于评分者的知识或信任程度。
我可以想象研究是通过以下几个指标进行评级的:
1、独创性
这里有没有真正的突破,或者只是在知识树上增加了一个分支?
2、可再现性
这篇论文是否包含了足够的细节,它能让其他人复制这项工作,以及有多少其他人/实验室能够做到这一点?
3、商业可行性
这项研究是否有可能产生有益于人们的东西?
这些评分可以汇总成每篇论文的总分,最终可能会包含数百个变量(比如页面排名)。今天有一些基本的排名,比如H指数,其会考察论文被引用的频率。
尝试将论文整合到元研究中,在一个特定的结论上生成一个“信心”分数,并观察它随时间的变化,这将是很有趣的。
应该有某种方法可以清楚地将研究标记为“进行中”,并防止人们在研究真正“完成”之前获得负面评价。理论上,所有的研究都是“在进行中”的,所以,一个静态PDF的想法似乎已过时了。
声誉
在社区中进行评级(和讨论)的人的声誉,是这里的另一个关键组成部分。要想让这个网站可信,对某个领域有真正了解的人,需要把自己的声音提高到最高点,而不是被互联网巨魔淹没。与其他在线论坛(Reddit、Hacker News、StackExchange)类似,用户应根据自己的贡献逐步建立声誉。这可以从他们的评论、编辑、原始研究中得出,也可以是来自他们在应用程序之外的声誉(LinkedIn、更传统的学术证书等),这些都可以出现在个人资料页面上。换言之,传统的学术资格不应该是培养科研声誉的唯一途径。
关于该网站是否允许匿名用户,这是一个有趣的问题。我的直觉是说“yes”,如果用户愿意,网站允许他们匿名。原因很简单,有些领域很难在没有影响的情况下提出异议。正如Sam Altman所指出的:“几乎所有被证明是重大突破的想法,一开始听起来都像是可怕的想法。”伽利略因提出地球绕太阳运行的观点而被监禁。而中本聪,也是以假名提出了比特币的概念。我听过一些科学家的故事,当他们的研究与该领域另一位受人尊敬的人发生矛盾或竞争时,他们面临着报复。
想要保持匿名的用户,可能无法将他们的外部声誉带到网站上(这是不利的),但希望他们能够畅所欲言,“疯狂”的想法可根据自身的优点进行评估。
在这个网站上,享有声誉最重要的原因就是进行理智的讨论,那么合法的科学家便会觉得,他们可与其他理性的人进行互动。
资助问题
我们如何为这个社区中的每个人协调激励措施?我们希望鼓励参与(提交研究、评论/编辑等),并资助社区认为有价值的研究。
关于这一点,一个想法是做一种ICO,赠送那些激励社区的人。人们也有可能申请补助金,并用这种新token获得报酬。
捕获好处
今天,有很多有前途的研究从未被商业化。当这种情况确实发生时,一家公司或企业家通常会联系到大学的技术转让办公室,尝试并许可这种技术。或者,在某些情况下,研究人员自己也会尝试分拆公司,并取得不同程度的成功。
我想知道是否可使研究人员的技术许可程序,变得更为简单。想象一下,在每一篇研究论文的简介页面底部,都会有一个“许可”按钮。或者想象一下,其拥有标准的许可条款,类似于YCombinator安全文档,但用于许可该技术。理想情况下,人们可以在5分钟内授权技术,而无需拿起电话进行联系。
发布的每一项研究都可通过以下许可证之一获得(例如):
1、自由、公共领域
这实际上可能是一项要求,具体取决于资金来源。
2、“标准”许可条款
例如,对于前5年从中获得的任何产品,可获得1-5%的利润。非排他性许可。
3、定制
联系技术转让办公室(或同等机构)讨论定制交易。
简单的英语摘要
我发现大多数学术论文阅读起来相当有挑战性,所以,如果每一篇论文都写明试图做什么和发现什么的“简单英语”的解释,那会是很好的。例如,这些总结可以像维基百科一样众包,也可通过支付研究生费用来编写。
大多数论文都会包含一个“摘要”和“结论”部分,这在这个方向上迈出了很好的一步,但我认为这还远远不够。
例如,以我随机选择的这篇论文为例(在我写这篇文章的时候,它恰好位于archiv.org页面的顶部):
以下就是其摘要部分:
这是华丽语言的一个很好的例子,有时会使研究变得不可接近。一个更为简洁的总结可能就足够了,比如“子宫内的压力会在以后的生活中引起神经退行性疾病吗?”
旁注:我也试着阅读这篇论文的结论,但这样做之后,我却无法告诉你(1)他们尝试了什么?(2)它起作用了吗?(3)限制是什么?(4)下一步的建议是什么?
因此,我认为,为更广泛的读者总结研究,可能会是非常好的改进,可能是针对高中或本科生的阅读水平。维基百科就是一个很好的例子。他们对如何使技术文章更容易理解,以及如何写出一般清晰的文章有一些独到的方法。他们的指导方针提出了一种“直截了当、实事求是”的风格,这种风格没有任何意见,而且“对最广泛的普通观众是可用的”。
我有时想知道,科学家们是否有充分的理由,而迟疑不肯用通俗易懂的语言来解释问题。人们可能不适当地按照他们所说的医学建议行事,他们可能被数字暴徒误报或攻击,或者他们可能被指控“炒作”他们的工作,而不是用精确的科学语言。用代码说话,有助于确保只有他们想说话的人才能理解他们在说什么。这是一种合理的生存本能,但也意味着,大多数研究都是在小的封闭群体中进行的。我认为维基百科可以向广大读者解释复杂的话题,同时在必要时仍能深入了解技术细节。
讨论、编辑和协作
这方面的现代工具,应用于研究将是一件好事。
像Reddit、Hacker News和StackExchange这样的网站,已展示了嵌套和投票/排序评论的强大功能。令我惊讶的是,这并没有在互联网上普遍存在。它们并不难实现,但是互联网上绝大多数的网站仍然有按时间顺序排列的、内容质量低劣的评论部分。这包括我看过的所有可讨论学术研究的网站。
在Genius.com或Google Docs上尝试内联评论来讨论论文中的特定行也是很有趣的。
不过,讨论只是触及了表面。为什么不允许人们像在Github那样为论文进行提交贡献,或者像在Google文档中那样进行建议的编辑?为什么不让人们加入合作者(即使他们在现实生活中从未见过)。为什么不让人们分叉研究,把它带到一个新的方向呢?
今天的研究环境中,最大的问题之一(至少在我看来)在于团队似乎是孤立地工作,直到某件事情“完成”或准备发表。当然,研究(就像软件一样)很少会被“完成”;它不断被改进。我认为开源软件在这里有一个更好的模式和文化,从第一天开始,你的第一次提交就公开了,而且从来没有所谓的“完成”,因为你永远不知道谁会在路上帮助你完善这项工作。
对所有人开放
我有一种预感,如果研究在封闭的学术圈之外开放,我们将获得更多的创新。可能有人有一个重要的新想法,而他只是在他们的车库里工作,或是在世界另一边的一个实验室里工作。
许多伟大的创新,都是作为一种试图建立某种东西的副产品而发生的。将应用科学家、工程师和研究人员聚集在一个社区中,会有很大的帮助。
很高兴看到终身教授和修补匠们并肩评论。我们可以将在特定问题上协作的人数增加10倍。
超越“论文”的概念
一篇论文意味着一个完成的出版物有一组固定的贡献者。
如果人们也能发布正在进行的研究,那就太好了。也许只是一个假设(你希望在未来看到测试的东西),或者一个数据集(你不能从中得出任何结论,但也许其他人可以)。这也可以采用Jupyter交互式笔记本的形式。
也许更基本的单位是一个实验。你试过什么?结果如何?这意味着什么?我们有多确定这是正确的?有哪些例子可以说明这一点?
类似的解决尝试
下面的每一项都解决了一个问题。
1、网络/会议/朋友
这是目前的主要方法,尽管它过于依赖偶然事件。有多少家公司因为两个人没能见面而没有成立,每个人都有一半的好主意?
2、维基百科
一些最大/最受欢迎的科学突破,以非学术界人士能够理解的方式,被进行了科普,但覆盖范围不够。
3、Github
我们开始看到更多的数据集在这里发布,这很好。
4、Arxiv.org、 PubMed、 PubChem、 Biorxiv等
这些预印服务网站已经朝着正确的方向迈出了一步(消除了一些收费墙)。
5、Arxiv-sanity
朝着正确的方向迈出了伟大的一步,使大量发表的论文更容易获得,但可能会更进一步。例如,它只涵盖机器学习论文。
6、Reddit/HackerNews/StackExchange
有些主题已经获得了自己的子板块论坛,比如/r/machine-learning。HackerNews是我第一次了解到比特币白皮书的地方(我不会经常阅读CS论文,而我是在该网站上碰巧读到了比特币的白皮书)。这些网站为你提供排名和声誉。
7、YouTube
解释加密货币和机器学习等主题的渠道,使某些研究主题更容易访问。
8、Sci-Hub
人们已经开始盗版论文,使其更容易在网上被访问,即使这违反了法律。
9、大型科技公司
GAFA这四大巨头公司和其他一些公司做得很好,部分原因是他们有伟大的科学家,在内部与优秀的产品/业务人员合作。这项研究的大部分都是专有的。
10、Experiment.com/ScienceExchange.com
众包研究。
11、Google Scholar和 ResearchGate
朝着正确的方向迈出的伟大一步。
12、Meta.org和OccamszRazor
使用自然语言,尝试让相关论文变得更容易被发现。
13、开放科学中心
以及开放的科学框架。
其他人则注意到,这里存在着一个杀手应用的机会。
结论
创新有时只是把花生酱和巧克力结合在一起,然后创造出比各部分总和更大的东西。你有一半的想法,世界上某个地方的人,可能会有另一半的想法。如果你们能够找到彼此,创新就会发生得更快。
为了让这项工作发挥作用,你们当中至少有一人需发表自己半生不熟的想法(我称之为发出蝙蝠信号),这样其他人就能找到你。而使学术研究变得更像软件(Github等)编程那样,将是朝着这个方向迈出的一大步。
我写这个是为了发出我自己的蝙蝠信号。也许世界上有人有另一个解决办法。我也考虑过投资一个好的团队来应对这一挑战。
如果你有兴趣听到更多关于这一想法,或者说你有一个解决方案,你认为我应该知道,或可能想自己解决这个问题,请填写这张表。
感谢以下阅读本文草稿的人(及其他人),包括:Alice Zhang、Balaji Srinivasan、Carly Emmer、D.Scott Phoenix、Elad Gil、Fred Ehrsam、Genevieve Khoo、Janelle Tam、Kathryn Loving、Ling Wong、Rob Rhinehart、Shivon Zilis、Tim Holme以及Tristan Tager。
脚注:
以下是阅读本文草稿的科学家们所留下的评论。
1、关于科学家和商业人士之间缺乏信息交流:
“在1945年以前,这些团体之间的信息交流更为频繁。现代国家科学基金/国家卫生研究院的资助制度,源于范尼瓦尔·布什的备忘录,该备忘录将科学研究联合起来,并在科学家和商人之间建立了一个部门。但是,在没有国家科学基金资助的情况下,航空、汽车和铁路大部分是由私营企业开发的。事实上,铁路和蒸汽机导致了经验热力学(empirical thermodynamics),进而导致了统计力学。同航空航天工程一样,它最初是经验和现象学的,而由工业驱动后,才变成了科学。”2、关于突破的来源:
“值得一问的是,有多少百分比的社会效用来自企业家、大学和研究机构。一方面,你有赖特兄弟、贝尔、爱迪生、福特、帕洛阿尔托研究中心、沃兹、英特尔等公司。另一方面,我们通过资助绕道而行的项目,发现了一些他们没有打算去发现的有价值的东西(例如CRISPR基因编辑技术、青霉素),并经历了难以置信的社会投资回报率。”3、关于出版导致额外拨款:
“在我看来,这是问题的根源。国家卫生研究院的资助,是大多数学术实验室的生命线,它们对著名的出版物(如Nature、Science、Cell)施加了沉重的压力。很多顶级期刊都是以营利为目的的,因此它们正在优化以获得读者群的热门科学故事,而不是注重再现性或商业化。此外,美国国家卫生研究院事实上非常规避风险,倾向于资助那些已有成果的研究人员,这些研究人员正在提出逐步消除风险的科学。我们经常把著名的调查人员放在补助金上,因为我们知道这会增加我们获得补助金的机会。在我的旧实验室(加利福尼亚州最有资金支持的实验室之一),我们的PI(老板)实际上会获得他已完成工作的补助金,并且实际上会将补助金用于其他新工作,这也说明了补助金制度所存在的风险。”4、关于可再现性:
“对我来说,这是最重要的。这应该是近十年来的危机。除了糟糕的科学造成的巨大资源浪费之外,加上科学的可信性丧失,这降低了公众资助和相信科学的意愿。”5、关于负面结果:
“核心问题是,学术届对惊人的结果会有更多的激励,这使得很多研究人员下意识地去夸大结果,使其更加令人惊讶,而不会去发表负面的结果,或者检查现有的结果。当然,这种夸大会使结果不可复制。同样,期刊也可能不会发表负面或证实性的研究,因为这些研究不会吸引读者。”6、优先顺序和商业可行性:
“什么是‘做得最好’很难确定,此外,很难说下一个突破将从何而来。例如,Alimta这种新的抗癌药物,是在对色素的研究中发现的,这种色素赋予了帝王蝴蝶翅膀明亮的橙色色调。我们也有可能看不到我们多年来资助的研究成果。也许早期的工作不会商业化,而这为将来的工作奠定了基础。”7、关于大学知识产权许可:“我不一定同意[你关于优先顺序的观点]。国家卫生研究院最初设想的任务,是资助那些可能没有明显直接商业价值(已经得到资助)的重要科学工作,并可能导致更大的创新,这些创新正在以我们无法预料的方式改变游戏。举个例子,CRISPR是在对一种不知名的海洋细菌的研究中发现的……当时人们可能会争辩说,这显然不是最有效的方法。关键是,要确定一个先验的概念,即现在“做得最好”是什么样子,而不是5年、10年、100年。”
“当你在一所大学工作时,你所产生的所有知识产权都归该大学所有。当大学将知识产权许可给外部机构时,其代表的是一所大学,而不是研究者。大学越来越多地依靠从发现的重磅研究中获得的版税来资助他们的项目。在过去的几年里,我看到大学在签订许可协议方面变得越来越贪婪和咄咄逼人,这不仅降低了商业化的速度,而且降低了生物技术的总体发展速度。”8、关于资助项目与人员:
“想象一下,如果一家初创公司获得了资金,但其无法实现转机,并且其必须达到预先拟定的里程碑时,它才能获得更多的资金。这往往意味着创新会被中断,因为你不能改变方向。卫生和公众服务部为项目人员提供资金(例如,“我将为你在这一领域的工作提供资金”,而“你唯一能做的,就是做这一领域的这一非常具体的事情”),这似乎是资助机构的一个很好的模式(不包括应该得到特别资助和完成的利基研究)。”