一篇深度学习论文背后的大规模在线协作

简介: 本文讲述大规模的在线合作完成了一篇深度学习论文,共同研究深度学习在生物医学领域的开发与潜力。

crowdsourcing.jpg

2016年夏季,生物信息学教授Anthony Gitter和Casey Greene发表了一篇关于深度学习的生物医学应用的论文,该论文致力于研究一个热门的新型人工智能领域:模仿人类大脑的神经网络。

该论文完成后还引出了一个有趣的学术众包案例。如今,已有40多名在线合作者对这篇论文进行了大量的编写和修改,甚至其中大多数协作者的贡献足以成为共同作者。

2018年4月4日《皇家学会界面》杂志刊登了最新研究成果“生物学和医学深入学习的机遇与障碍”。

Gitter毕业于威斯康星-麦迪逊大学,现Morgridege研究所工作,Greene毕业于宾夕法尼亚大学,二者皆致力于研究如何用计算工具解决健康和生物方面的巨大挑战。他们希望看到深度学习在这个方面发挥作用,以及在生物医学领域尚未开发的潜力。

Gitter认为这个过程与开源软件社区的工作原理相似。他说:“我们基本上都是在用软件工程的方法撰写学术论文,而选择GitHub网站作为主要写作平台,是因为它是最受欢迎的线上协作编写代码的网站。”Gitter还补充道:“我们还采用了软件工程工作的思路,即让团队共同合作完成一个产品并自动协商下一步工作。”

新的协作作者经常通过提供一些例子来说明深度学习如何影响了他们的科学领域。Gitter举例说,低温电子显微镜技术是生物成像的一个新的必备工具,而一位科学家使用深度学习技术对低温电子显微镜技术的提升做出了重大贡献。其他人重写了这部分,使其更容易被非生物学家接受,还有人提供了关于医疗数据隐私的道德背景。

深度学习是近年来取得突破性进展的机器学习工具的一部分。它利用神经网络的结构将输入馈送到多个层来训练算法。并且可以构建方法来识别和描述数据中的循环特征,同时还能预测一些输出。当深度学习在“无监督”模式下工作时,能够自动解释或识别数据中的有趣信息。

例如一个著名的无监督深度学习案例:谷歌的神经网络在没有人为控制下,能够自动识别视频的重要组成部分,例如该视频主要由面孔、行人和猫组成。

深度学习已经改变了人脸识别、语言翻译等应用程序。例如,在众多高智能的应用程序中有一个能够完成一个项目,即识别并学习著名画家的标志性艺术特征,从而能够将日常图片转换成梵高、毕加索或莫奈的作品。

Greene说,虽然深度学习还没有完全揭示医疗数据中的“隐藏猫”,但是已经取得了一些突破性的进展。现在正在研究的深度学习项目包括,如何根据疾病亚型和最有效的治疗选择对乳腺癌患者进行分类。另一个研究项目是如何在巨大的自然图像数据库上训练深度学习,从而能够诊断糖尿病、视网膜病变和黑色素瘤。而这些应用都远超现在最先进的工具。

深度学习还能改进临床决策,不仅能提高临床试验的成功率,还能更好地预测新药候选药物的毒性。

Gitter说:“深度学习尝试通过整合信息来预测哪些人有可能罹患哪些疾病,这样可以确定谁需要做更多的筛选或测试,以及如何尽早避过这些疾病。这是一种预防性的、前瞻性的思维方式。即使当前技术无法达到这些目标,我和我的合著者仍感觉非常兴奋,因为我们知道这潜在的回报非常巨大。”

 

本文由北邮@爱可可-爱生活 老师推荐,阿里云云栖社区组织翻译。

文章原标题《Scholarly snowball: Deep learning paper generates big online collaboration》

作者:Morgridge Institute for Research 

译者:奥特曼,审校:袁虎。

文章为简译,更为详细的内容,请查看原文

相关文章
|
27天前
|
机器学习/深度学习 数据采集 算法
构建高效图像分类模型:深度学习在处理大规模视觉数据中的应用
随着数字化时代的到来,海量的图像数据被不断产生。深度学习技术因其在处理高维度、非线性和大规模数据集上的卓越性能,已成为图像分类任务的核心方法。本文将详细探讨如何构建一个高效的深度学习模型用于图像分类,包括数据预处理、选择合适的网络架构、训练技巧以及模型优化策略。我们将重点分析卷积神经网络(CNN)在图像识别中的运用,并提出一种改进的训练流程,旨在提升模型的泛化能力和计算效率。通过实验验证,我们的模型能够在保持较低计算成本的同时,达到较高的准确率,为大规模图像数据的自动分类和识别提供了一种有效的解决方案。
|
3月前
|
机器学习/深度学习 自然语言处理 数据挖掘
【论文精读】TNNLS 2022 - 基于深度学习的事件抽取研究综述
【论文精读】TNNLS 2022 - 基于深度学习的事件抽取研究综述
|
1月前
|
机器学习/深度学习 自然语言处理 前端开发
2024年3月最新的深度学习论文推荐
现在已经是3月中旬了,我们这次推荐一些2月和3月发布的论文。
46 0
|
2月前
|
机器学习/深度学习 编解码 人工智能
2024年2月深度学习的论文推荐
我们这篇文章将推荐2月份发布的10篇深度学习的论文
56 1
|
8月前
|
机器学习/深度学习 自然语言处理 算法
【论文精读】TNNLS 2022 - 基于深度学习的事件抽取研究综述
事件抽取是从海量文本数据中快速获取事件信息的一项重要研究任务。随着深度学习的快速发展,基于深度学习技术的事件抽取已成为研究热点。文献中提出了许多方法、数据集和评估指标,这增加全面更新调研的需求。
362 0
|
11月前
|
机器学习/深度学习 算法 数据可视化
深度学习论文阅读目标检测篇(一):R-CNN《Rich feature hierarchies for accurate object detection and semantic...》
 过去几年,在经典数据集PASCAL上,物体检测的效果已经达到 一个稳定水平。效果最好的方法是融合了多种低维图像特征和高维上 下文环境的复杂集成系统。在这篇论文里,我们提出了一种简单并且 可扩展的检测算法,可以在VOC2012最好结果的基础上将mAP值提 高30%以上——达到了53.3%。
121 0
深度学习论文阅读目标检测篇(一):R-CNN《Rich feature hierarchies for accurate object detection and semantic...》
|
11月前
|
机器学习/深度学习 自然语言处理
十年来论文量激增,深度学习如何慢慢推开数学推理的门(2)
十年来论文量激增,深度学习如何慢慢推开数学推理的门
|
11月前
|
机器学习/深度学习 消息中间件 人工智能
十年来论文量激增,深度学习如何慢慢推开数学推理的门(1)
十年来论文量激增,深度学习如何慢慢推开数学推理的门
105 0
|
11月前
|
机器学习/深度学习 自然语言处理 算法
深度学习,经典论文盘点!
深度学习,经典论文盘点!
|
11月前
|
机器学习/深度学习 编解码 并行计算
深度学习论文阅读目标检测篇(七)中文版:YOLOv4《Optimal Speed and Accuracy of Object Detection》
大多数基于 CNN 的目标检测器基本上都仅适用于推荐系统。例 如:通过城市摄像头寻找免费停车位,它由精确的慢速模型完成,而 汽车碰撞警报需要由快速、低精度模型完成。改善实时目标检测器的 精度,使其能够不仅可以用于提示生成推荐系统,也可以用于独立的 流程管理和减少人力投入。传统 GPU 使得目标检测可以以实惠的价 格运行。最准确的现代神经网络不是实时运行的,需要大量的训练的 GPU 与大的 mini bacth size。我们通过创建一个 CNN 来解决这样的 问题,在传统的 GPU 上进行实时操作,而对于这些训练只需要一个 传统的 GPU。
190 0