首页 首页 人工智能 查看内容

伯克利实验室开发“最小机器学习”算法,用较少数据分析图像

木马童年 2019-5-27 15:10 89 0

美国能源部下属的劳伦斯伯克利国家实验室(简称伯克利实验室)的数学家们开发了一种新的机器学习方法,旨在处理成像数据。传统机器学习方法需要用到成百上千张图像,而这种新方法学习起来用到的图像少得多,并且学习 ...

美国能源部下属的劳伦斯伯克利国家实验室(简称伯克利实验室)的数学家们开发了一种新的机器学习方法,旨在处理成像数据。传统机器学习方法需要用到成百上千张图像,而这种新方法学习起来用到的图像少得多,并且学习速度也更快。

伯克利实验室能源研究应用高级数学中心(CAMERA)的Danil Pelt和James Sethian通过开发“混合尺度密集卷积神经网络(MS-D)”,颠覆了普通机器学习的概念,这种MS-D的新方法比传统方法所需参数更少,收敛地更快,并且能从一个非常小的训练集“学习”。他们的方法已经用于从细胞图像中提取生物结构,并且能提供一个重要的新计算工具来分析广泛的研究领域数据。

随着实验以更高的速度产生更高分辨率的图像,科学家们难以管理和分析所产生的数据,而这些都需要人工完成。2014年,Sethian在伯克利实验室成立了CAMERA,作为一个综合性跨学科中心,它的作用时为美国能源部提供和开发数学工具。CAMERA是实验室计算研究部门的一部分。

“在许多科学应用中,标注并给图像打标签需要花费大量精力,有可能需要几周时间才能生成非常细致的图像,”Sethian说道。“我们的目标是开发一种从非常小的数据集中学习的技术。”

关于算法的细节发布在论文中。

“我们发现,通过对不同尺寸的图像进行缩放捕捉图像特征的过程,可以用单一图层的数学卷积代替,”Pelt说道。他是荷兰数学和计算机科学国家研究院计算成像小组的成员。

为了让更多的研究人员能使用这种算法,由Olivia Jain和Simon Mo领导的伯克利团队创建了一个门户网站“分段标记图像数据引擎(SlideCAM)”,作为CAMERA的一部分。

算法的一个有前景的引用是了解生物细胞的内部结构,在其中一个案例中,Pelt和Sethian的方法只需要来自七个细胞的数据,就能够确定细胞结构。

“在我们的实验室里,我们正在研究细胞结构和形态是如何影响或控制细胞行为的。我们用无数个小时人工区分细胞以提取结构,并区分健康与患病细胞之间的差异,”加利福尼亚大学旧金山医学院的教授Carolyn Larabell说。“这种新方法有可能彻底改变我们对疾病的认识能力。”

用较少的数据获得较多的知识

图像无处不在。智能手机和传感器已经产生了海量图片,许多图片上还表明了与内容相关的信息。利用这个庞大的数据库,卷积神经网络和其他机器学习方法已经彻底改变了区分图像的方式。

这些方法通常都是通过调整大量隐藏的内部参数来“学习”,并以数百万个被标记的图像为指导,同时还需要花费大量计算时间。如果你手头没有那么多标记图像怎么办?在很多领域,这样的数据库简直是奢侈品。生物学家记录细胞的图像,并且艰难地勾画出细胞的边界和结构:花几周的时间绘制出一幅三维图像是正常的。材料科学家用层析重建技术仔细研究岩石和材料,他们用手标记不同的区域,对比岩石中的裂缝和空隙。不同但重要的结构之间的差异通常非常小,数据中的噪声可以掩盖这些特征,愚弄最好的算法(包括人类)。

对于传统的机器学习方法来说,拥有这些珍贵的手工编辑图像还远远不够。CAMERA的科学家们为了“少花钱多做事”,他们想要弄清楚如何建立一组高效的数学“操作符”,这可以大大减少参数的数量。这些数学运算发可能自然包含着关键的约束条件以帮助识别。

混合尺度密集卷积神经网络

机器学习在成像问题上的许多应用都使用深度卷积神经网络(DCNNs),输入的图像和中间图像被卷积在大量的连续层中,是的网络能学习高度非线性的特征。为了对难以处理的图像问题得到准确的结果,DCNN通常依赖于附加操作和连接的组合,包括各种图像尺寸放大缩小以捕获图像特征。为了训练更深入和更强大的网络,通常需要额外的图层类型和连接。最后,DCNN通常使用大量中间图像和可训练参数(通常超过一亿个)来解决难题。

相反,他们所提出的混合密度网络架构就不会出现这些复杂情况,并计算扩张卷积代替图像缩放以捕获各种空间范围内的特征、在单一图层内采用多个比例、密集连接所有中间图像。这种新算法通过几个中间图像和参数就实现了准确的结果,无需调整参数或者训练附加图层。

从低分辨率数据中得到高分辨率图像

随之而来不同的挑战是从低分辨率的输入中生成高分辨率的图像。当我们想看清图像的细节时往往会将图片放大,然后越放大细节就越模糊。但是用MS-D网络生成的一小组训练图像能够解决这一问题。假设你要对纤维增强的微型复合材料进行层析重建,在本文所提到的实验中,可以使用1024个X射线投影重建图像,以获得具有相对低噪声的图像。然后用128个投影重建来获得同一对象的含有噪声的图像。训练时输入的是带有噪音的图像,相应的无噪音图像用作训练期间的目标输出。已经训练好的网络能够有效地处理噪声输入数据,并重建更高分辨率的图像。

新应用

Pelt和Sethian目前正将他们的方法推广到更多新领域中,例如快速实时分析来自同步加速器光源的图像以及生物重建的问题,例如细胞和脑图。

“这些新方法令人非常兴奋,因为它们能扩展机器学习在成像领域的应用范围,”Pelt说道。“通过减少训练所需的图像数量,增加可处理的图像大小,新架构可用于解答研究领域许多重要的问题。”

论文地址:docs.wixstatic.com/ugd/cc66e4_bb1cd44c5f354517bb3f7b8c1db45cc4.pdf

原文地址:newscenter.lbl.gov/2018/02/21/new-berkeley-lab-algorithms-create-minimalist-machine-learning-that-analyzes-images-from-very-little-information/

机器人网原创文章,未经授权禁止转载。详情见转载须知

在不久的将来,多智时代一定会彻底走入我们的生活,有兴趣入行未来前沿产业的朋友,可以收藏多智时代,及时获取人工智能、大数据、云计算和物联网的前沿资讯和基础知识,让我们一起携手,引领人工智能的未来!

机器学习 卷积神经 计算机科学 图像数据 智能手机 数据库
0