使用百度EasyDL在临床检验中实现对抗学习算法

  

EasyDL是百度为小型商业企业或个人提供的AI图像识别方案,具备简单、易于操作、快速形成图像识别类产品的优势。EasyDL让中小型企业及个人可以在很短的时间赋能AI特长,将图像识别投入到生产或者兴趣制作之中,它可作为一套极为优秀的技术解决方案的基石。

图像特征学习算法是从传统图像模式识别算法中衍生的新型算法,其算法原型借鉴于Leica Biosystems的下属品牌Aperio系列软件Image Analysis,是极为成熟的Image Analysis的模式识别算法的迭代进化算法。目前特征学习算法应用于临床无染色尿沉渣检验医疗器械产品。

EasyDL与特征学习均具备良好的易操作性,极少的样本量;且它们互通用学习样本,互通学习样本采集及标注工具,顾可相互形成对抗互校,形成更高形态的AI学习,在互相较量中形成更为精准的识别模型。

识别模型训练:

特征学习从原始图像中制作成可用于训练的图像模型,需如下八个步骤:图像增强、图像切割、图像标注、图像修饰、训练可用性审核、单种类特征模型学习、多种类特异性特征学习、训练模型注入到作业程序。

EasyDL与特征学习的训练方式基本互通,只是单种类特征模型学习与多种类特异性特征学习过程中,EasyDL是由深度学习作为其中多个逻辑层自主完成计算。

在训练模型注入到作业程序环节中,特征学习依靠本地内网系统优势自动完成,而EasyDL提供API接口及本地化识别SDK完成部署。

学习类型

图像增强

图像切割

图像标注

图像修饰

图像审核

单特征学习

特异性学习

作业应用

特征学习

共用特征学习配属的软件

便利

AI自主

AI自主

可人为干预

本地化部署直接注入识别作业

EasyDL

便利

AI自主

AI自主

支持API嵌入

SDK本地化部署

EasyDL与特征学习的对比

1) 图像增强

特征学习提供比较适合临床检验镜下图像的“L30图像增强”,用来调整图像增强参数,以获得更好的图像特征。增强后的图像比增强前的图像更加清晰,细胞内纹路更加鲜明,背景更加纯正,但有时也会遇到过增强,所以要适配显微镜和摄像头参数来进行增强。

增强前                                 增强后

2) 图像切割、图像分类、图像标注。

图像切割也可以使用特征学习的快速切割分类标注软件“L31图像标注”系统来完成。L31的使用非常便利,只需要圈选单个细胞,再点击细胞分类,L31就会自动完成图像切割,并自动命名为标注名称,并上传至内网图像数据服务器“HomeShip\FH\细胞名称\”之中。

EasyDL的训练图像需要上传完成至百度的训练服务器之中,所以要在图像修饰作业之后,将每一类细胞、结晶、管型、真菌单独上传即可。

特征学习自带的图像切割、分类、标注系统

3) 图像修饰:

图像修饰的目的在于清除掉与目标对象无关的图像信息,让训练模型减少干扰训练的因素。“L33特征学习系统”自带图像修正工具,可以简单高效的处理训练图像,将无效信息去除。修图过程仅需要几步:

1. 点击两次“阔边”,扩大边界范围

2. 点击“标记背景”,让AI能够获知背景色,(小红框)

3. 点击“涂抹”擦掉无效的杂色与杂质

4. 点击“收边”,尽可能将细胞主体放置在图像中央

5. 点击“保存图像”,进行保存

此内置图像修正工具,一般修正一张图像仅需要10秒钟。

修图前                                      修图后

4) EasyDL图像上传:

首先是在http://ai.baidu.com/easydl/ 注册,并创建EasyDL服务,具体见百度官方说名

然后,创建模型,填写模型名称等相关信息。

点击“开始训练模型”

选择“物体检测”

会弹出此框,这是模型流程,点击“知道了”

创建模型

填写模型信息,模型名称是该模型的类型名称,点击“下一步”

这里会生成刚刚创建的模型并显示模型ID

创建数据集,我们将刚刚通过特征学习的图像切割软件的一个子类名称命名为数据集名称。

这里创建了两个数据集,正常红细胞与正常白细胞,点击右侧的“标注/上传”,导入数据图像。

新创建的数据集为空,所以点击上传图像。

添加图片

打开特征学习服务器存档路径,注意的是每次只能上传20张图像。因为所上传的图集都是特征学习切割后的图像,所以不会受到EasyDL的图像大小限制。

点击“上传图片”

点击添加标签,“BLC”为白细胞(主要为中性粒细胞)。红细胞及晶体标签方法等同白细胞,不再累述。

数据集上传完毕,点击左部导航条“训练模型”选项

数据集选择红细胞,同时添加标签中,可以切换数据集选择白细胞。

选择好训练内容后,检查一下,即可点击开始训练。“离线识别SDK”选项不需要勾选,因为对抗训练是基于端与云的双平台系统对抗,此外EasyDL对于端硬件兼容性不佳,也不适于前端部署。

之后我们需要等待一定时间,让百度强大的云平台自行训练。本次训练约1.5小时,训练完成后,点击左侧导航栏校验模型。

选择好模型后,对模型进行校验。

然后申请接口地址,然后点击提交申请

然后等待模型审核,之后便可在等待审核过程中,进行特征学习的训练。使用特征学习的训练图像制备软件,可以得到极高的精确率,以及极高的抗干扰性。

特征学习图像训练需要使用“L33图像学习系统”,其由五部分构成:特征提取方法编辑器、图像目录、可训练图像清单、特征指标清单、单指标计分与学习状况。特征基础元素由特征方法编辑器控制,一般不建议修改。

1.首先通过图像目录确认训练图集的路径

2. 第一次训练点击“全否“,然后点击红色按钮”开始训练“

3.每次训练图会自动识别细胞边缘,需要医师确认轮廓是否囊括整个细胞?如果囊括则点击“是“,则进行下一图训练。

4.当训练完成后会提示完成,AI会自动计算出学习的结果于“特征指标清单“之中,可以点击查看

5.对于不可用的图像可以点击“否“,进行暂停修正作业,或删除、或继续修改。

6.AI会自动对打勾的图像默认为可用图像,所以不会弹出选项。

D. 调整权值:在特征指标清单中,可以根据待识别分型的特性,对特征指标进行选择;未被选择的指标不会参与计算。例如红细胞的体积和周长在一定范围,所以可被使用,而晶体没有大小限制,却有自身形状和色彩的区别,因而可以使用特殊色系指标。

每种指标有各自的权重,点击指标后,可以选择权重状况。AI会根据权重选项的不同,自动计算出指标权重档位,并在下次计算中,规划计分标准。

权重不同,计分棒的粗细也会不同,但是计分只会在下次训练中更新

由AI学习后的单个特征指标学习后的识别模型

当调整了权重后,再次点击红色按钮“开始训练“,则AI会在3~5分值内快速完成对新指标的识别模型。

E. 测试识别:测试识别依赖于“L35图像识别系统“,L35是root主系统的后台系统,所以没有操作界面,需要依赖指令打开;但我们提供了L35的测试指令文件,可以双击直

测试模式下,AI不会对细胞种类进行判定,而是将每一个细胞针对该类型的识别计分进行展示,一般情况下,符合识别模型(编号02为白细胞)为正数,不符合和图像质量欠佳的为负数,图中白细胞基本为正数,不符合的均为负数。

偶尔情况下,你粘连图像会为正数,此种状况,只需要在尿沉渣主系统中,修改识别计分范围即可,或在提取方法中,引用图像分割函数。如果识别状况仍然不满意,可以通过调整权重实现精确控制识别,可以多尝试几次,即可成功。

F . 正式识别程序,是由尿沉渣主系统控制并调用,识别结果会显示在尿沉渣主系统之中。在主系统正式识别操作中,对于错误的标注进行修改,系统会将被修改细胞自动归纳为新的学习样本,在下一次系统学习中,即可实现自我的升级迭代。

EasyDL的识别部署:

当EasyDL模型审核通过之后,我们有两种方法使用EasyDL的识别,一种是使用“体验H5”,生产H5的二维码,上传图像进行识别。

以上上传的图像,均识别为BLC白细胞

对抗算法的实现:

目前EasyEdge暂未上线,所以EasyDL只能部署于安卓系统的端设备之中,EasyDL的推理系统暂时不能部署于封闭网络环境中,因此EasyDL暂时只能作为网上对抗系统。当EasyDL完成WIN版SDK部署,即可实现双前端AI对抗验证。

EasyDL与特征学习目前的对抗,主要体现在错误识别的相互指正,然后通过人为分析结果,将错误的图像,重新加入到训练模型的数据集之中,让模型实现叠代。目前,对抗训练仍是需要采用手工完成,自动对抗训练系统正在开发之中。

三种AI相互的优劣势在临床检验尿沉渣中的比较:

AI名称

泛化识别

每种类训练样本最低需求

模型训练速度

层拟合

训练平台

单体识别准确率

团状粘连识别准确率

去团状粘连算法

EasyDL

支持

50以上

刻钟计

自动

云平台

>85%

待平台开放

去卷积

特征学习

不支持

100~300

分钟计

自动

任意普通电脑

>85%

>40%

针对性切割算法

标准深度

支持

3000以上

小时计

自动

GPU服务器

>85%

20%

去卷积

 

AI名称

识别平台

识别核心

平台核心硬件

200万像素全流程识别耗时

200万像素全流程计算力需求

计算模式

工业环境

作者:佚名_51CTO
原文链接:http://ai.51cto.com/art/201906/598527.htm