宜远分享丨2017小蛮腰科技论坛演讲实录
2017-11-01 17:42:00
宜远CEO吴博简介
吴博,深圳宜远智能科技公司创始人和CEO,英国利兹大学博士后,谷歌研究奖获得者。曾在爱立信大数据研究院等多家公司任相关职位,拥有丰富的机器学习、软件技术与数据团队管理、百亿级交易额虚拟品系统架构与数据变现经验;著/译有《共享经济2.0》、《数据天才-数据科学家修炼之道》等。在ICML/ACL在许多顶级会议发表过多篇人工智能论文,在强化学习、迁移学习等领域经验丰富。
以下为吴博先生在2017小蛮腰科技论坛上的演讲实录:
演讲正文
各位嘉宾还有孙主任好,还有各位领导、各位会长、各位同志,大家好!今天我跟大家分享一下我们在医疗AI领域的一些经验和我们遇到的一些挑战。
我们公司成立的时间不长,但是也立足于给医疗行业的一些合作伙伴做服务,也有幸一个新成立不久的公司跟IDG有一些好的合作。我们给大会做了一些服务,有幸成为大会的合作方,也相当于这次的会议我们多少也有一点小东道主的感觉,所以在开始的致辞里面,我还是愿意拿一些时间来感谢各位。像钟宏是我的师兄,感谢宋新主任,感谢卫计委的领导,还有一些创业的同行。
今天我讲的是一个很细分的领域——皮肤,所以我们团队内也有比较资深的顾问,刘晓明是享受国务院津贴的专家,也在大连医科大学从业很多年。大连医科大学除了皮肤病很厉害,他在医美领域也是全国开过医美医生培训唯一的学校,所以他在这块跟我们进行了很深的合作,我们后面在经验分享的时候讲到,做医疗AI遇到的一些挑战,以及怎么样跟医生进行合作,化解这些挑战。我今天抛砖引玉,希望给后面的嘉宾引发更多的思考。
我会跟大家讲一讲皮肤AI的必要性和近况,结合我们做这一块的实践,讲一讲怎么样应对做AI和医疗结合的一些挑战。
皮肤病人数是比较多的,全世界60几亿的人口,或多或少得皮肤病的可能有4-5亿,我国可能有1.5亿的皮肤病患者,这是比较严重或者比较明显症状的,并且增长的趋势以及年轻化的趋势特别明显。特别有一些皮肤病,他的发病比较反复,所以他就需要长期的管理。
还有一个现象,我们也遇到过,说皮肤病这个事情医生一目了然,有什么AI的价值呢?其实有一个数字可以分享给大家,我们中国皮肤科的医生没有大家想像的那么多,几万的医生对应十几亿的人口,这个数据是比较准确的,可能6万人对应一个皮肤科的医生。你可以感受到整个医生资源的对照来看还是比较短缺的。
前面殷大奎的原卫生部的副部长说过,皮肤是常见病、多发病,而且病情种类多,很多皮肤病是表象,他跟很多内部其他的疾病是有关系的。我们公司也跟一些其他的医院做除了皮肤病之外的其他医疗影像的合作,像我们301一些医生的合作,他就告诉我们,他们看一个医生这个身上长的是紫癫,在地方的医院看了很久没有治不好,到了301医院才知道是消化道的疾病有关。你身上表现的一些皮肤病有可能不在表,而是在里。
皮肤病的发病率一年一年在增加,整个皮肤病的药的市场非常之大,200多亿,而且增长率有3.3%。皮肤病的用药比较多,各种抗真菌的药,还有各种止痒的激素,外用药占比很大。
AI对于皮肤病的价值来说,患者是特别巨大的,有上升的趋势,医生的资源比较稀缺。皮肤病我们说的是比较医疗级的,但是特别是面部的皮肤跟皮肤护理和医美有关系。皮肤的护理领域,我们有一个数据:护理或者医美的产业里面大概有4千万的从业者,这里面专业的医生更少,有一些非专业的人士进行了一些误操作,导致了整个行业的发展陷入到一个需要升级改造的局面。AI至少在增加医疗资源的供给上面是有价值的。
还有跟疑难皮肤病的管理有关,跟我们合作的刘医生他是银屑病(牛皮癬)的大专家,他们站在医生的角度为什么需要AI和数字化的医疗,他说银屑病他的测算现在靠医生是特别主观的,按照银屑病的诊断标准是要比较精确地计算你发病的面积,很难靠医生自己测算这个面积,他们行业内是几个巴掌大,算是有几个巴掌,在我们看来真的是损失了太多的精确度。用技术的方法把测算做好。
还有一些疑难的皮肤病的发作,发作的不确定性非常高,很多的医生可能会建议你少吃辣少吃海鲜,但是在广东地区大家吃海鲜挺多的。所以假如不忌口的话,到底怎么吃不上火、需要怎么忌口,这也缺少数据的研究。整个AI除了测算和判断病诊,还有更大的价值是做患者的管理和预测,什么样的情况下可能更有机会发作,这对整个患者的群体是有非常大的价值。
我们做了很多的研究,特别是了解了一下国外的皮肤AI的发展情况。我们可以讲一讲皮肤癌,主要表现在黑色素瘤,中国人发皮肤癌的比重比较低,我们跟深圳北大医院合作,他说他们一年最多200、300例皮肤癌的迹象,相对皮肤病很少。但是在欧美的地区对于皮肤癌的研究或者AI主要集中在这个领域,特别是澳大利亚、英国、加拿大、美国,这几个地方可能是人种的基因有关,他们的皮肤癌的发病率比中国高上差不多10倍,他们每10万人大概是20多个人就有皮肤癌,但是中国的皮肤癌的比例10万人中大概是1—2个人。
国外对于皮肤癌的研究、AI的发展是非常之快的,2017年2月份在nature的Thrun团队发了一篇杂志利用深度的神经网络做皮肤癌的评比,Thrun当年参加美国的一个无人汽车的竞赛,拿过当年第二名的,他的导师加上他,加上他的室友,他们基本上代表了美国无人驾驶最高水平的一个团队,他是谷歌无人车的研究员,他们转到了医疗的领域,现在最火的就是无人驾驶和医疗,现在没有两个并列了,无人驾驶全部进到医疗领域里来了,就是这种顶级的人过来的。
他们用深度神经网络的方法,左边是一些疑似皮肤癌和图片,他们用皮损的照片、用深度的神经网络建立模型,最后的结论是是,第一在大量的数据基础上,对于皮肤癌的良性、恶性的判断,用AI的方法能够达到专业的皮肤科医生的水平的。第二,随着你给他的图片越多,准确率的提高还能提升。他能够得到专业医生的水平,你给他更多的数据,有可能会超过医生。
在欧美很多的地方有一些零星的创业公司做皮肤癌领域的一些创作,这个APP是SkinVision,他做黑色素瘤风险评估,他主要是用手机的相机拍,然后根据皮损的状况给一些测量和预判的诊断,还有一些远程的诊疗联系到医生。他这些在黑色素瘤比较多的地方这种图像是有蛮多的价值的,他涉及到有一些组数和一些调病症,他整个拍照的手段比较单一。
这是一个印度的APP,印度不完全限定在皮肤癌领域,还有丘疹、痤疮、黑点、疤痕和色斑之类的,他们也是利用了APP来做。这是他们的一个界面,他可以找到80%以上的皮肤疾病,也采用一些人机对话的方案做相关的症状的输入,但是准确度其实不算特别高。
皮肤和AI结合的时候,我们遇到什么样的挑战,或者是有一些什么可以值得探讨的,特别是从经验层面。比如数据或者是模型,还有商业形式,这三点在我们看来可能是任何医疗的场景和整个的AI团队要进行结合的时候要遇到的问题。
数据这块现在也有蛮多的共识,后面的嘉宾可能也会分享到数据对于整个医疗AI的价值。对于皮肤病来说也存在着数据获取的一些疑难,第一皮肤病的种类多,第二涉及到隐私,第三,皮肤图片的获取很多种类型、很多种设备,大家用得比较多的是拿手机去拍,但是手机的镜头是自动聚焦的,它更在乎把人的自拍完美精确地捕捉到,不是为了很精细地追求你脸上的皮肤的分析的效果。我们的实践过程当中对接了很多的皮肤的摄影和仪,还有x—lab找清华的一些校友对接了一些设备夹片式的皮肤镜,还有商业模式等等。
数据的获取方面,为了获取更多的数据,我们也做了一些像APP、公众号,做了各种各样的标注系统,特别重要的是我们有很多的设备,我们认为全靠手机获取的照片不完全代表性的,或者说他自专业性是存疑的。我们到现在累计了差不多超过5万例以上的数据,这些数据跟一些医生合作进行了一些精确的标注,特别是面部的部分我们做了很精细的病症的分类和标注。
建模型,一方面可能要做一些皮肤病的,刚刚列了是十几二十种,还有各种部位的,还涉及到你提供模型的时候,比如面部除了认皮肤病,有一些常规的医美级的老化色斑黑头可以界定为皮肤病,也可以界定为护理级的API的模型要有。人脸识别的模型有很多,传统的模型找68个点,在是别人的脸部的皮肤质量和皮肤病的时候,我们发现这个是需要改造的,可能用到100到200多个点,模型需要改造,整个算法需要改造,找到固位,识别病的类型,你运用到深度学习的框架相当之复杂。虽然皮肤病相比其他的皮肤影像貌似看起来肤浅,但是一样要把AI的点运用得很细。我们上升到医院的大脑,跟他们肺部的病变加在一起。
我们摸索的过程当中涉及到:到底医疗的AI的产品和商业定位,皮肤的AI你是To B还是To C,这里面涉及到你是to医疗级还是更加广泛的美容的体系,这是很多的相关的要做判断的。
涉及到整个商业模式里面的软件和硬件,做AI现在做算法的比较多,很多时候我们做皮肤的过程当中摸索到,你的数据来源自己可控要在医疗和设计层面进行了解,要了解不同的光能够拍到不同皮肤的质量。比如皮肤用UV的拍到斑点,用片正的可以拍到深的皮肤,这在专业的医院用专业的设备可以拍到的,这是软硬件的一体机的结合,跟我们有非常大的启发的意义。
我分析了一下我们对皮肤领域一些肤浅的看法和认识,作为抛砖引玉,希望大家继续享受和欣赏后面的嘉宾给予的一些报告。