人工智能在医疗领域的五个主要机遇

快讯

康谈网 视觉求索 周翔 2017-03-16 10:22:48

摘要 本文提到人工智能在医疗领域有5大机遇:技术的增长速度快于其应用速度,许多成熟低挂的果实等待被采摘;许多医生...

人工智能 领域

人工智能在医疗领域的五个主要机遇

  [ 亿欧导读 ]本文提到人工智能在医疗领域有5大机遇:技术的增长速度快于其应用速度,许多成熟低挂的果实等待被采摘;许多医生热爱AI,与他们合作你会另创新高;各种自动化程度,充足的商机;急速增长的大量的公共数据集;多样化带来持续创新。

  【编者按】近几年,纵观人工智能的大版图,医疗健康已经成长为最热门的领域之一,同时也有业内人士提到,AI+医疗会是人工智能落地的第一步。那么究竟人工智能究竟能够给医疗带来什么?给医生带来什么?

  此文作者用诙谐的语音,充足的例证,深刻地讲述了人工智能在医疗领域商业化和工业化的应用,既有产业洞见,又包含了科研的思路,推荐给大家阅读。为方便大家阅读,原文被分为三篇发布,此篇为第三篇,主要讲述了人工智能在医疗领域的五个主要机遇。

  本文发于“视觉求索”,作者周翔,清华双学士和经济学博士生,伊大香槟分校计算机视觉博士,现在西门子医疗负责计算机辅助检测和诊断。经亿欧编辑,供行业人士参考。

  前两篇文章地址:

  人工智能在医疗领域的应用多是“加速型进化”

  人工智能在医疗领域的商业化路障和挑战

  四、机遇

  在前几章中,我主张用“进化”这个词而不用“革命”这个词,只是为了强调我们不应该对AI作过激的预言,特别是“短期内AI完全取代人”的预言。

  然而,如果考虑到AI在医疗行业会有的这么巨大的机会,以及可能造成的深远的影响,那么,AI将带来的变化不管从哪个角度看都确实会像一次重大的革命!

  下面我想讨论一下与这场革命相关的五个主要机遇

  1、技术的增长速度快于其应用速度;许多成熟低挂的果实(low-hanging fruits)等待被采摘

  这是一个“机械的革命”和“机械师的革命”的时代:机器自动地从数据中学习,机器自动地相互学习,机器自动地组建其他机器!技术在以前所未有的速度向前进步,每天我们都能听到AI在崭新的领域的应用和突破

  另一方面,有三万种人类***等着我们去探索。即使只有1%的***能够受益于人工智能,如果我们先瞄准最常见的或最致命的那些***,肺癌、乳腺癌、前列腺癌、心血管病、脑血管病、老年痴呆等等,那么AI对人类健康的影响将是巨大的,前所未有的。

  此外,还有许多AI自动化的机会,可以帮助医疗服务部门既提高效率和质量,又降低成本。例如,我们最近开发了一种算法,能自动地区分磁共振的不同的图像序列。对于深度学习来说,这个问题好像正是一个“低挂的果子”:我们通过深度学习直接获得了99.96%的成功率,而上一代的基于支持向量机(SVM)的算法的成功率只有85%。正是这一类的算法进步可以使磁共振的成像过程更快更好。

  像这样的“低垂的果实”还很多,只要相对简单地把深度学习的算法应用上去,就可以得到前所未有的好结果。最近报道的一些二维图像上的识别问题就是很好的例子:基于相片的***癌的识别,以及基于视网膜眼底照片的糖尿病视网膜病变的检测。

  有一点是肯定的:要抓住当前的这个机遇,我们必须要学会做一个好的“机械师”(machinist)。

  2、许多医生热爱AI,与他们合作你会另创新高

  还有一些问题比较复杂,直接套用深度学习不一定会解决问题。但是,有经验的临床医生可以给我们很多的指点和启示:有些先验知识可以极大地减小算法的搜索空间——比如说有些肺病只会发生在肺的边缘和底部;而另外一些先验知识则可以帮助我们把一个很复杂不可解的的问题分解成几个可解的子问题来各个击破。

  比如说要直接学习癌症分期(cancer staging)是很困难的,但是有经验的放射科医生会告诉我们癌***可能会沿着哪一条淋巴系统扩散,以及骨骼中的癌扩散是在磁共振的哪个图像序列中更加明显,可以看得到。如果每个子问题都能够用深度学习来顺利解决的话,那么原来那个本来看起来无从下手的复杂问题也就迎刃而解了。

  一个取胜的秘密配方往往需要四个成分:积极的医生、能干的的科学家、好的问题(比如高影响的***)和大量的标注好的数据。

  越来越多的医生理解了这个配方,并且渴望加入这次人工智能的革命——All we need to do is ask(别不好意思问!)。

  3、各种自动化程度,充足的商机!Ample business opportunities at various automation levels

  即使AI算法不比人类专家更好,也并不一定就意味着没有商业化的途径。除了用做“第二读者”(second reader)来协助医生之外,我们还可以提供一些建议性的和“非关键”(non-critical)的功能,比如说“相似案例检索”。“非关键”的意思是说算法的错误不会导致灾难性的后果,但一旦成功则可以给用户带来意外的惊喜和收益:如果我们能够给医生提供一些类似的病人的病例,这些病例都有不同的治疗方案和最终结果。那么,医生就可以用这些信息来指导他对当前病人的最佳治疗方案的选择。

  如果我们可以调整算法,使得其灵敏度(sensitivity)或特异性(specificity)[2]接近100%的话,就会有一些新的商业机会。例如,如果一个算法可以在检测某种***时达到非常高的特异性,即使它不是很敏感,那么我们仍然可以把这个算法用来做一个分诊(triage)或者警报(alert)的产品。

  这恰好类似于今天的有些汽车中的自动刹车功能:它仅在需要制动的一部分情况下自动刹车,而不是所有的情况——毕竟司机在大部分情况下该踩刹车都会踩刹车,自动刹车只是提供一个锦上添花的双保险。但它必须尽量减少在不该刹车的情况下启动自动刹车的可能性,因为汽车错误地乱刹车对司机来说是非常恼火的事,也是非常危险的。

  我们需要时刻提醒自己,AI并不需要全知全能,医生在很多方面和很多时候都可以用得上AI的支持和帮助。想要有商业成功的话,我们不仅需要好的科学家,更需要好的产品经理。

  4、急速增长的大量的公共数据集,为AI点火,助AI起飞!

  在医疗的AI研究领域,长期以来的一个困难是缺乏干净的有标注的数据。然而,这个情况今天正在改变。政府机构如美国的食品和***管理局(FDA)、国家健康研究所(NIH)、大的医院、非营利组织、医疗IT和技术公司都开始将重点放在高质量的数据采集和标注上,这些数据会大大地促进AI在医疗保健领域的全面应用。

  对于一些最普遍的***如肺癌、乳腺癌和心脏病等,开放式竞争正在大量兴起,给所有愿意参赛的团队们提供免费的足够的训练数据。这对小公司甚至自学成才的AI爱好者们特别有利,给了他们一个前所未有的一展身手、公平竞争的机会,否则他们是很难获得如此大规模的医疗数据的。

  当然,从商业的角度来看,这也是一把双刃剑:开放数据加上开源算法给商业公司们留下了很少的发展空间来提供独特的且具有竞争力的商业产品,因为进入壁垒(entry barrier)变得越来越低,甚至完全消失。

  幸运的是,医疗保健领域如此广泛,而且有如此多的低效环节,一个有眼光的和专注的商人肯定会找到一个利基市场(niche market)来提供有特色的产品,产生足够的影响,并获取丰厚的利润。

  5、商业化带动多样化,多样化带来持续创新(continuous innovation)

  正像“有不止一种的方式来飞上天”,应该用很多方法来做AI。

  有些人可能认为YannLeCun是一个理想主义者或梦想家,因为他坚持在端到端的学习机上苦苦耕耘了几十年。当很多人一窝蜂地去研究支持向量机(SVM),然后自适应增强(AdaBoost),然后图论(graph theory),然后稀疏模型(sparsity)的时候,他二十年来对神经网络未改初衷。我倒是认为他更像一个实干家(pragmatist),因为他的发明(卷积神经网络CNN)是工业化应用中最具有扩展性的算法,并成为最新这一轮的AI革命的导火索。

  从YannLeCun那里,我们应该学到什么呢?不仅仅是卷积神经网络,更应该是他的坚持心。关键在于,当一个学派的思想得到所有的聚光灯时,我们不应该轻易放弃其他的方法和学派。YannLeCun多年留守连接主义(connectionist)的阵营,坚持不懈把它再次推上巅峰。

  也许现在正是我们当中的一部分人留守在神经网络的框架之外的时候,继续研究进化算法(“啥?这玩意儿也太恐龙了吧?”你可能会说。2000年左右,听YannLeCun骄傲地讲解卷积神经网络的时候,我也是这么想的),或贝叶斯算法,或内核机(kernel machines),或甚至重新拾起符号主义(symbolism)的火炬——在我看来,要想击败威诺格拉德(Winograd)挑战,恐怕还真少不了要用到符号主义的方法呢。

  说到底,如果我们不能维持一个丰富的的创新流水线,那么那些“开始误解,然后失望”的投资人们很可能会把我们全部拖进一个AI的冬天里去。

  要继续这场AI的革命,AI必须要不断地再生和更新自己(reinvent&rejuvenateitself)!

  五、结语

  很奇怪,多年来,我都没有意识到AI正是“爱”字的拼音。就让我用下面这两个简单的句子来结束这篇文章吧:

  AI is Love,Love AI。AI会给世界带来更多的爱,让我们爱AI。(正文完)

  医生:“嘿!我正在手提电脑上看史密斯太太的心脏图片,它突然就黑了!可能没电了。你帮我把这个案例给做完吧,我想与家人一起吃个饭!”

  机器人:“好啊!温洛格那德医生!这正是我该做的——让您找回生活的乐趣!你也知道我的超级大脑是经过了50亿个心脏病例训练过的。我是说‘亿’哈,你不要听少了!这可是像你这样的人类医生的一百万倍哦!呵呵!”

  医生:“行了行了!不要每次都说这个好不好?(酸酸地)还得感谢您老,我可以早早退休卖红薯去啰!不过我还是很欣慰,史密斯太太的案例有个好着落。”

  机器人:“当然啦!您就快回家吧!好好地颐养天年去吧!不过,需要问您一下:我没听懂您刚才说史密斯太太的心‘突然变黑了’这个是什么意思?是她突然变成一个坏人啦?!”

  医生:“你说啥??”

  注释:

  [2]关于灵敏度(sensitivity)或特异性(specificity),维基百科定义如下:

  “灵敏度和特异度是统计学中用来表征二项分类测试特征的数据。

  灵敏度(Sensitivity,也称为真阳性率)是指实际为阳性的样本中,判断为阳性的比例(例如真正有生病的人中,被医院判断为有生病者的比例),计算方式是真阳性/(真阳性+伪阴性)的比值。伪阴性是指实际为阳性,但判断为阴性。

  特异度(Specificity,也称为真阴性率)是指实际为阴性的样本中,判断为阴性的比例(例如真正未生病的人中,被医院判断为未生病者的比例),计算方式是真阴性/(真阴性+伪阳性)的比值。伪阳性是指实际为阴性,但判断为阳性。

  灵敏度可以作为避免伪阴性的量化指标,而特异度可以作为避免伪阳性的量化指标。对于任何测试而言,都需要在灵敏度及特异度之间进行取舍。”

  文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

康谈网(www.kangtan.com)是定位于关注健康产业。想分享健康产业干货?发邮件至 news@kangtan.com,我们会第一时间与你联系。

康谈网 读懂健康

关注康谈,收听和分享“健康”

携手康谈网,为您提供更多健康新鲜货。

热门阅读

X