AI扶植会诊的幻觉问题是源自数据忽略

发布日期：2024-12-25 07:06 点击次数：97

AI扶植会诊的幻觉问题是源自数据忽略

在医疗会诊规模，东谈主工智能本领的应用正日益普及，但其准确性和可靠性仍然是公众和专科东谈主士暖和的焦点。本文深化研讨了AI扶植会诊中存在的挑战，格外是AI怎么打破东谈主类医师会诊准确率的“天花板”，以及怎么识别和愚弄那些可能被东谈主类医师暴虐的消失特征。

前段时辰读了杰罗姆·格鲁普曼的《医师怎么念念考》（How Doctors Think）。这本书我认为任何禁受过要紧调治的东谈主皆应该读一下，它会透顶改动你对医师的见地。书里提到一个让我忌惮的事实：即使是通过委员会认证的辐射科医师，他们不详有 15% 的时辰会对我方的会诊意见不一致（要是没记错的话）。

让我敬爱的是，既然东谈主类医师皆有这种死心，那咱们何如让东谈主工智能的会诊准确率比东谈主类高？

现在的要领，比如辐射科医师的会诊，准确率可能在 95% 左右。要是咱们用这些准确率独一 95% 的要领来锻真金不怕火 AI，那么 AI 何如能打破这条“天花板”？它需要一些咱们还没缔结到的常识来升迁到 99.999% 的准确度，但这些常识咱们我方却并不知谈它们是什么。

举个顶点但形象的例子。假定有种叫红流感的疾病，患者脸上会出现红点，这点环球皆知谈，但更少东谈主闪耀到的是，这种病可能会在发病前四周让脚趾甲变紫。东谈主类医师可能永远不会发现这个细节，但 AI 可能会自动发现两者的关系。问题是，咱们怎么主动找到这些“紫脚趾甲”式的消失特征？

更复杂的是，咱们的数据自己可能会欺诈 AI。拿肺癌来说，锻真金不怕火数据相对简便。咱们不错只用活检阐发过的癌症患者的 CT 和 XR（而不是那些辐射科医师怀疑有癌症但未确诊的样本），这么锻真金不怕火出来的 AI 特异性真是是 100%。敏锐性怎么？这很难说，但本色上东谈主类医师的敏锐性也莫得明确的标准。

但要是是肺炎，情况就完全不同了。肺炎莫得像活检相同的“金标准”来考据，会诊频频依赖 XR 上的特征和医师的锻真金不怕火判断。锻真金不怕火数据不成幸免会掺杂噪声，这种情况下，AI 的特异性一定低于 100%。

不外即便如斯，AI 的一致性可能让它在本色推崇中仍然优于平均水平的医师。即便锻真金不怕火数据并不完好，AI 也有可能接近顶级辐射科医师的推崇，这比庸俗医师要好得多。

关联词，AI 还有一个问题是它的“黑箱”属性。咱们不知谈它在检测癌症时究竟看到了什么，忽略了什么，也无法完全聚合它的决议经由。就像医学自己更像一场概率游戏相同，AI 也并非完全详情的器具。

本文由东谈主东谈主皆是家具司理作家【罗福如】，微信公众号：【罗福如】，原创/授权发布于东谈主东谈主皆是家具司理，未经许可，阻止转载。

题图来自Unsplash，基于 CC0 条约。

上一篇：河北定兴：乘电商东风奏响振兴之曲

下一篇：三星芯片部门大转化：新引导层上任冒昧事迹下滑