首页
>
资讯
>
【周末杂谈】求细求异的事,恐非 AI 强项
出自识林
【周末杂谈】求细求异的事,恐非 AI 强项
2025-05-25
根据对AI内在机理的了解,粗估药业AI应用场景落地的可行性
请大家先耐心读完下面五段的简单分析,因为这是后面切题讨论的基础。
AI的数理基础都是某种形式的统计模型,既可以是统计物理意义上的统计,这是去年得诺贝尔物理奖的John Hopfield教授的贡献,也是去年另外几位因AI工作而获得诺贝尔奖者的工作基础;也可以是日常生活和工作中用的统计数学。但无论哪种,都是在数据上,求均值、偏差等。
求均值,是将“大的变小,小的变大”,因为均值只会小于最大值,大于最小值。
- 也就是将原始大大小小、参差不齐的一组数据,用一个中不溜的数据来代表。
- 也就是将原始数据的“棱角”抹掉了,简化为一个“圆乎乎”的数据。
求偏差,是评估用一个均值来代表一组大小不等的数值的合理性。相对于均值而言,若是偏差很小,则说明这一组值都分布在均值附近,即均值的代表性好,否则就是不好。例如,有两组数,每组都有100个数,均值都是0.5。第一组有50个0.0,50个1.0,偏差是0.5。第二组有50个0.49,50个0.51,偏差是0.01。直观上,第一组数的均值代表性差,第二组的代表性好。数值上也是,因为第一组的偏差/均值=1,远大于第二组的偏差/均值=0.02,比例越小,代表性越好。
训练AI,就是喂它很多数据,使其形成记忆。这个记忆,可粗看成是均值和偏差。让AI干活,就是问它一个问题,让它给出最符合其记忆的回答。符合的好坏,由偏差代表。
AI干的是“求同求粗”,而不是“求异求细”的活,因为差异和细节在求均值的过程中已经被抹去了。当然,参数越多的AI大语言模型,其保留的细节就越多,但终究离不开统计平均。
现来看看药业常见的一些应用场景,并用上述说法来粗估这些场景是否适合用AI。
- 撰写生产SOP文件,须满足GMP规章、指南及企业内规,是“求同”的活,适合用AI。
- 产品研发,是创新性工作,魔鬼藏于细节,是“求异求细”的活,不适合用AI。
- 偏差调查,先要符合SOP,还可能需要了解产品和生产工艺。前者是“求同”的活,适合用AI。后者又分两部分。一是知识部分,这是记忆性内容,适合用AI。二是研究部分,本质上是研究性工作,未必适合用AI。
- 撰写年度质量回顾 须满足GMP规章、指南及SOP,是“求同”的活,适合用AI。
在大语言模型时兴前,AI有时也被称为专家系统。专家的英文是expert。经验的英文是experience。两者都有exper这个词头,其拉丁文的原意是to try尝试,to test体验。如果将AI看成是专家系统,期望将已有的知识、既往的经验和教训形成AI系统中的记忆,以便灵活和快速的抓取,以此指导和规范员工行为,从而达到降本增效的目的,那期望就容易落地。若是对AI的期望过高,例如,做人都难做的创新性研发,那就要做好失望的准备。人工智能,毕竟不是智能。
识林-榆木疙瘩
识林®版权所有,未经许可不得转载
|