请考虑 下载最新版本的ie浏览器
按预期体验本网站.

新萄京娱乐场如何确定机器学习是准确的?

2022年5月2日
三位研究人员站在一块写满方程式的黑板前左起:博士生Geemi Wellawatte, 安德鲁•白, 化学工程的副教授, 和Aditi Seshadri ' 22在Wegmans Hall演出. 怀特的实验室已经开发出一种方法,通过使用反事实来验证机器学习模型在药物研发中的预测. 新萄京娱乐场图片/ J. 亚当窗口)

新萄京娱乐场的研究人员使用“反事实”来验证对药物安全性的预测.

科学家越来越依赖经过机器学习训练的模型来为复杂问题提供解决方案. 但是,当模型使用的复杂算法不容易被询问或无法向人类解释它们的决策时,新萄京娱乐场如何知道这些解决方案是可信的呢?

这种信任在药物研发中尤为重要, 例如, 机器学习被用来对数百万种潜在的有毒化合物进行分类,以确定哪些可能是安全的候选药物.

“在计算机科学中,有一些备受瞩目的事故,模型可以很好地预测事情, 但这些预测并没有任何有意义的依据,化学工程副教授安德鲁·怀特说 新萄京娱乐场,在一个 采访 化学世界.

怀特和他的实验室开发了一种新的“反事实”方法 化学科学, 这可以用于任何基于分子结构的机器学习模型,以更好地理解模型是如何得出结论的.

反事实可以告诉研究人员“特征的最小变化会改变预测。,主要作者Geemi Wellawatte说, 怀特实验室的博士生. 换句话说, 反事实是一个非常接近原文的例子, 但结果却截然不同.”

反事实可以帮助研究人员快速查明模型做出预测的原因, 以及它是否有效.

这篇论文列举了三个新方法的例子, 叫做mace(分子模型激动反事实解释), 可以用来解释为什么:

  • 据预测,一种分子可以穿透血脑屏障
  • 一个小分子被预测是可溶的
  • 一种分子被预测可以抑制艾滋病毒

该实验室必须克服开发mace的一些主要挑战. 他们需要一种方法,可以适应化学中广泛使用的机器学习方法. 除了, 在任何给定的情况下寻找最相似的分子也是一项挑战,因为可能的候选分子数量太多了.

怀特实验室的合著者阿迪提·塞沙德里帮助解决了这个问题,他建议研究小组采用STONED(超快速穿越), 优化, 新奇的事物, 探索, 和发现)算法开发的多伦多大学. STONED有效地生成类似的分子,这是反事实生成的燃料. 塞沙德里是怀特实验室的一名本科生,通过新萄京娱乐场的一个名为“发现”(Discover)的夏季研究项目,她能够为这个项目提供帮助.”

怀特说,他的团队正在继续改进mace, 通过尝试其他数据库来寻找最相似的分子, 例如, 并细化了分子相似性的定义.

该项目得到了美国国家科学基金会和美国国立卫生研究院国家普通医学科学研究所的资助. 新萄京娱乐场综合研究计算中心(CIRC)提供了计算资源和技术支持.


阅读更多

六张自拍软件使用自拍来检测帕金森病的早期症状
新萄京娱乐场计算机科学家Ehsan Hoque和他的同事利用机器学习,通过分析面部肌肉来准确识别神经疾病的迹象.
插入充电器的电动汽车电动汽车能帮助加强电网吗?
博士候选人Heta Gandhi和她的导师, 安德鲁·怀特助理教授, 开发了一个计算机模型,展示了如何将电动汽车的剩余能源出售给当地电网.
戴着面具和手套的年轻女子站在实验室里.将铁催化剂用于制药是一个巨大的飞跃
新萄京娱乐场和马里兰大学的研究人员描述了一种新的交叉偶联反应,它可能导致一种更便宜的方法来开发药物化合物.

 

 

标签: , , , ,

类别: 科学 & 技术