现今建立各种机器学习模型的套件很多,但是最常被诟病的是如何去解释建立出来的机器学习模型。
尤其是若需要将模型应用到与人高度相关的行业中,如:金融业决定是否要发信用卡、医疗业协助诊断疾病等,若无法解释模型,常会导致使用者或老板不敢用、不相信模型之问题。
实际上现在已经有很多工具套件来协助解释机器学习模型。 介绍三种常用的模型,以及如何运用套件来解释这些模型。 包含线性回归可以用 p-value 和系数,Tree-based 模型可以用 feature importance 和 SHAP ,最后是类神经网络的模型一样也可以用 SHAP 来对其做解释。
主要会以结构化资料介绍 SHAP 套件的原理以及它的应用方式。
喜欢用Python开发的工程师。有三年以上的机器学习经验,特别是将其运用到金融相关的问题上。