NEAIS 2024 Proceedings

Developing Reliable Gradient Explanations for Artificial Intelligence: Addressing Consistency in Local Interpretability

Nolan M. Talaei, University of Massachusetts LowellFollow
Asil Oztekin, University of Massachusetts LowellFollow
Hongwei Zhu, University of Massachusetts LowellFollow
Luvai Motiwalla, University of Massachusetts LowellFollow

Abstract

Interpreting machine learning models remains challenging, particularly in high-stakes applications where trust and transparency are vital. We introduce Reliable Gradient Explanations (RGE), a method designed to enhance the stability and consistency of gradient-based feature importance explanations. RGE combines first-order gradient information with second-order Hessian elements to refine feature importance based on output curvature, reducing instability in traditional methods. Preliminary results indicate that RGE improves explanation accuracy and stability across different model architectures. Ongoing research aims to refine RGE, evaluate its performance on diverse datasets, and compare it with established interpretability techniques, ultimately promoting more transparent and reliable AI-driven decisions

Recommended Citation

Talaei, Nolan M.; Oztekin, Asil; Zhu, Hongwei; and Motiwalla, Luvai, "Developing Reliable Gradient Explanations for Artificial Intelligence: Addressing Consistency in Local Interpretability" (2024). NEAIS 2024 Proceedings. 14.
https://aisel.aisnet.org/neais2024/14

Download

COinS

NEAIS 2024 Proceedings

Developing Reliable Gradient Explanations for Artificial Intelligence: Addressing Consistency in Local Interpretability

Abstract

Recommended Citation

Search

Links

Browse

Author Corner

NEAIS 2024 Proceedings

Developing Reliable Gradient Explanations for Artificial Intelligence: Addressing Consistency in Local Interpretability

Authors

Abstract

Recommended Citation

Share

Search

Links

Browse

Author Corner