audit-ai - Eine Python-Bibliothek für Fairness in Machine Learning
audit-ai ist eine auf pandas und sklearn basierende Python-Bibliothek, die darauf abzielt, die Auswirkungen diskriminierender Muster in Trainingsdaten und den Vorhersagen von Machine-Learning-Algorithmen zu messen und zu mildern. Diese Bibliothek wurde vom Data Science-Team bei pymetrics entwickelt.
Überblick: Die Hauptaufgabe von audit-ai ist es, die Effekte von diskriminierenden Mustern in Trainingsdaten und in den Vorhersagen von Machine-Learning-Algorithmen zu erfassen, die für sozial sensible Entscheidungsprozesse eingesetzt werden. In einer Welt, in der immer mehr Entscheidungen durch künstliche Intelligenz automatisiert werden, ist die Fähigkeit, den Grad der Fairness oder Voreingenommenheit eines Algorithmus zu verstehen und zu identifizieren, ein Schritt in die richtige Richtung.
Kernfunktionen: Die Bibliothek implementiert verschiedene Bias-Test- und Algorithmus-Auditierungstechniken für Klassifikations- und Regressionstasks. Zum Beispiel werden für Klassifikationsaufgaben 4/5th, Fisher, z-Test, Bayes-Faktor, Chi-Quadrat und sim_beta_ratio sowie Klassifikator-Posterior-Wahrscheinlichkeiten verwendet. Für Regressionstasks werden ähnliche Tests wie ANOVA, 4/5th, Fisher, z-Test, Bayes-Faktor und Chi-Quadrat für Gruppenproportionen bei verschiedenen Schwellenwerten eingesetzt.
Grundlegende Verwendung: Die Installation der Bibliothek kann mit pip erfolgen. Anschließend müssen scikit-learn, numpy und pandas installiert werden. Um die Bibliothek zu verwenden, kann man die Dokumentation und das Implementierungsbeispielpaper konsultieren. Zum Beispiel kann man mit bias_test_check
testen, ob ein Bias vorliegt, und mit plot_threshold_tests
verschiedene Tests bei verschiedenen Schwellenwerten grafisch darstellen.
Beispiel-Datasets: Die Bibliothek bietet auch Beispiel-Datasets wie german-credit und student-performance an.