Ridurre i bias nel credit scoring con l'IA generativa

Wei You Pan, Ashwin Gangadhar, and Jack Yallop

Il credit scoring svolge un ruolo fondamentale nel determinare chi può ottenere accesso al credito e a quali condizioni. Nonostante la sua importanza, tuttavia, i sistemi di credit scoring tradizionali sono stati a lungo afflitti da una serie di problemi critici dovuti a bias e discriminazione, alla considerazione limitata dei dati e alle sfide di scalabilità. Ad esempio, uno studio sui prestiti statunitensi ha mostrato che ai mutuatari appartenenti a minoranze venivano applicati tassi di interesse più elevati (+8%) e i prestiti più venivano rifiutati spesso (+14%) rispetto ai mutuatari appartenenti a gruppi più privilegiati.

La rigidità dei sistemi di credito li rende lenti ad adattarsi ai cambiamenti del panorama economico e all'evoluzione dei comportamenti dei consumatori, lasciando alcune persone non servite e trascurate. Per superare questo problema, le banche e altri istituti di credito stanno cercando di adottare l’intelligenza artificiale per sviluppare modelli sempre più sofisticati con cui valutare il rischio di credito.

In questo articolo esploreremo i fondamenti del credit scoring, le sfide dei sistemi attuali e approfondiremo il modo in cui l'intelligenza artificiale (IA), e in particolare l'IA generativa (o genAI), può essere sfruttata per mitigare i pregiudizi e migliorare l'accuratezza. Dall'incorporamento di fonti di dati alternative allo sviluppo di modelli di machine learning (ML), scopriremo il potenziale trasformativo dell'IA nel ridefinire il futuro del credit scoring.

Consulta la nostra pagina delle risorse sull'intelligenza artificiale per saperne di più sulla creazione di app basate sull'IA con MongoDB.

Che cos'è il credit scoring?

Il credit scoring è un aspetto molto importante del panorama finanziario e serve a misurare numericamente l'affidabilità creditizia di una persona. Questo parametro fondamentale viene utilizzato dagli istituti di credito per valutare il rischio potenziale associato alla concessione di un credito o di un prestito di denaro a individui o imprese.

Tradizionalmente, le banche si affidano a regole predefinite e modelli statistici spesso costruiti utilizzando la regressione lineare o logistica. I modelli si basano su dati storici relativi credito, concentrandosi su fattori quali la cronologia dei pagamenti, l’utilizzo del credito e la durata dello storico creditizio.

Tuttavia, valutare i nuovi richiedenti rappresenta una sfida che richiede una capacità profilazione più accurata. Per soddisfare i segmenti svantaggiati o meno serviti, tradizionalmente discriminati, le fintech e le banche digitali stanno incorporando sempre più informazioni oltre al tradizionale storico creditizio aggiungendo dati alternativi per creare una visione più completa del comportamento finanziario di un individuo.

Le sfide del credit scoring tradizionale

I punteggi di credito sono parte integrante della vita moderna perché sono un fattore determinante in varie transazioni finanziarie, tra cui la garanzia di prestiti, l'affitto di un appartamento, la sottoscrizione di una polizza e, talvolta, anche nelle selezioni occupazionali. Poiché la ricerca del credito può trasformarsi in un vero e proprio dedalo, ecco alcune delle sfide o delle limitazioni dei tradizionali modelli di credit scoring che spesso si frappongono come ostacoli verso l'approvazione della richiesta di credito.

  • Storico creditizio limitato: molte persone, soprattutto quelle che si avvicinano per la prima volta ai crediti, incontrano un problema significativo: uno storico creditizio limitata o inesistente. I modelli tradizionali di credit scoring si basano fortemente sul comportamento creditizio passato, rendendo difficile per le persone senza un solido trascorso dimostrare la propria affidabilità creditizia. Circa 45 milioni di americani non hanno punteggi di credito semplicemente perché quei punti dati per loro non esistono.

  • Reddito incoerente: un reddito irregolare, tipico delle occupazioni part-time o dei freelance, rappresenta una sfida per i modelli di credit scoring tradizionali, in quanto può essere etichettato come più rischioso e portare al rifiuto delle domande o a limiti di credito restrittivi. Nel 2023, negli Stati Uniti le fonti dei dati differiscono sul numero di persone che lavorano in proprio. Una di queste mostra che più di 27 milioni di americani hanno presentato documenti fiscali Schedule C, che coprono il reddito netto o la perdita di un'impresa, evidenziando la necessità di metodi di credit scoring diversi per i lavoratori autonomi.

  • Elevato utilizzo del credito esistente: il forte affidamento sul credito esistente è spesso percepito come un segnale di potenziale tensione finanziaria, il che influenza le decisioni sul credito. Le domande di credito possono essere respinte o approvate a condizioni meno favorevoli a causa delle preoccupazioni sulla capacità del richiedente di gestire assennatamente il credito aggiuntivo.

  • Mancanza di chiarezza nelle ragioni del rifiuto: una mancata comprensione delle ragioni alla base del rifiuto impedisce ai richiedenti di affrontarne le cause profonde. Nel Regno Unito, uno studio condotto tra aprile 2022 e aprile 2023 ha mostrato che le ragioni principali del rifiuto includevano "storico creditizio scadente" (38%), "non poteva permettersi gli ammortamenti" (28%), "aveva troppi altri crediti" (19%) e il 10% ha affermato che non gli è stato spiegato il motivo. Anche quando le motivazioni vengono fornite, spesso sono troppo vaghe, il che fa sorgere dubbi nei e rende difficile affrontare la causa del rifiuto e migliorare l'affidabilità creditizia per eventuali richieste future. La mancanza di trasparenza non è solo un problema per i clienti, ma può anche comportare una penale per le banche. Ad esempio, una banca di Berlino è stata multata per 300.000 € nel 2023 per la mancata trasparenza mostrata nel rifiuto di una richiesta di carta di credito.

  • Mancanza di flessibilità: i cambiamenti nel comportamento dei consumatori, soprattutto tra le giovani generazioni che preferiscono le transazioni digitali, sfidano i modelli tradizionali. Fattori come l'aumento della gig economy, l'occupazione non tradizionale, il debito studentesco e l'elevato costo della vita complicano la valutazione della stabilità del reddito e dell'integrità finanziaria. Le previsioni tradizionali sul rischio di credito, inoltre, sono limitate in caso di perturbazioni gravi come il COVID-19, poiché non ne tengono conto nei modelli di scoring.

Riconoscere queste sfide evidenzia la necessità di modelli di credit scoring alternativi in grado di adattarsi all'evoluzione dei comportamenti finanziari, di gestire fonti di dati non tradizionali e di fornire una valutazione più inclusiva e accurata del merito di credito nel dinamico panorama finanziario odierno.

Credit scoring con dati alternativi

Con credit scoring alternativo ci si riferisce all'uso di metodi e fonti di dati non tradizionali (i cosiddetti dati alternativi) per valutare l'affidabilità creditizia di un individuo. Mentre il credit scoring tradizionale si basa fortemente sullo storico delle principali agenzie di credito, il credit scoring alternativo incorpora una gamma più ampia di fattori per creare un quadro più completo del comportamento finanziario di una persona. Ecco alcune delle fonti di dati alternative più diffuse:

  • Pagamenti delle utenze: al di là della storia creditizia, la costanza di pagamento per le utenze, come l’elettricità e l’acqua, offrono un forte indicatore di responsabilità finanziaria e rivelano un impegno a soddisfare gli obblighi finanziari, fornendo informazioni cruciali che vanno oltre i parametri tradizionali.

  • Cronologia degli affitti: per chi non ha un mutuo, la cronologia dei pagamenti degli affitti emerge come una fonte di dati alternativa fondamentale. La dimostrazione di costanza e puntualità nel pagamento dell'affitto fornisce un quadro completo della disciplina e dell'affidabilità finanziaria.

  • Modelli di utilizzo dei telefoni cellulari: l'ubiquità dei telefoni cellulari sblocca una vasta gamma di dati alternativi. L'analisi dei modelli di chiamata e messaggistica fornisce informazioni sulla rete, la stabilità e le connessioni sociali di un individuo, che rappresentano informazioni preziose per la valutazione del credito.

  • Comportamento di acquisto online: l'esame della frequenza, del tipo e degli importi spesi per gli acquisti online offre preziose informazioni sui comportamenti di acquisto, contribuendo a una comprensione più puntuale delle abitudini finanziarie.

  • Contesto educativo e lavorativo: il punteggio di credito alternativo considera la storia educativa e lavorativa di un individuo. Gli indicatori positivi, come i risultati scolastici e la stabilità occupazionale stabile, svolgono un ruolo cruciale nella valutazione della stabilità finanziaria.

Queste fonti di dati alternative rappresentano un passaggio verso un approccio più inclusivo, sfumato e olistico alle valutazioni del credito. Poiché la tecnologia finanziaria continua a progredire, l'utilizzo di questi set di dati alternativi garantisce una valutazione più completa dell'affidabilità creditizia, segnando un passo trasformativo nell'evoluzione dei modelli di credit scoring.

Punteggio di credito alternativo con l'intelligenza artificiale

Oltre all'uso di dati alternativi, l'uso dell'IA come metodo alternativo è emerso come forza trasformativa per affrontare le sfide del credit scoring tradizionale per una serie di motivi:

  • Capacità di mitigare i bias: come i modelli statistici tradizionali, i modelli di IA, compresi gli LLM, addestrati su dati storici distorti erediteranno i bias presenti in tali dati, portando a risultati discriminatori. Gli LLM potrebbero concentrarsi su determinate caratteristiche piuttosto che su altre o non essere in grado di comprendere il contesto più ampio della situazione finanziaria di un individuo, portando a un processo decisionale falsato. Tuttavia, esistono varie tecniche per mitigare i bias dei modelli di IA:
    • Strategie di mitigazione: le iniziative iniziano con l'uso di dati di formazione diversi e rappresentativi per evitare di rinforzare i bias esistenti. Strategie di mitigazione inadeguate o inefficaci possono portare alla persistenza di risultati distorti nei modelli di credit scoring esistenti. Un'attenzione particolare ai dati raccolti e allo sviluppo dei modelli è fondamentale per mitigare questo pregiudizio. L'integrazione di dati alternativi per il credit scoring svolge un ruolo fondamentale nel ridurre i bias.
    • Strumenti rigorosi di rilevamento dei bias, vincoli di equità e tecniche di regolarizzazione durante l'addestramento migliorano la responsabilità del modello: il bilanciamento della rappresentazione delle caratteristiche e l'utilizzo di tecniche di post-elaborazione e algoritmi specializzati contribuiscono alla mitigazione dei bias. La valutazione inclusiva dei modelli, il monitoraggio continuo e il miglioramento iterativo, oltre all'adesione alle linee guida etiche e alle pratiche di governance, completano un approccio articolato per ridurre i bias nei modelli di IA. Ciò è particolarmente importante per affrontare le preoccupazioni legate alle distorsioni demografiche o socioeconomiche che possono essere presenti nei dati storici sul credito.
    • Controlli regolari sui bias: conduci controlli regolari per identificare e mitigare i bias negli LLM, che possono comprendere comportare l'analisi degli output del modello per le disparità tra i gruppi demografici e il conseguente adeguamento degli algoritmi.
    • Trasparenza e spiegabilità: aumenta la trasparenza e la spiegabilità negli LLM per comprendere come vengono prese le decisioni e identificare e affrontare processi decisionali distorti. Trade Ledger, uno strumento Software-as-a-Service (SaaS) per il prestito, utilizza un approccio basato sui dati per prendere decisioni informate con maggiore trasparenza e tracciabilità, riunendo i dati provenienti da più fonti con schemi diversi in un'unica fonte di dati.
  • Capacità di analizzare set di dati vasti e diversificati: a differenza dei modelli tradizionali basati su regole predefinite e dati storici sul credito, i modelli di IA possono elaborare una miriade di informazioni, incluse le fonti di dati non tradizionali, per creare una valutazione più completa dell'affidabilità creditizia di un individuo, garantendo una gamma più ampia di comportamenti finanziari.
  • L'IA offre un’adattabilità senza precedenti: man mano che le condizioni economiche cambiano e i comportamenti dei consumatori si evolvono, i modelli basati sull'IA possono adattarsi rapidamente e apprendere dai nuovi dati. Questa capacità di apprendimento continuo garantisce che il credit scoring rimanga rilevante ed efficace anche a fronte della continua evoluzione degli scenari finanziari.

Le obiezioni più comuni da parte delle banche al mancato utilizzo dell'IA nel credit scoring riguardano la trasparenza e la spiegabilità nelle decisioni creditizie. La complessità intrinseca di alcuni modelli di IA, e in particolare degli algoritmi di deep learning, può creare difficoltà nel fornire spiegazioni chiare per le decisioni di credito. Fortunatamente, la trasparenza e l'interpretabilità dei modelli di IA hanno registrato progressi significativi. Tecniche come i valori SHapley Additive Explanations (SHAP) e Local Interpretable Model-Agnostic Explanations (LIME) e molti altri progressi nel dominio di Explainable AI (XAI) ci consentono di capire in che modo il modello arriva a specifiche decisioni di credito. Questo non solo aumenta la fiducia nel processo di credit scoring, ma affronta anche la critica comune secondo cui i modelli di AI sono "scatole nere".

Comprendendo la criticità dello sfruttamento dei dati alternativi, spesso in formato semi-strutturato o non strutturato, gli istituti finanziari collaborano con MongoDB per migliorare i processi di richiesta di credito con un modo più rapido, semplice e flessibile per effettuare pagamenti e offrire credito:

  • Amar Bank, la principale banca digitale indonesiana, combatte i bias fornendo microprestiti a persone che altrimenti non sarebbero in grado di ottenere servizi finanziari dalle banche tradizionali (quindi a persone prive di servizi bancari o sottoservite). I processi di sottoscrizione tradizionali erano inadeguati per i clienti privi di storico creditizio o di garanzie, per questo hanno semplificato le decisioni di prestito sfruttando i dati non strutturati. Sfruttando MongoDB Atlas, hanno sviluppato un modello di analisi predittiva che integra dati strutturati e non per valutare l'affidabilità creditizia del mutuatario. La scalabilità e la capacità di MongoDB di gestire diversi tipi di dati sono stati fondamentali per espandere e ottimizzare le operazioni di prestito.

  • Per la stragrande maggioranza degli abitanti dell'India, ottenere un credito è solitamente molto difficile a causa di regolamenti severi e della mancanza di dati sul credito. Grazie all'utilizzo di moderni sistemi di sottoscrizione, Slice, uno dei principali innovatori dell'ecosistema fintech indiano, sta contribuendo ad ampliare l'accessibilità al credito in India, semplificando il processo KYC per un'esperienza di credito più agevole. Utilizzando MongoDB Atlas in diversi casi d'uso, anche come archivio di funzionalità di ML in tempo reale, slice ha trasformato il processo di onboarding, riducendo i tempi di elaborazione a meno di un minuto. slice utilizza l'archivio di funzionalità in tempo reale con i modelli MongoDB e ML per calcolare istantaneamente oltre 100 variabili, consentendo la determinazione dell'idoneità al credito in meno di 30 secondi.

Trasformare il credit scoring con l'IA generativa

Oltre all'uso di dati alternativi e dell'IA nel credit scoring, la GenAI ha il potenziale di rivoluzionare il credit scoring e la valutazione con la sua capacità di creare dati sintetici e comprendere modelli complessi, offrendo un approccio più sfumato, adattivo e predittivo.

La capacità della GenAI di sintetizzare diversi set di dati risolve uno dei limiti principali del credit scoring tradizionale: la dipendenza dai dati storici sul credito. Creando dati sintetici che rispecchiano i comportamenti finanziari del mondo reale, i modelli di GenAI consentono una valutazione più inclusiva dell'affidabilità creditizia, una trasformazione che promuove l'inclusività finanziaria e apre le porte delle opportunità di credito a una fascia demografica più ampia.

L'adattabilità gioca un ruolo cruciale nell’affrontare la natura dinamica delle condizioni economiche e nel cambiare i comportamenti dei consumatori. A differenza dei modelli tradizionali, che faticano ad adattarsi a interruzioni impreviste, la capacità della GenAI di apprendere e adattarsi continuamente garantisce che il credit scoring rimanga efficace in tempo reale, offrendo uno strumento più resiliente e reattivo per la valutazione del rischio di credito. Oltre alla sua capacità predittiva, la GenAI contribuisce alla trasparenza e all'interpretabilità del credit scoring. I modelli possono generare spiegazioni per le loro decisioni, fornendo informazioni più chiare sulle valutazioni del credito e rafforzando la fiducia tra consumatori, autorità di regolamentazione e istituzioni finanziarie.

Tuttavia, una delle principali preoccupazioni nell'uso della GenAI è il problema delle cosiddette allucinazioni, in cui il modello può presentare informazioni prive di senso o completamente false. Esistono diverse tecniche per mitigare questo rischio e un approccio utilizza l'approccio Retrieval Augment Generation (RAG). Il RAG riduce al minimo le allucinazioni basando le risposte del modello su informazioni fattuali provenienti da fonti aggiornate, garantendo che le risposte del modello riflettano le informazioni più aggiornate e accurate disponibili.

Patronus AI, ad esempio, sfrutta il RAG con MongoDB Atlas per consentire agli ingegneri di valutare e confrontare le prestazioni dei modelli linguistici di grandi dimensioni (LLM) in scenari reali, generare casi di test contraddittori su larga scala e monitorare allucinazioni e altri comportamenti imprevisti e pericolosi. Questo aiuta a rilevare gli errori degli LLM su larga scala e a distribuire i prodotti IA in modo sicuro e affidabile.

Un altro partner tecnologico di MongoDB è Robust Intelligence. Il firewall AI dell'azienda protegge gli LLM in produzione convalidando input e output in tempo reale. Valuta e attenua rischi operativi come allucinazioni, rischi etici tra cui bias dei modelli e output tossici e rischi per la sicurezza, come le iniezioni dei prompt e le estrazioni di informazioni di identificazione personale (PII).

Con il maturare dell'IA generativa, la sua integrazione nel credit scoring e nei sistemi di richiesta di credito più ampi promette non solo un progresso tecnologico, ma una trasformazione radicale nel modo in cui valutiamo e concediamo il credito.

Un momento fondamentale nella storia del credito

La convergenza di dati alternativi, intelligenza artificiale e IA generativa sta ridefinendo le fondamenta del credit scoring, in quello che rappresenta un vero e proprio punto di svolta nel settore finanziario. Le sfide dei modelli tradizionali vengono superate attraverso l'adozione di metodi di credit scoring alternativi che offrono una valutazione più inclusiva e sfumata. L'IA generativa, pur introducendo la potenziale sfida delle allucinazioni, rappresenta l'avanguardia dell'innovazione non solo rivoluzionando le capacità tecnologiche ma ridefinendo radicalmente il modo in cui viene valutato il credito, favorendo una nuova era di inclusività, efficienza ed equità finanziaria.

Se desideri scoprire di più sulla creazione di applicazioni arricchite con l'IA di MongoDB, dai un'occhiata alle seguenti risorse: