Revista Tecnologia de Crédito

Revista Tecnologia de Crédito

Modelagem Temporal para Credit Scoring: Uma Nova Alternativa à Modelagem Tradicional Via Análise de Sobrevivência
Edição 56

Neste artigo revisamos os procedimentos comumente utilizados na modelagem de credit scoring, apontando para a necessidade de se obter escores contínuos de apoio à concessão de crédito. Nesse contexto, apresentamos os procedimentos gerais referentes à modelagem temporal de credit scoring, direcionados pela análise de sobrevivência. Essa modelagem consiste em uma base sólida e holística para o desenvolvimento de escores contínuos voltados à política de concessão de crédito, que propiciam avaliação contínua do risco de crédito em quaisquer dos diferentes tempos de relacionamento, além de oferecer a ordenação dos clientes na base, segundo sua chance de inadimplência a qualquer tempo, dentro e fora do período de desempenho.

Palavras-Chave: Análise de Sobrevivência, Credit Scoring, Função de Sobrevivência, Função de Risco Instantâneo de Inadimplência.

Introdução

Historicamente, os modelos de credit scoring compreendem uma das principais ferramentas formais de suporte à concessão de crédito. Seu desenvolvimento baseia-se, de uma forma geral, na construção de um procedimento formal para descrever quais das características dos clientes estão relacionadas significativamente com o seu risco de crédito e qual a intensidade e direção desse relacionamento. A idéia central consiste na geração de um escore ou de um grupo de escores através dos quais clientes potenciais possam ser ordenados segundo a sua chance de inadimplência.

Esses modelos são desenvolvidos a partir de bases históricas de performances de crédito dos clientes, bem como de bases que contenham informações pertinentes às características cadastrais dos indivíduos (tais como sexo, idade, estado civil, entre outras).

Grosso modo, o desenvolvimento de um modelo de credit scoring compreende as seguintes etapas: definições básicas dos problemas relacionados à concessão de crédito, identificação de variáveis potenciais, planejamento amostral, determinação do escore, validação e verificação da performance do modelo, determinação do ponto de corte ou faixas de escore e determinação da regra de decisão (maiores detalhes sobre as etapas de desenvolvimento de um modelo de credit scoring podem ser encontrados em SICSÚ, 1998 e ABREU, 2004).

Quando os primeiros modelos de credit scoring foram desenvolvidos entre os anos 40 e 50, a metodologia básica, aplicada a esse tipo de problema, era orientada por métodos de discriminação produzidos por FISHER (1936). Pode-se dizer que foi de DURAND (1941) o primeiro trabalho conhecido que utilizou análise discriminante para um problema de crédito, em que as técnicas desenvolvidas por Fisher foram empregadas para discriminar bons e maus empréstimos. Nesse contexto, a abordagem de Fisher não pode ser vista como o ponto inicial para o desenvolvimento das metodologias utilizadas como ferramentas de suporte à concessão de crédito, que hoje em dia são largamente direcionadas por técnicas mais sofisticadas, como regressão logística e linear, árvores de classificação, algoritmos genéticos e redes neurais, entre outras.

Destacam-se, atualmente, modelos altamente específicos, inclusive por produto e tipo de risco, direcionando o processo contínuo de aprimoramento das ferramentas de modelagem de crédito.

A base estatística da modelagem de crédito é o planejamento amostral usual, utilizado para a obtenção da resposta de interesse dentro de um período de desempenho (geralmente, fixado em 12 ou 18 meses — intervalo de tempo entre a solicitação do crédito e a observação do desempenho do cliente), isto é, a sua classificação dicotômica como bom ou mau pagador. Essa é a característica comum a todas as metodologias estatísticas descritas acima, dando origem ao que chamamos de modelos pontuais de credit scoring.

Com a classificação dicotômica pontual do cliente e suas características individuais em mãos, por meio do desenvolvimento de um modelo de credit scoring pontual, pode-se, então, descobrir quais características dos clientes estão relacionadas significativamente com o seu risco de crédito e qual a intensidade e direção desse relacionamento.

A Pontualidade e a Temporalidade da Modelagem

Do ponto de vista dos gestores do crédito, a pergunta básica para a sua concessão é: qual a propensão à inadimplência do cliente?

A resposta a essa pergunta, atualmente, vem do modelo pontual de credit score, correspondendo à chance do cliente estar ou não propenso à inadimplência.

A questão básica aqui é a pontualidade da modelagem, atribuída à simplificação da real resposta a uma determinada concessão de crédito.

Na verdade, a partir da entrada do cliente na base, antes mesmo do final do período de desempenho, este pode tornar-se mau pagador e a resposta à concessão do crédito é obtida, ou seja, temos o verdadeiro momento da resposta do cliente à concessão. Entretanto, baseados no planejamento amostral usual (descrito acima), utilizado para o desenvolvimento da modelagem de credit scoring, esperamos até o final do período de desempenho para, então, indicar se o desempenho do cliente foi bom ou mau por meio de um flag. Isto é, simplificamos a resposta.

Ou seja, apesar de termos o instante da ocorrência da resposta (no nosso caso, negativa) do cliente à concessão do crédito desde a sua entrada na base, este momento é ignorado, em detrimento de sua transformação simplificadora a uma resposta dicotômica passível de ser acomodada por técnicas usuais de modelagem de credit scoring. É o que podemos chamar de representação discreta do risco de crédito do cliente.

Entretanto, o que não podemos esquecer é que, apesar dos pontos de contato do cliente com a empresa serem discretos (pontuais), o relacionamento cliente-empresa é contínuo a partir de sua entrada na base.

Assim, intuitivamente, é natural pensarmos em adaptar a técnica de modelagem a uma resposta temporal do cliente à concessão, direcionando os procedimentos estatísticos a uma visão contínua do relacionamento cliente-empresa, ao invés de simplificar a resposta do cliente relacionada à concessão do crédito, adequando-a às técnicas usuais de modelagem.

É o que chamamos de modelagem temporal de credit scoring.
A Figura 1 apresenta um desenho esquemático das modelagens pontual (Painel A) e temporal (Painel B).

A pergunta básica dos gestores, relacionada à concessão do crédito, continua sendo a mesma, isto é, qual a propensão do cliente à inadimplência? Entretanto, a resposta a essa pergunta, na ocasião da consideração da modelagem temporal, é mais sofisticada, apontando para quando o cliente terá propensão à inadimplência, ao invés de simplesmente indicar se ele a terá.

 

Guardando as devidas proporções, a descrição acima das modelagens pontual e temporal equivale a passarmos a visualizar a história de um indivíduo por fotos ou por meio de um filme. As fotos representariam as várias modelagens pontuais necessárias ao longo da vida do indivíduo para visualizarmos sua evolução, enquanto o filme exibiria a modelagem temporal.

A Modelagem Temporal em Credit Scoring

Se o nosso interesse se volta para a modelagem contínua da propensão à inadimplência, do ponto de vista estatístico, temos um conjunto de procedimentos, que permitem a modelagem do tempo decorrido desde um momento inicial pré-estabelecido (entrada do cliente na base), até a ocorrência de um evento de interesse (resposta negativa relacionada ao desempenho de crédito do cliente). Tal conjunto de procedimentos é conhecido por análise de sobrevivência (LOUZADA-NETO, MAZUCHELI E ACHCAR (2002).

Nesse contexto, NARAIN (1992) foi o primeiro a sugerir a utilização de procedimentos de análise de sobrevivência como uma alternativa à metodologia usual de credit scoring. Entretanto, a comparação das duas abordagens —modelagem pontual e temporal para credit scoring —, bem como o desenvolvimento de novos procedimentos, só foram considerados alguns anos depois por BANASIK, CROOK e THOMAS (1999), STEPANOVA (2001), THOMAS e STEPANOVA (2002) e ABREU (2004).

Obviamente, em termos pontuais, isto é, em um determinado tempo de base fixo, os dois procedimentos de modelagem (pontual e temporal) devem coincidir. Isso é observado por ABREU (2004), que apresenta uma comparação entre modelos de regressão logística (modelagem pontual) e algumas variantes do modelo de COX (1984) (modelagem temporal), que direcionam aos mesmos resultados quando se trata de fixar um período de tempo de base a fim de compará-las. Isso, inclusive, em termos de capacidade preditiva da modelagem.

Voltamos à nossa comparação entre fotografar e filmar. Se estivéssemos tirando uma foto e filmando um indivíduo simultaneamente, no exato momento em que a foto é tirada, o frame correspondente do filme seria idêntico, retratando as mesmas características da foto.

Entretanto, a grande vantagem da utilização da análise de sobrevivência (modelagem temporal) está em proporcionar a obtenção de um escore contínuo, enquanto as técnicas usuais direcionadas a credit scoring culminam em um escore discreto (pontual), que precisa ser obtido várias vezes, por meio de diversas modelagens, se quisermos ter uma visão longitudinal do comportamento de crédito.

Além disso, por meio da análise de sobrevivência, temos uma visão holística da concessão do crédito. O fato será exposto a seguir.

Visualizando a Concessão de Crédito Holisticamente

Para descrever o comportamento do tempo até a inadimplência do cliente utilizamos duas funções bem conhecidas pelos usuários de análise de sobrevivência. A função de sobrevivência e a função de risco.

A função de sobrevivência descreve a chance de um cliente permanecer adimplente mais do que um determinado período de tempo de base (t), a partir de sua entrada na mesma, e pode ser estimada pela função de sobrevida empírica (COX e OAKES, 1984), que em um determinado tempo fixo tf é dada pelo quociente entre o número de clientes com tempos de base maior ou igual a tf e o número total de indivíduos na base.

A partir do estudo dessa função podemos saber o tempo de relacionamento transcorrido até a inadimplência? Qual a chance de um cliente tornar-se inadimplente depois de um ano de relacionamento? Ou mesmo, se o cliente esta na base há cinco anos, qual a chance de inadimplência nos próximos dois anos? A Figura 2 apresenta a curva de propensão à adimplência empírica, dentro do período de desempenho de um ano, referente a uma modelagem temporal de credit scoring considerando clientes em diferentes faixas etárias, obtidos em uma determinada campanha de aquisição. No eixo horizontal temos o tempo de relacionamento medido em dias, enquanto o eixo vertical assinala a chance de adimplência dos clientes de acordo com sua faixa etária. Observamos que os clientes na faixa etária de 18 a 25 anos têm chance aproximada de 80% de inadimplência ao final do primeiro ano de relacionamento, enquanto os clientes das faixas etárias superiores são menos propensos à inadimplência. A propensão à adimplência aumenta com a idade do cliente e tende a se estabilizar em patamares altos com o passar do tempo de relacionamento, direcionando a uma imunização. Quanto à inadimplência dos clientes das faixas etárias superiores, constatamos que ela se verifica a partir do quinto mês de relacionamento.

 

A função de sobrevivência, além de mostrar a dessemelhança entre os diversos decréscimos na chance dos grupos diferentes de clientes manterem-se adimplentes, proporciona também a quantificação das desigualdades entre os grupos. Ainda na Figura 1, comparando as faixas etárias 18-25 anos e 25-35 anos, temos que 50% dos clientes do grupo 18-25 anos tornam-se inadimplentes em 3 meses, enquanto que, para a faixa etária 25-35, esse patamar é atingido por volta do sexto mês de relacionamento.

Em resumo, podemos dizer que a função de sobrevivência propicia a obtenção de uma visão macro do comportamento de crédito do cliente, uma vez que sempre nos reportamos, em termos comparativos, ao tempo inicial do relacionamento.

Por outro lado, temos também interesse em saber quais os períodos de maior risco de inadimplência durante o relacionamento, orientando as ações da empresa a fim de evitá-la. Esses períodos são descritos pela função de risco instantâneo de inadimplência. Isto é, a função de risco é responsável pela verificação das transformações da chance de inadimplência de um cliente com o passar do tempo de relacionamento. Uma estimativa para a função de risco instantâneo de inadimplência no período de tempo u, compreendido entre dois tempos t0 e t0+u, é dada pelo quociente entre o número de clientes inadimplentes no período de tempo (t0, t0+u) e o número de indivíduos que não se tornaram inadimplentes até t0 multiplicado pela amplitude do intervalo de tempo considerado, isto é, u.

A Figura 3 apresenta a função de risco instantâneo de inadimplência referente aos clientes pertencentes ao grupo de idade 18-25 anos, considerando o fato de que a campanha de aquisição foi balizada por dois períodos de promoção A e B. No período de promoção A (três meses iniciais), o cliente paga 50% do valor do produto, enquanto no período de promoção B (quarto ao sétimo mês), o cliente paga 75% do valor do mesmo. A partir do final da promoção B o valor do produto é integral. O período de tempo apresentado no gráfico é de dois anos.

A função de risco instantâneo mostra os eventos importantes relacionados à inadimplência. Nos primeiros 60 dias de relacionamento registra-se um crescente aumento no risco de inadimplência, provavelmente relacionado a clientes que não iniciaram o relacionamento ou mesmo clientes que desistiram da compra. Em um segundo momento, ao final da promoção A, verifica-se um novo aumento na função de risco instantâneo de inadimplência, seguido por outro aumento maior ainda ao final do mês posterior a essa promoção. Finalmente, observamos mais dois picos de inadimplência instantânea relacionados ao final da promoção B e ao final de um ano de relacionamento, respectivamente.

Assim, a função de risco instantâneo de inadimplência proporciona a obtenção de uma visão micro do comportamento do tempo de relacionamento com o cliente, indicando os diferentes eventos importantes referentes à inadimplência, dentro do período de desempenho, completando, assim, a visão holística da concessão do crédito (macro e micro).

Comentários Finais

Neste artigo apresentamos os procedimentos gerais referentes à modelagem temporal de credit scoring, direcionados pela análise de sobrevivência. Observamos que essa modelagem consiste em uma base sólida e holística para o desenvolvimento de escores contínuos voltados à política de concessão de crédito, os quais propiciam avaliação contínua do risco de crédito em todos os diferentes tempos de relacionamento, ordenando os clientes segundo sua chance de inadimplência a qualquer tempo, dentro e fora do período de desempenho.

Os procedimentos de estimação das funções de sobrevivência e risco instantâneo de inadimplência apresentados baseiam-se em procedimentos conhecidos na estatística como não paramétricos. Procedimentos paramétricos, entretanto, podem ser encontrados em LOUZADA-NETO, MAZUCHELI e ACHCAR (2002).

Finalmente, ressaltamos que a análise de sobrevivência pode ser utilizada para a modelagem de quaisquer fenômenos relacionados à propensão de ocorrência, a partir de um tempo inicial pré-estabelecido, incluindo, além de inadimplência, aquisição de um novo produto, behavior, churning, ocorrência de sinistro, entre outras.

Agradecimentos: Francisco Louzada-Neto é apoiado financeiramente pelo CNPq.

Referências

ABREU, H. J. Aplicação da Análise de Sobrevivência em um problema de Credit Scoring e comparação com a Regressão Logística. Dissertação de Mestrado, UFSCar, 2004.
BANASIK J.; CROOK. J. N & THOMAS, L. C. Not if but when loans default. J. Oper. Res. Soc. 50 1185-1190, 1999.
COX, D.R. & OAKES, D. Analysis of Survival Data. London: Chapman & Hall, 1984.
FISHER, R.A. The use of multiple measurements in taxonomic problems, Annals of Eugenics 7, 179-188, 1936.
LOUZADA-NETO, F. ; MAZUCHELI, J. & ACHCAR, J.A. Análise de Sobrevivência e Confiabilidade. Monografias Del IMCA, Lima, Peru, 2002.
NARAIN B. Survival analysis and the credit granting decision. In: THOMAS LC, CROOK JN & EDELMAN (eds). Credit Scoring and Credit Control.OUP: Oxford, UK, pp 109-121, 1992.
SICSÚ, A.L. Desenvolvimento de um Sistema Credit Scoring Parte I e II, Revista Tecnologia de Crédito ed. 4 e 5, janeiro e março de 1998.
STEPANOVA, M. Using Survival Analysis Methods to Build Credit Scoring Models. PhD Thesis. University of Southampton, UK, 2001.
THOMAS, L.C. & STEPANOVA, M. Survival analysis methods for personal loan data. Operations Research, v.50, 2, p.277-289, 2002.

 

 


O dr. Francisco Louzada-Neto é professor da Universidade Federal de São Carlos, no Departamento de Estatística, coordenador do Programa de Pós-Graduação em Estatística da UFSCar, coordenador do Centro de Estudos do Risco (CER), editor-chefe da Revista Brasileira de Estatística, pesquisador bolsista do CNPq e consultor estatístico para várias áreas do conhecimento. Doutor em Estatística pela Universidade de Oxford, Inglaterra, Francisco Louzada-Neto é autor de seis livros e de mais de 50 artigos em periódicos estatísticos, nacionais e estrangeiros. Francisco Louzada-Neto pode ser contatado pelo endereço: Departamento de Estatística – UFSCar, CP 676, São Carlos, SP, CEP 13.565-905, Brasil; email: dfln@power.ufscar.br.


[an error occurred while processing this directive]