Dimensionamento da Inteligência Artificial (IA) em Open Banking: Criação da plataforma de aprendizagem automática da Trustly
Engenheiro de aprendizagem automática
"É tudo uma questão de dados!" Esta frase ficou comigo quando decidi juntar-me a Trustly como o seu primeiro engenheiro de aprendizagem automática no início de 2023. É impressionante o que conseguimos num período de tempo tão curto desde que começámos a construir a nossa Plataforma de Aprendizagem Automática! O tempo entre o desenvolvimento do modelo e a implantação do modelo usado para a tomada de decisões na produção caiu de meses para cerca de uma semana.
Introduzimos a governação do modelo e várias salvaguardas pré e pós-implementação para reduzir o risco de erros de produção que afectam o nosso tráfego e rentabilidade. Também reduzimos o tempo de resposta do modelo de segundos para apenas alguns milissegundos. Os marcos alcançados são tantos que se torna difícil contá-los. Neste blogue, descreverei como o Trustly se juntou à corrida para se tornar um dos principais intervenientes na aprendizagem automática e na IA no espaço Open Banking e porque estamos bem posicionados para a vencer.
Os pagamentos instantâneos garantidos dependem de Open Banking Modelos de risco
Se os dados são o petróleo que alimenta a rentabilidade a longo prazo, a América do Norte Open Banking é um reservatório ainda por descobrir, enterrado nas profundezas de décadas de ineficiências e complexidades do sistema financeiro. Concentremo-nos numa dessas ineficiências: as vias de pagamento tradicionais, como a ACH. Nos EUA, a ACH demora dias a ser processada e tem sido complicado e inconveniente para os clientes pagarem com o seu banco devido à má experiência do utilizador e aos longos prazos de liquidação. Por exemplo, consegue imaginar comprar activos criptográficos e recebê-los dias depois? Este foi o caso até que Trustly chegou ao mercado com Pagamentos Garantidos.
Agora, pode iniciar sessão no seu banco, escolher a conta bancária a partir da qual pretende pagar e, com alguns cliques, o seu pagamento está concluído. O comerciante recebe o pagamento e o cliente recebe imediatamente os seus activos digitais. Qualquer cliente pode pagar imediatamente a partir da sua conta, de qualquer banco, com o clique de um botão e sem precisar de um cartão de crédito ou de introduzir manualmente números de conta e de encaminhamento. Além disso, a plataforma Open Banking da Trustlyajuda os comerciantes a reduzir as dispendiosas taxas de processamento (a taxa média de processamento de cartões de crédito é de 2,24%, o que se soma aos custos de pagamento dos comerciantes).
Para que o pagamento ACH seja efectuado em tempo real, o Trustly paga ao comerciante diretamente do seu próprio bolso no momento da transação e, mais tarde, cobra o pagamento na conta do cliente. Como pode imaginar, o Trustly pode não conseguir cobrar o pagamento devido a fraude (que continua a ser muito inferior à fraude de cartão não presente, graças à autenticação multifactor do banco) ou simplesmente porque o cliente não tinha fundos suficientes durante a transação. Alguns riscos, como os descritos acima, estão envolvidos no fornecimento de uma experiência de pagamento tão instantânea, mas é aí que entra a aprendizagem automática. A aprendizagem automática reforça o motor de risco do Trustly para mitigar as transacções de risco e assegurar que podemos continuar a fornecer pagamentos garantidos rentáveis.
Trustly construiu conectores de pagamento com a maioria dos bancos na América do Norte, cobrindo 99% das instituições financeiras entre o Canadá e os EUA. Esta tecnologia permite a Trustly aceder e utilizar dados recentes de Open Banking para efetuar análises de risco e decidir se aprova ou recusa uma transação. A capacidade da nossa plataforma está diretamente relacionada com o sucesso dos nossos modelos de risco. Embora os riscos sejam elevados, a capacidade de aceder a dados financeiros recentes dos consumidores dá-nos uma vantagem competitiva para criar produtos de dados à escala utilizando a aprendizagem automática.
A plataforma de aprendizagem automática: Tomada de decisões de alto risco em escala
Criámos a nossa plataforma de aprendizagem automática para apoiar a tomada de decisões na avaliação do risco transacional. Falemos de escala: Trustly liga as empresas a milhares de instituições financeiras nos EUA e no Canadá como um método de pagamento de conta para conta.
Um dos desafios mais difíceis em Open Banking é a dificuldade de estabelecer um único padrão de dados entre todas as instituições financeiras. Cada instituição tem as suas formas particulares de gerir e partilhar os seus dados. O Trustly consolida os dados financeiros das instituições financeiras e categoriza-os num único modelo de dados padrão. O nosso modelo de dados unificado permite-nos construir um Armazém de Características que centraliza os dados de todas as instituições financeiras ligadas a Trustly: os mesmos conjuntos de características podem, portanto, ser utilizados tanto pelos grandes bancos como pelos bancos locais. Este elevado nível de normalização permite-nos escalar a nossa operação de ML entre instituições e regiões geográficas. Atualmente, dispomos de mais de 1700 características que podem ser reutilizadas em todos os nossos modelos de aprendizagem automática para melhorar a tomada de decisões.
Embora as características possam ser inseridas e utilizadas em qualquer modelo, muitas vezes é necessário dar atenção específica aos principais parceiros comerciais ou instituições financeiras. Por exemplo, uma grande instituição financeira nos EUA pode necessitar de um modelo específico, enquanto as instituições menores com um comportamento semelhante podem ser agrupadas num único modelo. Trustly opera atualmente vários modelos individuais de aprendizagem automática, juntamente com outros modelos que desafiam os que estão em produção, para garantir um ciclo de feedback contínuo. Continuamos a esforçar-nos por melhorar o nosso desempenho.
Enquanto na maioria das indústrias, as equipas de Ciência de Dados funcionam frequentemente como artesãos, em que cada desenvolvimento de modelo tem um Cientista de Dados dedicado e o seu próprio código, Trustly requer uma abordagem mais industrial. Como parte da nossa plataforma, criámos um pipeline de modelos normalizado que abrange todos os aspectos da criação, implementação e observabilidade de modelos, incluindo a preparação de dados, a seleção de características, a afinação de hiperparâmetros, a regularização, a validação de características, a orquestração, o rastreio de artefactos e o envolvimento de pontos finais de serviço. Esse pipeline é versionado em uma biblioteca interna. Ele é orientado por configurações e baseia-se em etapas configuráveis.
Por exemplo, é obrigatório aplicar a afinação de hiperparâmetros para o desenvolvimento de modelos, mas é possível escolher diferentes algoritmos de afinação através de uma configuração declarativa. Com este esforço, conseguimos reduzir o tempo de desenvolvimento de modelos de cerca de 3 meses para uma única semana. Graças a esta normalização, conseguimos atualizar todos os nossos modelos através da reciclagem automática.
Por último, mas não menos importante, os nossos modelos mais solicitados funcionam e mantêm um desempenho robusto de pedidos por segundo (RPS) em condições comerciais normais e podem demonstrar um aumento significativo da capacidade durante grandes eventos como a Super Bowl. Além disso, uma vez que operamos num negócio transacional, a avaliação do risco tem de responder a fortes restrições de tempo. Nenhum cliente espera segundos para ter a sua encomenda processada. À medida que introduzimos avanços metodológicos na seleção de características, regularização e processamento paralelo, reduzimos até 10 vezes os tempos de resposta e temos todos os nossos novos modelos com latência p99 inferior a 200ms, sendo que alguns modelos respondem efetivamente abaixo dos 35ms!
Para além da escalabilidade, também temos de nos lembrar que oferecemos uma garantia e servimos empresas em verticais de alto risco, como as criptomoedas e as apostas, com um impacto direto nos nossos resultados se algo correr mal na avaliação do risco. Se a nossa plataforma de aprendizagem automática for abaixo, estamos em sérios apuros! Para evitar este risco, desenvolvemos fortes medidas e processos de controlo: Todas as alterações nos modelos e políticas seguem procedimentos de governação rigorosos, como a revisão pelos pares, cartões de modelo, testes automatizados, verificações de cobertura de testes, testes de esforço e várias outras formas de validação. Além disso, dispomos de salvaguardas para reduzir o raio de ação e a gravidade de potenciais incidentes. Por exemplo, todos os modelos são acompanhados por, pelo menos, um modelo de recurso que pode ser ativado se o modelo principal ficar indisponível. O modelo de recurso pode atuar como substituto se um grupo de características não for calculado ou se o ponto de extremidade do modelo começar a atingir o tempo limite, permitindo-nos assim continuar as operações sem tempo de inatividade em caso de falhas.
Escalar a IA em Open Banking
Somos uma pequena e jovem equipa de Engenharia de Aprendizagem Automática e Cientistas de Dados. Ainda há muito trabalho de base para fazer. Poderá não ser hoje, amanhã ou no próximo ano, mas estamos confiantes de que o nosso trabalho irá preparar o terreno para uma IA de classe mundial em Open Banking. Trustly abriu uma brecha na superfície e cavou tão fundo que atingiu o grande reservatório do sistema financeiro norte-americano que é Open Banking dados associados à aprendizagem automática. Os dados estão a bombear. É altura de continuar a construir a nossa plataforma de aprendizagem automática para alimentar novas aplicações Open Banking .