Oryxi Pay — plataforma de pagamentos PIX resiliente
Plataforma de pagamentos instantâneos que aguentou 9× o pico trinacional sem cair
O que construímos
O cliente operava cobrança PIX via uma integração direta com um único PSP. Funcionava bem no dia bom — mas o pico trinacional de fim de ano dobrava o tráfego, o PSP engasgava, webhooks chegavam duplicados e a conciliação atrasava horas. Cliente final ficava sem confirmação; suporte virava maratona.
Reescrevemos a integração com fila assíncrona, idempotência por chave única e retry exponencial com dead-letter queue. Adicionamos um segundo PSP em failover automático — se o primário lentamente, a fila redireciona pro secundário sem o usuário perceber. Conciliação em tempo real via webhook, com replay manual quando algo escapa.
Implementamos split automático entre marketplace e vendedores (percentual ou valor fixo), cobrança recorrente, PIX agendado e antifraude com regras customizáveis por velocity, geolocalização e score. Tudo monitorado em dashboard ao vivo com feed de transações e alertas no Slack quando algo trava.
No pico seguinte — 9× o tráfego médio — o Oryxi Pay não caiu. Conciliação ficou em < 2 segundos do pagamento ao registro. Suporte não recebeu reclamação de pagamento perdido. E o cliente final viu o pagamento confirmar antes de soltar o celular.
Métricas
Tecnologias usadas
- Next.js 15 + React 19
- Node 22 + Fastify pra workers
- Postgres + Redis (fila)
- AWS SQS + Lambda pra eventos
- Múltiplos PSPs (Asaas, Iugu, Mercado Pago, Sicoob)
- Open Finance pra conciliação
- Sentry + Datadog APM + Grafana
Decisões de arquitetura
- 01Edge front-end pra checkout (LCP < 1s mesmo no 3G).
- 02Workers stateless em Lambda processando webhooks em paralelo.
- 03Fila durável (Postgres advisory locks + SQS) com retry exponencial e DLQ visível.
- 04Idempotência por chave única em todo endpoint que muda estado.
- 05Failover entre PSPs com circuit breaker — se um PSP demora >2s consistentemente, fila migra pro próximo.
- 06Antifraude em duas camadas: regras estáticas (velocity, blacklist) + ML score (modelo treinado com histórico).
- 07Auto-scaling agressivo no pico, com chaos engineering (game day mensal matando serviço em produção).
Capacidades aplicadas neste projeto
Quer um projeto assim?
Conta o desafio da sua empresa. Desenhamos a solução junto com você — sem enrolação, sem caixa-preta.
Fale com a Oryxi →