Ir para o conteúdo
Ztract

Como transformar extratos bancários em planilhas organizadas — sem digitar tudo na mão

Extratos bancários estão entre os documentos mais bagunçados para digitalizar: cada banco usa um layout diferente, as tabelas se espalham por várias páginas e um sinal de menos lido errado bagunça toda a conciliação. Veja como extraí-los para Excel, CSV ou JSON de forma limpa.

A equipe Ztract 7 min read
  • tutorial
  • bank statements
Um notebook aberto sobre a mesa ao lado de extratos financeiros impressos e um caderno — o fluxo de conciliação manual que a extração de documentos substitui.

Pergunte a qualquer profissional de contabilidade como é a manhã de segunda-feira e você vai ouvir alguma versão do mesmo ritual: abrir uma pilha de extratos bancários em PDF e começar a digitar. Data, descrição, valor, saldo. Linha após linha, extrato após extrato, cliente após cliente. Para um escritório que cuida de uma dezena de contas, isso significa quase um dia inteiro por mês transcrevendo números que um computador já leu uma vez, quando gerou o PDF.

A parte frustrante não é o volume. É que os dados já estavam estruturados quando o banco os produziu — e depois foram achatados em um layout de página que agora um ser humano precisa fazer engenharia reversa na mão.

Este artigo mostra como recuperar esses dados: em Excel, CSV ou JSON organizados, sem digitação manual. Vamos ver por que extratos bancários são especialmente difíceis de extrair, os prós e contras das abordagens mais comuns e um passo a passo usando o Ztract — incluindo os casos em que a coisa fica complicada e o que fazer a respeito.

Por que extratos bancários são mais difíceis do que parecem

Notas fiscais e recibos já são bagunçados, mas extratos bancários estão em outro nível de dificuldade. Alguns motivos:

  • Cada banco tem seu próprio layout. Não existe padrão. Chase, HSBC, uma cooperativa de crédito local e um banco digital organizam colunas, datas e saldos de maneiras diferentes. Um modelo que você cria para um é inútil para o próximo.
  • As tabelas se espalham por várias páginas. Um único mês pode ocupar quatro ou cinco páginas, com a tabela de transações se interrompendo no meio e recomeçando depois de um cabeçalho de página. Uma extração ingênua ou perde as linhas de continuação ou duplica o cabeçalho como se fosse dado.
  • PDF vs. digitalização vs. foto. Um extrato baixado do internet banking é baseado em texto e limpo. O mesmo extrato escaneado em uma agência, ou fotografado com o celular, é uma imagem — agora você precisa de OCR antes de extrair qualquer coisa, e o OCR introduz seus próprios erros.
  • As pequenas coisas que arruinam a conciliação. Um débito mostrado como (1,250.00) entre parênteses em vez de -1250.00. Uma data escrita como 03/06, ambígua entre 3 de junho e 6 de março. Um símbolo de moeda colado ao número. Separadores de milhar. Cada detalhe é pequeno, e cada um deles corrompe silenciosamente uma planilha se for lido errado.

Qualquer abordagem que se proponha a “simplesmente extrair extratos bancários” precisa ter uma resposta para tudo isso. A maior parte da frustração manual vem da longa cauda de casos extremos, não do caminho ideal.

As abordagens mais comuns, e onde cada uma deixa de funcionar

Não existe uma única ferramenta certa — depende do seu volume e do quanto seus extratos variam. Para ser honesto, os prós e contras são estes:

Digitar na mão. Zero configuração, precisão total se você tomar cuidado e completamente impossível de escalar. Tudo bem para um extrato por mês. Inviável para um escritório.

“Importar” no Excel / Google Sheets. Se o seu banco oferece exportação em CSV, use — esse é o caminho mais limpo e você nem precisa de extração. O problema é que a maioria dos documentos que as pessoas realmente recebem são PDFs, e colar uma tabela de PDF no Excel embaralha as colunas no momento em que o layout não está perfeitamente alinhado em grade.

Parsers baseados em modelos (templates). Você define, uma vez, onde cada campo fica na página. Rápido e barato se todos os extratos forem idênticos. Mas, como cada banco é diferente, você acaba criando e mantendo um modelo por banco — e refazendo tudo no dia em que um banco ajusta o layout. O custo de configuração consome a economia de tempo, a menos que seus extratos sejam muito uniformes.

Extração baseada em LLM. Em vez de marcar posições, você descreve em linguagem natural os campos que quer, e o mecanismo se adapta a cada layout. Isso resolve diretamente o problema do “cada banco é diferente” e é muito mais tolerante a digitalizações e formatações estranhas. A contrapartida é que você quer uma ferramenta que permita verificar o resultado, porque está confiando em um modelo para ler a página, e não em uma coordenada fixa.

Essa última categoria é onde o Ztract se encaixa, então vamos vê-la na prática.

Passo a passo: do extrato bancário à planilha no Ztract

Aqui está o fluxo completo, o mesmo que você usaria para um único extrato ou para uma pasta com cinquenta.

1. Crie um projeto e defina o que você quer

Um projeto é simplesmente um contêiner para documentos relacionados e o schema que você vai aplicar a eles. Para extratos bancários, há três maneiras de definir esse schema:

  • Comece a partir do schema pronto para extratos bancários e ajuste-o. Esse é o começo mais rápido — ele já conhece datas de transações, descrições, valores de débito/crédito e saldos.

  • Descreva os campos em linguagem simples. Por exemplo:

    “Para cada extrato, extraia o nome do titular da conta, o número da conta, o período do extrato, o saldo inicial e o saldo final. Em seguida, para cada transação, extraia a data, a descrição, o valor (negativo para débitos) e o saldo.”

    Repare no trecho entre parênteses — “negativo para débitos”. Essa única instrução diz ao mecanismo como normalizar aqueles parênteses (1,250.00) em um -1250.00 limpo, que é exatamente o tipo de caso extremo que faz um parser baseado em modelo descarrilhar.

  • Inferir a partir de uma amostra. Coloque um extrato representativo e deixe o Ztract propor um schema com base nele. Útil quando você não tem certeza de quais campos um determinado banco inclui até ver um.

A grande vantagem aqui é que o mesmo schema funciona em diferentes bancos. Você está descrevendo os dados que quer, não a posição em que eles ficam, então um layout que você nunca viu antes é tratado da mesma forma.

2. Faça o upload dos extratos

Arraste seus arquivos — PDF, Word, Excel, digitalizações ou fotos de celular, até 500 MB por arquivo. PDFs baseados em texto e digitalizações em imagem funcionam igualmente; as digitalizações simplesmente passam por OCR primeiro. Se você tem os extratos de um mês em arquivos separados, envie todos juntos e o schema é aplicado a todos eles.

3. Revise e corrija — esta é a parte que importa

É aqui que os extratos bancários fazem jus à sua fama, e é o passo em que vale a pena ir mais devagar. O Ztract mostra cada valor extraído ancorado à sua posição exata na página de origem: clique em um número nos resultados e ele destaca de onde, no extrato, aquele valor veio.

Essa visão lado a lado é o que torna a verificação rápida. Em vez de reconferir cada número contra o original, você procura apenas os que parecem estranhos — uma transação que caiu na data errada, um saldo que não fecha — e os corrige em um clique. E, como cobramos apenas pela extração, corrigir um valor não custa nada. O trabalho de edição posterior é gratuito; só as páginas que você extrai contam no seu pacote.

Para extratos de várias páginas, este também é o momento de confirmar que a tabela foi remontada corretamente nas quebras de página — que as linhas de continuação vieram e que um cabeçalho repetido não entrou disfarçado como uma transação fantasma.

Ztract Bank Statements Extract

4. Exporte

Quando estiver tudo certo, exporte para Excel, CSV ou JSON — um único extrato ou o projeto inteiro de uma vez. A partir daí, os dados caem direto no seu fluxo de conciliação, na importação do seu software contábil ou onde quer que os números precisem ir em seguida.

Os casos que ainda pedem o olhar de uma pessoa

Preferimos te contar onde isso fica difícil do que fingir que não fica. Algumas situações para ficar de olho:

  • Extratos multimoeda. Se um extrato mistura moedas, seja explícito no seu schema sobre capturar a moeda por transação e confira os totais na etapa de revisão. Não presuma uma única moeda para o documento inteiro.
  • Digitalizações muito degradadas. Um extrato enviado por fax e depois reescaneado, com impressão apagada, é difícil de ler para qualquer um, inclusive para o OCR. Se a origem está ilegível para o seu olho, espere precisar verificar com mais atenção. Uma digitalização mais limpa do mesmo documento vale mais do que qualquer correção feita depois.
  • Células mescladas ou irregulares. Alguns bancos mesclam células de descrição em várias linhas, ou dividem uma transação em duas linhas visuais. A etapa de revisão é exatamente onde você pega esses casos, e é por isso que a construímos para ser rápida, em vez de tratar a extração como algo que se dispara e esquece.

Se um layout que deveríamos tratar voltar errado, queremos muito ver — envie uma amostra (anonimizada, se precisar) para support@ztract.com e vamos investigar. Os documentos que as pessoas nos enviam são como o mecanismo melhora.

Uma observação sobre dados financeiros sensíveis

Extratos bancários estão entre os documentos mais sensíveis que existem, então vale deixar claro: não treinamos modelos com os documentos que você envia — nem o nosso próprio mecanismo, nem os LLMs de terceiros pelos quais roteamos. As APIs comerciais que usamos proíbem o treinamento com os dados enviados, e nós nos apoiamos nesses compromissos. Quando você exclui um extrato, ele some imediatamente do armazenamento ativo e, em até 14 dias, dos backups. O quadro completo está na nossa Política de Privacidade e no nosso Acordo de Processamento de Dados.

Experimente nos seus próprios extratos

A forma mais rápida de saber se isso se encaixa no seu fluxo de trabalho é rodar a ferramenta em um extrato que, de outra forma, você estaria digitando na mão. Novas contas ganham 30 páginas gratuitas, sem cartão de crédito — o suficiente para extrair alguns extratos reais do começo ao fim e ver como o resultado sai limpo.

Se você processa extratos em volume e estaria disposto a compartilhar um feedback honesto sobre o que funcionou e o que não funcionou, entre em contato — estamos integrando usuários iniciais e moldando o que construímos em seguida em torno dos documentos com que as pessoas realmente têm dificuldade. Extratos bancários estão quase no topo dessa lista.

Confira nossa página de caso de uso para saber mais sobre extração de extratos bancários.

← Back to all posts