Saltar al contenido
Ztract

Cómo extraer datos de facturas a Excel — sea cual sea el diseño

Cada proveedor envía las facturas con un diseño distinto, y eso es justo lo que hace tan tedioso volcarlas a una hoja de cálculo. Aquí te explicamos cómo pasar el número de factura, las fechas, los totales y las líneas de detalle a Excel, CSV o JSON limpios — sea cual sea el diseño y sin tener que crear una plantilla por cada proveedor.

El equipo de Ztract 7 min read
  • tutorial
  • invoices
Una factura sobre un escritorio junto a un portátil y una calculadora — el papeleo de cuentas por pagar que termina retecleándose a mano en una hoja de cálculo.

Si tu bandeja de entrada se llena de facturas de proveedores cada mes, ya conoces la rutina: abrir cada PDF, buscar el número de factura, la fecha, el total, copiar cada línea de detalle y teclearlo todo en una hoja de cálculo. Y luego repetirlo con el siguiente proveedor — cuya factura no se parece en nada a la anterior.

Esa última parte es el verdadero problema. No es el volumen de facturas; es que no hay dos proveedores que las formateen igual. El total está en otro lugar, las fechas usan otro estilo, la tabla de líneas de detalle tiene columnas distintas. Una persona se adapta a cada una sin pensarlo. La mayoría del software, no — y por eso tantos equipos se rinden y acaban retecleándolo todo a mano.

Este artículo te muestra cómo sacar los datos de las facturas a Excel, CSV o JSON limpios — sea cual sea el diseño — sin tener que crear y mantener una plantilla distinta para cada proveedor.

Por qué extraer facturas es más difícil de lo que parece

Una sola plantilla de factura, fija, es fácil. El problema es que casi nunca tienes una sola. Algunas razones por las que las facturas se resisten a una extracción limpia:

  • El diseño de cada proveedor es diferente. No existe un estándar del sector sobre dónde van el número de factura, la dirección de facturación o los totales. La plantilla que configuras para un proveedor se rompe en cuanto un proveedor nuevo envía su primera factura.
  • «El importe» es ambiguo. Una misma factura incluye una base imponible, impuestos, gastos de envío, un total antes de descuento y un importe final a pagar — a menudo apilados unos junto a otros. Extrae «el importe» sin decir cuál, y obtendrás el que el motor haya adivinado.
  • Las líneas de detalle son una lista, no un valor. Cada factura tiene un único número de factura pero muchas líneas de detalle, cada una con su propia descripción, cantidad, precio unitario y total de línea. Si lo aplanas mal, obtienes un revoltijo donde querías filas limpias.
  • PDF, escaneo o foto. Una factura enviada por correo como PDF es texto limpio. La misma factura escaneada en recepción o fotografiada con el móvil es una imagen — ahora necesitas OCR antes de poder extraer nada, y el OCR trae sus propios errores.

Cualquier herramienta que afirme «simplemente extraer facturas» tiene que dar respuesta a todo esto. La frustración manual vive en esa variedad, no en ninguna factura concreta.

Los enfoques habituales, y dónde deja de funcionar cada uno

No hay una única herramienta correcta — depende de cuántos proveedores manejes y de lo consistentes que sean sus diseños.

Teclearlo a mano. Cero configuración, preciso si tienes cuidado y completamente inescalable. Aceptable para un puñado al mes; inviable en cuanto procesas docenas de muchos proveedores distintos.

Analizadores basados en plantillas. Defines, una vez, dónde se sitúa cada campo en la página. Rápido y barato si todas las facturas son idénticas. Pero como cada proveedor es distinto, acabas creando y manteniendo una plantilla por proveedor — y reconstruyéndola el día que un proveedor retoca su diseño. Con tres o cuatro proveedores estables esto va bien. Con una lista larga y cambiante de proveedores, el coste de configuración se come el tiempo ahorrado.

Extracción en lenguaje natural. En lugar de marcar posiciones, describes los campos que quieres en lenguaje corriente y el motor se adapta a cada diseño. Esto aborda directamente el problema de que «cada proveedor es diferente», y es mucho más tolerante con los escaneos y los formatos raros. La contrapartida es que conviene una herramienta que te permita verificar el resultado — porque estás confiando en que un modelo lea la página en lugar de en una coordenada fija.

Esa última categoría es donde se sitúa Ztract, así que veámosla en concreto.

Paso a paso: de la factura a Excel en Ztract

Este es el flujo completo — el mismo tanto si procesas una sola factura como una carpeta con cincuenta de una docena de proveedores distintos.

1. Crea un proyecto y describe lo que quieres

Un proyecto no es más que un contenedor para documentos relacionados y el esquema que les aplicarás. Para las facturas, tienes tres formas de definir ese esquema:

  • Parte del esquema de facturas listo para usar y ajústalo. Es el arranque más rápido — ya conoce los números de factura, las fechas, los datos del proveedor, los totales y las líneas de detalle.

  • Describe los campos en lenguaje corriente. Por ejemplo:

    «Por cada factura, extrae el número de factura, la fecha de emisión, el nombre del proveedor y el importe total a pagar (después de impuestos y descuentos). Luego, por cada línea de detalle, extrae la descripción, la cantidad, el precio unitario y el total de línea. Si un campo no está presente, déjalo en blanco en lugar de adivinarlo.»

    Fíjate en dos cosas ahí. «El importe total a pagar (después de impuestos y descuentos)» le indica al motor exactamente cuál de los varios importes quieres. Y «por cada línea de detalle» marca las líneas de detalle como una lista que se repite, de modo que recibes filas limpias en lugar de todo apelmazado en una sola celda. Esos dos hábitos son casi todo lo que distingue un resultado de facturas fiable de un desastre.

  • Infiere a partir de una muestra. Suelta una factura representativa y deja que Ztract te proponga un esquema a partir de ella. Útil cuando la factura de un proveedor nuevo tiene campos que no esperabas.

La ventaja clave: el mismo esquema funciona con todos los proveedores. Estás describiendo los datos que quieres, no la posición en la que están — así que un diseño que nunca has visto se gestiona igual que uno que ya conoces. Sin una plantilla por proveedor.

2. Sube las facturas

Arrastra tus archivos — PDF, Word, Excel, escaneos o fotos del móvil, hasta 500 MB por archivo. Funcionan tanto los PDF basados en texto como los escaneos basados en imagen; a los escaneos simplemente se les pasa OCR primero. Si las facturas de un mes llegan como archivos sueltos de distintos proveedores, súbelos todos juntos y el mismo esquema se aplica a cada uno.

3. Revisa y corrige — la parte que de verdad ahorra tiempo

Esto es lo que la gente subestima: con las facturas, la extracción no es donde se va el tiempo — es la comprobación. Si no puedes confiar en el resultado, acabas releyendo cada factura contra la hoja de cálculo de todos modos, y no has ahorrado nada.

Ztract está construido en torno a eso. Cada valor extraído queda anclado a su posición exacta en el documento de origen: haz clic en un número de los resultados y se resalta de dónde salió en la factura. Esa vista lado a lado es lo que hace que revisar sea rápido. En lugar de volver a comprobar cada campo, buscas los que parecen mal — un total que tomó por error la base imponible, una línea de detalle que fusionó dos filas — y los corriges con un clic.

Y como solo cobramos por la extracción, corregir un valor no te cuesta nada. La edición posterior es gratis; solo las páginas que extraes descuentan de tu paquete, no la limpieza.

4. Exporta

Cuando todo se vea bien, exporta a Excel, CSV o JSON — una sola factura o el proyecto entero de una vez. Desde ahí pasa directamente a tu flujo de cuentas por pagar, a la importación de tu software de contabilidad o a donde necesiten ir los números a continuación.

Los casos que aún requieren ojo humano

Preferimos decirte dónde esto se complica antes que fingir que no. Algunas situaciones a vigilar:

  • Notas de crédito y devoluciones. Una nota de crédito se parece a una factura, pero los importes van en sentido contrario. Sé explícito en tu esquema sobre cómo tratar los importes negativos, y comprueba dos veces el signo en el paso de revisión.
  • Proveedores en varias monedas. Si compras a proveedores en monedas distintas, captura la moneda como un campo propio por factura en lugar de dar por hecho una sola moneda en todo el lote — de lo contrario, un total de «1.000» no te dice nada.
  • Escaneos muy degradados. Una factura enviada por fax y luego reescaneada, con la impresión tenue, es difícil de leer para cualquiera, incluido el OCR. Si el original es ilegible para tu ojo, prepárate para verificar con más detenimiento — un escaneo más limpio vale más que cualquier corrección a posteriori.

Si un diseño que deberíamos gestionar vuelve mal, de verdad queremos verlo — envía una muestra (anonimizada si lo necesitas) a support@ztract.com y lo investigaremos. Los documentos que la gente nos manda son la forma en que el motor mejora.

Una nota sobre los datos de proveedores

Las facturas contienen información comercial sensible — a quién compras, cuánto pagas, tus números de cuenta — así que conviene dejarlo claro: no entrenamos modelos con los documentos que subes. Ni nuestro propio motor, ni los LLM de terceros a través de los que enrutamos; las APIs comerciales que usamos prohíben entrenar con los datos enviados, y nos apoyamos en esos compromisos. Cuando eliminas una factura, desaparece de inmediato del almacenamiento activo y, en un plazo de 14 días, de las copias de seguridad. El panorama completo está en nuestra Política de Privacidad y nuestro Acuerdo de Tratamiento de Datos.

Pruébalo con tus propias facturas

La forma más rápida de saber si esto encaja en tu flujo de trabajo es probarlo con un puñado de facturas reales que, de otro modo, estarías tecleando a mano — idealmente de varios proveedores distintos, para que veas cómo el mismo esquema gestiona diseños diferentes. Las cuentas nuevas reciben 30 páginas gratis, sin tarjeta de crédito — de sobra para extraer un lote de principio a fin y comprobar los totales tú mismo.

Y si procesas facturas en volumen y te animas a compartir comentarios sinceros sobre lo que funcionó y lo que no, ponte en contacto — estamos incorporando a los primeros usuarios y dando forma a lo que construimos a continuación en torno a los documentos con los que la gente realmente se atasca. Las facturas están justo al principio de esa lista.

Echa un vistazo a nuestra página de caso de uso para saber más sobre extracción de datos de facturas.

← Back to all posts