Guías

OCR de facturas con API: cómo integrar la extracción en tu software

Si estás construyendo un producto que maneja facturas —un ERP, una herramienta de gastos, un software de contabilidad— tarde o temprano te topas con el mismo problema: tus usuarios suben PDFs e imágenes, y tú necesitas datos, no documentos. Ahí es donde entra el OCR de facturas por API.

Pero no todos los enfoques son iguales. Esta guía aclara la diferencia entre un OCR genérico y una API de extracción de facturas, y muestra cómo es una integración real.

OCR genérico vs. extracción de facturas

Un OCR clásico convierte una imagen en texto plano. Te devuelve todas las palabras de la factura, pero sin saber cuál es la base imponible, cuál el NIF del emisor o cuál el total. Ese mapeo —del texto a campos con significado— te toca programarlo a ti, con todas las variaciones de formato que existen.

Una API de extracción de facturas hace ese trabajo: devuelve directamente campos estructurados con nombre estable. En lugar de parsear texto, recibes un JSON con vendor_tax_id, tax_base, tax_amount o total. Lo explicamos en detalle en cómo extraer datos de facturas PDF automáticamente.

Cómo es una integración real

La integración se reduce a una llamada HTTP. Envías el documento y recibes los datos:

  • Autenticación: una API Key en la cabecera X-Api-Key. La generas desde tu panel y la revocas cuando quieras.
  • Petición: un POST a /api/v1/invoices/scan con el fichero (PDF, JPG, PNG o TIFF).
  • Respuesta: un JSON con los campos fiscales y una puntuación de confianza por campo.

Hay además un endpoint /invoices/scan-test para probar la extracción sin consumir cuota mientras desarrollas, y webhooks para recibir un aviso cuando cada factura termina de procesarse, sin hacer polling. Tienes el detalle de endpoints, campos y autenticación en la página de la API de InvoiceData.

Por qué la fiscalidad española importa

La mayoría de APIs de OCR de facturas son internacionales y devuelven campos genéricos. Para un producto que opera en España, eso deja trabajo a medias: el IVA español se desglosa en tres tipos (4 %, 10 % y 21 %), existen la retención de IRPF y el recargo de equivalencia, y el NIF/CIF tiene un dígito de control verificable.

Una API construida para España te entrega esos campos ya resueltos y valida el NIF antes de que llegue a tu sistema. Es la diferencia entre integrar datos listos para contabilizar y tener que reconstruir las reglas fiscales tú mismo.

Qué tener en cuenta al elegir proveedor

  1. Estabilidad del contrato: que los nombres y tipos de los campos no cambien entre versiones menores, para que tu integración no se rompa.
  2. Confianza por campo: saber en qué datos confiar y cuáles marcar para revisión humana.
  3. Dónde se procesan los datos: si tus usuarios están en la UE, el procesamiento dentro del espacio europeo y el cumplimiento del RGPD no son opcionales.
  4. Fiscalidad local: que cubra IVA desglosado, IRPF, recargo y validación de NIF si trabajas con facturas españolas.

Si automatizas facturas para terceros —por ejemplo, en una asesoría—, la API encaja igual de bien con un flujo sin código: lo cuentas en cómo automatizar la entrada de facturas en una asesoría.

¿Quieres una clave de prueba para integrar la extracción en tu producto? Solicita una demo y la generamos contigo.