Fuentes de datos
Fuentes de datos de empresas en España: dónde sale la información (y cuál fiarte)
Detrás de una buena base de datos de empresas no hay magia: hay fuentes públicas bien leídas y cruzadas. Este es el mapa de las que importan en España y qué aporta cada una.
Cuando alguien te vende datos de empresas, la primera pregunta debería ser: ¿de dónde salen? Los datos B2B fiables y legalmente defendibles vienen de fuentes públicas oficiales. La diferencia entre un proveedor serio y uno turbio es, en gran parte, la trazabilidad de su origen. Este es el mapa de las fuentes que componen el tejido empresarial español.
BORME — Boletín Oficial del Registro Mercantil
El latido del registro mercantil: constituciones, ceses y nombramientos, cambios de domicilio, ampliaciones de capital, disoluciones. Es la fuente para detectar empresas nuevas y para depurar las extintas. Lo tratamos en detalle en la guía dedicada al BORME.
AEAT — Agencia Tributaria
La administración tributaria es la referencia para la identidad fiscal: el NIF/CIF y la información asociada a la condición de la entidad. Es la columna que da firmeza al identificador que vertebra todo lo demás.
Registro Mercantil
Más allá del boletín, el Registro Mercantil es el depósito de la información societaria: forma jurídica, domicilio social, objeto y administradores. Es la base de la identidad jurídica de las sociedades.
GLEIF — el identificador LEI
GLEIF es la fundación global que gestiona el LEI (Legal Entity Identifier), un código internacional que identifica de forma única a entidades que operan en mercados financieros. Que una empresa tenga LEI es una señal de madurez y de actividad en operaciones reguladas: una pista valiosa de solvencia.
BDNS — Base de Datos Nacional de Subvenciones
La BDNS publica las subvenciones y ayudas públicas concedidas. Cruzar una empresa con la BDNS te dice si ha recibido fondos: otra señal pública de actividad y de capacidad para gestionar proyectos. Es uno de los marcadores que definen los registros "Gold".
PLACSP — Plataforma de Contratación del Sector Público
PLACSP recoge la contratación pública: qué empresas contratan con la Administración y en qué. Una empresa que gana contratos públicos demuestra solvencia y procesos. Es otro de los pilares de la señal Gold.
AEPD e INE
La AEPD (Agencia Española de Protección de Datos) es relevante para el marco de cumplimiento del tratamiento. El INE (Instituto Nacional de Estadística) aporta el contexto estadístico del tejido empresarial —distribución por sector, tamaño y territorio— que ayuda a dimensionar mercados.
Por qué cruzar fuentes da el mejor dato
Ninguna fuente, por sí sola, da el dato completo. El BORME te dice que una empresa nació; la AEAT confirma su identidad fiscal; GLEIF te dice si tiene madurez financiera; la BDNS y PLACSP, si recibe fondos o contrata con el sector público. El dato realmente valioso nace de unir todo eso sobre la misma empresa, usando el CIF como clave. Ese cruce es lo que separa una lista plana de un perfil con señales.
Una empresa es la suma de sus rastros públicos. El censo nace de unir esos rastros con rigor, no de copiar una sola fuente.
Lo que NO es una fuente legítima
Conviene decirlo claro: los datos "scrapeados" sin base legal, los listados revendidos con origen opaco o las bases compradas a terceros que prohíben su reventa no son fuentes legítimas, por baratas que parezcan. El riesgo —reputacional, legal y de calidad— no compensa. La materia prima correcta es la pública y trazable.
Cómo se traduce esto en el anuario
El censo de EmpresasEspaña se compone exactamente de estas fuentes —BORME, AEAT, Registro Mercantil, GLEIF, BDNS, PLACSP, AEPD, INE—, estructuradas y cruzadas por CIF. Por eso cada registro es trazable, y por eso los pliegos superiores pueden marcar la señal Gold (contratación pública, fondos o LEI) solo donde existe de verdad en fuente oficial. Sin inventar.
Del cuaderno al pliego
Cuando tengas claro a quién buscas, descarga tu lista.
Tres ediciones del anuario, filtrables por sector y provincia. CIF, razón social y contacto donde consta. Pago único, entrega inmediata en CSV, desde 19 €.
Preguntas frecuentes
¿Cuáles son las principales fuentes públicas de datos de empresas en España?
Las troncales son el BORME (Registro Mercantil), la AEAT (identidad fiscal), el propio Registro Mercantil, GLEIF (identificador LEI), la BDNS (subvenciones), PLACSP (contratación pública), la AEPD (marco de protección de datos) y el INE (estadística). Cada una aporta una pieza distinta.
¿Por qué hay que cruzar varias fuentes?
Porque ninguna fuente, por sí sola, da el dato completo. El BORME dice que la empresa nació, la AEAT confirma su identidad fiscal, GLEIF indica madurez financiera, BDNS y PLACSP revelan fondos y contratación pública. Unir todo eso por CIF produce un perfil con señales, no una lista plana.
¿Qué hace que un registro sea "Gold"?
Que la empresa emita una señal pública de actividad y solvencia: que contrate con la Administración (PLACSP), reciba fondos (BDNS) o tenga identificador LEI (GLEIF). En el censo solo se marca como Gold donde esa señal existe de verdad en fuente oficial.
¿Son legítimos los datos scrapeados o revendidos?
No si carecen de base legal o tienen origen opaco. Los listados revendidos con procedencia turbia o el scraping sin base legal no son fuentes legítimas. La materia prima correcta y defendible es la pública y trazable.
Sigue leyendo
Vuelve al índice del cuaderno.