Datos estructurados para LLMs

Qué schemas implementar y cómo hacerlo para que los motores generativos entiendan tu marca, tus contenidos y tus productos

8 min

Los datos estructurados nacieron para ayudar a los motores de búsqueda a interpretar el contenido de las páginas. En la era de los LLMs su papel se ha amplificado: los modelos generativos usan el marcado semántico para identificar entidades, validar hechos y decidir qué fragmentos extraer como respuesta.

No es opcional. Una web sin datos estructurados es invisible para muchas señales que los modelos usan para confiar en una fuente. Esta guía explica qué schemas priorizar, cómo implementarlos y qué prácticas funcionan mejor para GEO.

Por qué importan los datos estructurados en GEO

Los LLMs procesan texto, pero no todo el texto se les presenta igual. El marcado JSON-LD ofrece una capa semántica explícita que dice al modelo: "esto es una organización", "esto es un producto", "esto es una pregunta y su respuesta". Esa información reduce la ambigüedad y mejora la calidad de la extracción.

Adicionalmente, el schema "sameAs" enlaza tu entidad de marca con identificadores externos (Wikipedia, Wikidata, LinkedIn, Crunchbase), lo que permite al modelo cruzar fuentes y validar la información. Sin esa red de enlaces, tu marca queda como un nodo aislado fácil de confundir o de no citar.

JSON-LD como formato preferido

Google recomienda JSON-LD desde hace años y todos los principales crawlers (incluidos los de LLMs) lo procesan correctamente. Frente a microdata o RDFa, JSON-LD se inserta en un bloque <script> independiente del HTML visible, lo que facilita el mantenimiento y reduce errores.

La mejor práctica es centralizar la generación del JSON-LD en un componente reutilizable de tu CMS o framework. Esto evita duplicaciones, errores de copy-paste y permite actualizar todos los schemas a la vez cuando cambian las propiedades.

  • JSON-LD se inserta en un <script type="application/ld+json">
  • Es independiente del HTML visible y más fácil de mantener
  • Es el formato preferido por Google y por los crawlers de LLMs
  • Centraliza la generación en un componente reutilizable

Schema Organization: la base de tu identidad

El schema Organization define qué es tu empresa, dónde está, cómo se llama, qué identificadores externos tiene. Es el primer marcado que debes implementar y debería estar presente en cada página de tu web, idealmente en el layout principal.

El campo más infravalorado es "sameAs": un array de URLs que vinculan tu marca con sus perfiles oficiales en Wikipedia, Wikidata, LinkedIn, Crunchbase, GitHub y redes sociales. Para los LLMs, este array es oro: les permite identificar inequívocamente tu entidad y agregar información desde múltiples fuentes.

  • Implementa Organization en el layout principal de tu web
  • Incluye sameAs con Wikipedia, Wikidata, LinkedIn y Crunchbase si aplican
  • Añade logo, dirección, teléfono y email de contacto
  • Usa contactPoint para distintos canales (ventas, soporte, prensa)

Schema Article para contenido editorial

Cada artículo de blog, guía o pieza de contenido editorial debería llevar schema Article (o sus subtipos: NewsArticle, BlogPosting, TechArticle). Esto comunica al modelo qué autor lo firma, cuándo se publicó, cuándo se actualizó por última vez y qué entidad publica.

Particularmente importante en GEO son los campos "author" (con su propio schema Person enlazado a sameAs externos), "datePublished", "dateModified" y "publisher". Estos datos son los que el modelo usa para juzgar la frescura y la fiabilidad del contenido.

FAQPage y HowTo para respuestas extraíbles

FAQPage y HowTo son los schemas con mayor rendimiento directo en GEO. FAQPage marca explícitamente pares pregunta-respuesta, lo que los modelos pueden extraer casi tal cual. HowTo describe pasos secuenciales con instrucciones, ideal para guías prácticas.

Implementar FAQPage en páginas con preguntas frecuentes reales (no inventadas) multiplica las probabilidades de cita en motores generativos. Cuidado: Google ha restringido los rich results de FAQ a sitios oficiales y de salud, pero el marcado sigue siendo leído y valorado por los LLMs aunque no se muestre en SERP.

  • FAQPage para páginas con preguntas y respuestas reales
  • HowTo para guías paso a paso con instrucciones secuenciales
  • Mantén las respuestas concisas: 2-4 frases por respuesta
  • Asegúrate de que las preguntas reflejan búsquedas reales

Product y Service para ofertas comerciales

Si vendes productos o servicios, implementa Product (para físicos) o Service / Offer (para servicios profesionales). Estos schemas comunican qué ofreces, a qué precio, en qué condiciones y con qué reviews, lo que ayuda al modelo a recomendarte cuando el usuario pregunta por opciones en tu categoría.

Para Product, incluye name, description, brand, sku, offers, aggregateRating y review. Para Service, define provider, serviceType, areaServed y oferta. Cuanto más completo, más probabilidad de que el modelo te incluya en comparativas y recomendaciones.

Validación y mantenimiento

Implementar mal un schema puede ser peor que no implementarlo. Valida siempre con el Rich Results Test de Google y con Schema Markup Validator (validator.schema.org). Errores comunes son fechas en formato incorrecto, propiedades obligatorias ausentes y referencias circulares mal cerradas.

Establece un proceso de revisión periódica del marcado. Cuando cambias la estructura del contenido, actualizas precios o reorganizas categorías, el schema debe seguir el ritmo. Datos estructurados desactualizados generan desconfianza en los modelos y pueden penalizar la cita.

  • Valida con Rich Results Test y Schema Markup Validator
  • Revisa el schema cada vez que cambies estructura o datos
  • Documenta internamente qué schemas se aplican y en qué páginas
  • Centraliza la generación para reducir errores manuales

Puntos clave

  • JSON-LD es el formato preferido para marcado de datos estructurados
  • Organization con sameAs es la base de tu identidad para los LLMs
  • FAQPage y HowTo son los schemas con mayor rendimiento directo en GEO
  • Product y Service ayudan a aparecer en comparativas y recomendaciones
  • Valida siempre con Rich Results Test antes de publicar

¿Tu web no tiene datos estructurados o están incompletos?

Implementamos y validamos el marcado JSON-LD adecuado para tu negocio, alineado con SEO clásico y con visibilidad en motores generativos.