¿Qué es Xpath?
XPath (XML Path Language) es un lenguaje que permite la construcción de expresiones que atraviesan y buscan dentro de un documento XML. Son como las expresiones regulares pero sirven para seleccionar partes del código en función de sus etiquetas y atributos. XPath permite buscar y seleccionar teniendo en cuenta la estructura jerárquica del XML.
Lista de XPATH para SEO
Xpath | Query |
//a/@href | Enlaces de un site |
//a/text() | Anchor de los enlaces |
(//a/text() | //a/img/@alt) | Anchor de los enlaces y alt de las imagenes |
//title | Title |
//h1 | H1 |
//h2 | H2 |
//h3 | H3 |
//link[@rel=’canonical’]/@href | Link Canonical |
//meta[@name=’description’]/@content | Meta description |
//meta[@name=’robots’]/@content | Meta robots |
//img[@alt]/@src | URL de las imágenes |
//img/@alt | Alt de las imágenes |
//img[not(@alt)]/@src | Imágenes sin ALT |
//div[@id=’content’]/blockquote[1]/p/text() | Diagnostic info |
//a[@class=’l’]/@href | Google xpath query |
//div[@class=’r’]/a/@href | Enlaces de todas las entradas de Google |
//suggestion/@data | Suggest (autocompletar) de Google |
alt+010 // alt+013 | Eliminar saltos de linea en excel |
//link[@rel=’alternate’]/@hreflang | Hreflang |
//*[@class=’nombre de la clase’] | Elementos con una clase concreta |
//link[@rel=’amphtml’]/@href | Enlace AMP |
//h3[@class=’LC20lb DKV0Md’]/text() | Titulos entradas resultado Google |
//*[local-name() =’url’]/*[local-name() =’loc’] | Exportar URLs de un sitemap.xml |
Usos SEO Xpath
- Se puede usar para extraer breadcrumbs y así saber a que categoria pertenece la URL en la que estamos.
- Analizar competencia, por ejemplo precios de productos o stock.
- Rastrear oportunidades, podemos scrapear campos susceptibles de tener información SEO (H1, title, metadescription…) e incluso hacer un content gap.
El XPATH se ha hecho relevante en el SEO porque sirve para extraer y analizar información de páginas web de manera ágil.