Expressões regulares para trabalhar com HTML


Autor/fonte: Jonnas Fonini
E-mail/Url: http://www.fonini.net/regex/10-expressoes-regulares-para-trabalhar-com...
Tags: [ expressões regulares ]



Digg del.icio.us

Reuni algumas expressões regulares úteis para trabalhar com HTML.

Encontra comentários HTML

<!--[\s\S]*?--[ \t\n\r]*>


Captura o atributo href de links

href[\s]*=[\s]*"[^\n"]*"


Encontra todos os atributos de uma tag. Ex: src, name, value.

(?:[\w]*) *= *"(?:(?:(?:(?:(?:\\\W)*\\\W)*[^"]*)\\\W)*[^"]*")
Testar


Encontra tags < h1 > até < h6 >

<h([1-6])>([^<]*)</h([1-6])>


Encontra tags <a> válidas

^<a[^>]*([^"]*)[^>]*>([ 0-9a-zA-Z]+)</a>$


Encontra todas as URL's de um texto

(http://|https://)([a-zA-Z0-9]+\.[a-zA-Z0-9\-]+|[a-zA-Z0-9\-]+)\.[a-zA-Z\.]{2,6}(/[a-zA-Z0-9\.\?=/#%&\+-]+|/|)


Encontra todas as imagens

<[iI][mM][gG][a-zA-Z0-9\s=".]*((src)=\s*(?:"([^"]*)"|'[^']*'))[a-zA-Z0-9\s=".]*/*>(?:</[iI][mM][gG]>)*


Encontra tudo que está entre as tags especificadas. Mais tags podem ser adicionadas

<(script|style)[^>]*?>(?:.|\n)*?</\s*\1\s*>


Útil para remover tags HTML

<[^>]*>


Encontra extensões de arquivos

\.([A-Za-z0-9]{2,5}($|\b\?))



Sobre o autor(a): Jonnas Fonini
fonini
Avatar



Enviado por jfonini em 15/02/2010 às 09:54


Itens relacionados

Aprenda expressões regulares!

Avaliação

Esta publicação ainda não foi avaliada!


Avaliar:


A avaliação de publicações é restrita a membros cadastrados e logados no nosso site.



Comentários

Este artigo ainda não foi comentado ou o(s) comentário(s) que foi(ram) enviado(s) a ele ainda não foi(ram) publicado(s).


Envio de comentário:




  

Terça, 29 de Julho de 2014




Top 5 membros

Últimos membros online

  • 1em 29/07 às 09:08
  • xKuRtem 27/07 às 15:13
  • JCanecaem 26/07 às 19:02

Últimos membros cadastrados



Capa do livro
Livro - O Melhor do JavaScript


Capa do livro
Construindo Aplicações Node Com MongoDB e Backbone


Capa do livro
Microsoft Exchange Server 2010





Hostnet

IMD