Expressões regulares para trabalhar com HTML


Autor/fonte: Jonnas Fonini
E-mail/Url: http://www.fonini.net/regex/10-expressoes-regulares-para-trabalhar-com...
Tags: [ expressões regulares ]



Digg del.icio.us

Reuni algumas expressões regulares úteis para trabalhar com HTML.

Encontra comentários HTML

<!--[\s\S]*?--[ \t\n\r]*>


Captura o atributo href de links

href[\s]*=[\s]*"[^\n"]*"


Encontra todos os atributos de uma tag. Ex: src, name, value.

(?:[\w]*) *= *"(?:(?:(?:(?:(?:\\\W)*\\\W)*[^"]*)\\\W)*[^"]*")
Testar


Encontra tags < h1 > até < h6 >

<h([1-6])>([^<]*)</h([1-6])>


Encontra tags <a> válidas

^<a[^>]*([^"]*)[^>]*>([ 0-9a-zA-Z]+)</a>$


Encontra todas as URL's de um texto

(http://|https://)([a-zA-Z0-9]+\.[a-zA-Z0-9\-]+|[a-zA-Z0-9\-]+)\.[a-zA-Z\.]{2,6}(/[a-zA-Z0-9\.\?=/#%&\+-]+|/|)


Encontra todas as imagens

<[iI][mM][gG][a-zA-Z0-9\s=".]*((src)=\s*(?:"([^"]*)"|'[^']*'))[a-zA-Z0-9\s=".]*/*>(?:</[iI][mM][gG]>)*


Encontra tudo que está entre as tags especificadas. Mais tags podem ser adicionadas

<(script|style)[^>]*?>(?:.|\n)*?</\s*\1\s*>


Útil para remover tags HTML

<[^>]*>


Encontra extensões de arquivos

\.([A-Za-z0-9]{2,5}($|\b\?))



Sobre o autor(a): Jonnas Fonini
fonini
Avatar



Enviado por jfonini em 15/02/2010 às 09:54


Itens relacionados

Aprenda expressões regulares!

Avaliação

Esta publicação ainda não foi avaliada!


Avaliar:


A avaliação de publicações é restrita a membros cadastrados e logados no nosso site.



Comentários

Este artigo ainda não foi comentado ou o(s) comentário(s) que foi(ram) enviado(s) a ele ainda não foi(ram) publicado(s).


Envio de comentário:




  

Quarta, 17 de Setembro de 2014




Top 5 membros

Últimos membros online

Últimos membros cadastrados



Capa do livro
Manual de Marketing em Mídias Sociais


Capa do livro
Guia para Projetar Ux


Capa do livro
Gramática Inglesa para Leigos





Hostnet

IMD