Desenvolvimento - ASP. NET

Retirar Tag HTML dos campos utilizando expressão regular

Neste artigo o autor mostra como utilizar uma expressão regular para retirar tags HTML dos campos antes de ser gravado no banco de dados.

por Mauricio Junior



Olá pessoal, meu nome é Mauricio Junior e estou disposto a mostrar como utilizar uma expressão para retirar tags HTML dos campos antes de ser gravado no banco de dados. É simples e fácil, precisamos apenas entender como funciona e utilizarmos.

Recursos utilizados:

1 – Visual Studio.NET 2005;

2 – Linguagem C#.NET

3 – Expressão.

Antes de tudo para quem possui o MSDN instalado em sua máquina, segue o link abaixo para utilizar e ver os exemplos. (Referência 1.1)

Exemplos no MSDN

Referência: 1.1

Expressões regulares provêem um poderoso, flexível e eficiente método de processo de texto. A notação padrão adequado de expressões regulares permite que você analise rápido e gramaticalmente quantidades grandes de texto para encontrar testes padrões específicos do caráter; para extrair, editar, substituir, ou suprimir substrings do texto; ou para adicionar resultados extraídos a uma coleção a fim gerar um relatório. Para muitas aplicações que tratam das distribuições com strings (tais como o HTML que processa a linha de registro que analisa gramaticalmente, e o encabeçamento do HTTP que analisa gramaticalmente), as expressões regulares é uma ferramenta indispensável.

Na Prática

Na prática, é simples fazer este tipo de solução. Não tem problema deixar o usuário digitar tags HTMLs, porém antes de gravar os dados pode ser feito um tratamento para tirar todas os comandos indesejados. Por exemplo: tudo que estiver dentro de tag <html> ou <b> ou <input> serão retirados automaticamente ficando apenas o texto digitado fora da tag. Referência 1.2

<b>teste</b>

<h1>titulo qualquer</h1>

<h5>texto</h5>

Referência: 1.2

O resultado da referência 1.2 fica da assim. (Referência 1.3)

teste

titulo qualquer

texto

Referência: 1.3

O resultado da referência 1.3 mostra apenas o texto digitado sem qualquer configuração ou tag html. Note que todas as tags foram retiradas.

Expressão Utilizada

A expressão utilizada é tranqüila. (Referência 1.4)

String retornoSemTag =

System.Text.RegularExpressions.Regex.Replace(txtMensagem.Text,

"<[^>]*>", " ");

Referência: 1.4


Explicação:

Primeiro de tudo, criei uma variável do tipo String atribuindo o resultado da expressão, ponto Replace (passando o campo do formulário, a expressão, vazio). Esse vazio faz apenas a troca das tags por nada. Essa String retornoSemTag é a variável pronta para ser inserida no banco de dados sem qualquer problema.

Bom, fico por aqui com mais um artigo e espero que possa ter ajudado a você leitor. Qualquer dúvida, favor entrar em contato através do e-mail mauricio@aspneti.com.

Maurício Junior

www.aspneti.com

www.mauriciojunior.org

Mauricio Junior

Mauricio Junior - Formado pela Faculdade Anhanguera, Especialista pela FGV (Fundação Getúlio Vargas), Pós-Graduação em Docência Superior e cursando Mestrado na UNB Engenharia Elétrica; . Tenho 29 anos e possuo sete livros publicados pela editora Ciência Moderna e sou editor do Linha de Código.
Sou Certificado Microsoft MCP, MCAD e MVP, faço parte da comunidade ASPNETI.COM, onde publico artigos, vídeos, ebooks e livros Publico artigos, vídeos e podcast em outras comunidades. Trabalho como Analista de Sistemas / Desenvolvedor na empresa ATP S/A.
Blog:
blog.mauriciojunior.org
Site pessoal: www.mauriciojunior.org