常用正则

过滤html

string regEx_style = "<style[^>]*?>[\\s\\S]*?<\\/style>"; //定义style的正则表达式    string regEx_script = "<script[^>]*?>[\\s\\S]*?<\\/script>"; //定义script的正则表达式      string regEx_html = "<[^>]+>"; //定义HTML标签的正则表达式      htmlStr = Regex.Replace(htmlStr, regEx_style, "");//删除css    htmlStr = Regex.Replace(htmlStr, regEx_script, "");//删除js    htmlStr = Regex.Replace(htmlStr, regEx_html, "");//删除html标记    htmlStr = Regex.Replace(htmlStr, "\\s*|\t|\r|\n", "");//去除tab、空格、空行    htmlStr = htmlStr.Replace(" ", "");    htmlStr = htmlStr.Replace(""", "");//去除异常的引号" " "    htmlStr = htmlStr.Replace(""", "");    return htmlStr.Trim();

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容