PHP正则表达式过滤所有标点符号

参考链接:
http://blog.coinidea.com/web%E5%BC%80%E5%8F%91/php-1196.html

// Filter 英文标点符号
$word = preg_replace("/[[:punct:]]/i"," ",$word);
 
// Filter 中文标点符号
mb_regex_encoding('utf-8');
$char = "。、!?:;﹑•"…‘’“”〝〞∕¦‖— 〈〉﹞﹝「」‹›〖〗】【»«』『〕〔》《﹐¸﹕︰﹔!¡?¿﹖﹌﹏﹋'´ˊˋ―﹫︳︴¯_ ̄﹢﹦﹤‐­˜﹟﹩﹠﹪﹡﹨﹍﹉﹎﹊ˇ︵︶︷︸︹︿﹀︺︽︾ˉ﹁﹂﹃﹄︻︼()";
$word = mb_ereg_replace("[".$char."]"," ",$word,"UTF-8");
 
// Filter 连续空格
$word = preg_replace("/\s+/"," ",$word);

mb_ereg_replace用于中文字符替换,正则的时候不需要加/ /。

参考链接:
http://blog.coinidea.com/web%E5%BC%80%E5%8F%91/php-1196.html

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容