问题描述
在web中呈现文本信息时,有时需要对一些特定的字词进行高亮显示。比较常见的场景是关键词搜索。如下图所示(百度搜索Neo4j in action时展现的web页面):
可见,文本中所有出现Neo4j in action的地方都用红色进行了高亮。查看网页源码可以发现Neo4j in action几个词的前后都打上了标签,词前面为<em>词后为</em>。
本文不去深究该标签的含义,而是去探讨如何方便给字符串中特定的子串前后打上如上的标签。
解决方法
若要进行高亮,首先要找到需要高亮子串的位置。这个可以容易的通过JAVA正则表达式实现。其可以得到每个需要高亮的子串在文本中的起始(需要加入<em>)和终止(需要加入</em>)位置。这里不做赘述。
再获得了每个需要加入<em>和</em>的位置后,可以将这些位置从小到大排列成一个List。这个List有两个特点:
- List的大小一定是偶数,因为开始位置和结束位置总是成对出现
- List的下标为偶数(下标从0开始)时为开始位置,List的下标为奇数时为结束位置
小问题
由于我们需要向原有字符串中插入标签,如果我们从List的第一个位置开始插入标签,则后续的下标需要进行平移调整。举例说明:
字符串:abcad
高亮的子串: a
List:0,1,3,4
若首先在0的位置插入<em>,则字符串变为<em>abcad,下一个插入</em>的位置应该为1+"<em>".length=1+4=5
虽然进行恰当的平移可以解决问题,但无疑增加了程序的复杂度。
小技巧
一个更聪明的做法是从List的尾部开始加入标签,因为从尾部插入标签后,并不会影响到其它标签插入的下标。示例代码如下
String text = "abcad";
String keyword = "a";
Matcher matcher = Pattern.compile(keyword).matcher(text);
List<Integer> list = new ArrayList<>();
while (matcher.find()) {
list.add(matcher.start());
list.add(matcher.end());
}
StringBuilder sb = new StringBuilder(text);
for (int i = list.size() - 1; i >= 0; i--) {
if (i % 2 == 0) {
sb.insert(list.get(i), "<em>");
} else {
sb.insert(list.get(i), "</em>");
}
}
return sb.toString();