近来由于系统需要个性化的排序搜索结果,所以研究了一下solr的排序,发现solr支持在排序中使用函数对字段进行处理,以前由于没有关注导致错过了这么好的功能,其实solr早起就支持一些函数的功能,后来增加了越来越多的函数,详情参见这里
sunspot中支持排序中使用函数是到2013年底才开始支持的,当然在这之前可以使用自定义参数的形式来查询,不过有这个sunspot的支持就更方便了
说了半天其实就是使用sunspot的order_by_function函数来排序
这个函数的第一个参数是函数名称,最后一个参数是排序方式,中间是solr函数使用的参数,order_by_funtion还支持函数的嵌套
#上代码,以下排序是将时间在 2014-4-1~2014-4-30中间的数据排到前面
#其他时间的排到这个时间段的后面,即便时间是 2015年也和2012年一样排到后面
Post.search do
order_by_function(:map,:price_date,'2014-4-1'.to_time.to_i*1000,'2014-4-30'.to_time.to_i*1000,1,0,:desc)
end
Solr中的可用函数
函数 说明 举例
abs(x) 返回绝对值 abs(-5)
“constant” 指定一个浮点数 1.5
def(“field”,value) 默认值,当指定字段不存在时,返回默认值 def(rationg,5)
div(x,y) 除法,x除以y div(1,5)
dist 计算两点之间的距离 dis(2,x,y,0,0)
docfreq(field,val) 返回某值在某字段出现的次数 docfreq(title,’solr’)
field(“field”) 返回该field的索引数量 field(‘title’)
hsin 曲面圆弧上两点之间的距离 hsin(2,true,x,y,0,0)
idf Inverse document frequency 倒排文档频率 idf(“field”,’solr’)
if if(test,value1,value2) if(termfreq(title,’solr’),popularity,42)
linear(x,m,c) 就是mx+c,等同于sum(product(m,x),c) linear(1,2,4)=1x2+4=6
log(x) 以10为底,x的对数 log(sum(x,100))
map(x,min,max,target) 如果x在min和max之间,x=target,否则x=x map(x,0,0,1)
max(x,y,…) 返回最大值 max(2,3,0)
maxdoc 返回索引的个数,查看有多少文档,包括被标记为删除状态的文档 maxdoc()
min(x,y,…) 返回最小值 min(2,4,0)
ms 返回两个参数间毫秒级的差别 ms(datefield1,2000-01-01T00:00:00Z)
norm(field) 返回该字段索引值的范数 norm(title)
numdocs 返回索引的个数,查看有多少文档,不包括被标记为删除状态的文档 numdocs()
ord 根据顺序索引发货结果 ord(title)
pow(x,y) 返回x的y次方 pow(x,log(y))
product(x,y) 返回多个值得乘积 product(x,2)
query 返回给定的子查询的得分,或者文档不匹配的默认值值 query(subquery,default)
recip(x,m,a,b) 相当于a/(mx+b),a,m,b是常量,x是变量 recip(myfield,m,a,b)
rord 按ord的结果反序返回
scale 返回一个在最大值和最小值之间的值 scale(x,1,3)
sqedist 平方欧氏距离计算 sqedist(x_td,y_td,0,0)
sqrt 返回指定值得平方根 sqrt(x)sqrt(100)
strdist 计算两个字符串之间的距离 strdist(“SOLR”,id,edit)
sub 返回x-y sub(field1,field2)
sum(x,y) 返回指定值的和 sum(x,y,…)
sumtotaltermfreq 返回所有totaltermfreq的和
termfreq 词出现的次数 termfreq(title,’sorl’)
tf 词频 tf(text,’solr’)
top 功能类似于ord
totaltermfreq 返回这个词在该字段出现的次数 ttf(title,’memory’)
and 返回true值当且仅当它的所有操作为true and(not(exists(popularity)),exists(price))
or 返回true值当有一个操作为true or(value1,value2)
xor 返回false值如果所有操作都为真 xor(field1,field2)
not 排除操作 not(exists(title))
exists 如果字段存在返回真 exists(title)
gt,gte,lt,lte,eq 比较函数 2 gt 1