例如有个产品表(Products),它的字段包:括产品ID、产品名称、产品类别、产品品牌、产品简介、产品详细介绍。
字段 | 类型 |
ProdID | int |
ProdName | nvarchar |
CategoryName | nvarchar |
ProdBrand | nvarchar |
ProdIntro | nvarchar |
ProdDescription | nvarchar |
现在我们要求通过某个关键字从Products表中搜索包含该关键字的记录,凡是以下任何一个字段包含该关键字的记录都列出来:ProdName, CategoryName , ProdBrand, ProdIntro, ProdDescription。 并且搜索结果按照前述字段的匹配优先级进行排序:
1)先列出字段ProdName匹配关键字的记录,然后列出字段CategoryName匹配关键字的记录,依此类推,最后列出字段ProdDescription匹配关键字的记录;
2)在字段ProdName匹配关键字的所有记录中,先列出字段CategoryName也匹配关键字的记录,然后列出字段ProdBrand也匹配关键字的记录,依次类推…
3)按照规则2递归排序每个记录分组……
搜索匹配该关键字的所有记录的SQL语句倒很简单:
SELECT * from Products WHERE ProdName like ‘%KeyWord%' or CategoryName like ‘%KeyWord%' or ProdBrand like ‘%KeyWord%' or ProdIntro like ‘%KeyWord%' or ProdDescription like ‘%KeyWord%'
但对搜索出的结果进行匹配优先级排序稍微有点困难。在用简单的SQL进行搜索时有两种方式来达到这个排序的目的:加权法和多字段排序法(我瞎取的名字^-^)。
一、加权法
对搜索的每条记录计算出一个排序权值来,然后将所有搜索结果按照这个排序权值进行降序排列即可。每条被搜索出的记录的排序权值为该记录所有字段的权值之和。某个字段的权值取决于该字段是否匹配关键字,如果不匹配则为0,如果匹配则为改字段的匹配权值。字段的匹配权值计算方式为:
fieldPriority = 2的i次冥(i为该字段在所有被搜索的字段优先级排序中倒排的位置)
例如,在我们示例中各字段的匹配权值为:
字段 | 倒排位置 | 匹配权值 |
ProdName | 4 | 16 |
CategoryName | 3 | 8 |
ProdBrand | 2 | 4 |
ProdIntro | 1 | 2 |
ProdDescription | 0 | 1 |
之所以采用这种算法,是为了确保某个字段匹配的记录的排序权值不会低于另外一条不匹配该字段但后续字段都匹配的记录的排序权值。例如记录A中仅仅ProdName匹配关键字,所以它的排序权值为16,而记录B中除了字段ProdName外其他字段都匹配,则其排序权值为15(8+4+2+1=15)。但记录A仍然会排在记录B前面。
相应的SQL大致如下:
SELECT *, (
(case when charIndex(ProdName,KeyWord)>-1 then 16 else 0 end) +
(case when charIndex(CategoryName,KeyWord)>-1 then 8 else 0 end) +
(case when charIndex(ProdBrand,KeyWord)>-1 then 4 else 0 end) +
(case when charIndex(ProdIntro,KeyWord)>-1 then 2 else 0 end) +
(case when charIndex(ProdDescription,KeyWord)>-1 then 1 else 0 end)
) as OrderPriority
from Products
WHERE ProdName like ‘%KeyWord%' or
CategoryName like ‘%KeyWord%' or
ProdBrand like ‘%KeyWord%' or
ProdIntro like ‘%KeyWord%' or
ProdDescription like ‘%KeyWord%'
Order by OrderPriority desc
下一篇 Access命令行参数