2010/03/19

SQL语句SELECT TOP用法小结

    今天很是郁闷,因为我以下的这些文字是第二次打入,艾,断线,提交失败,数据清空 ,看来要改进我的后台系统了……
    前段时间,我编写了一套ASP+MSSQL的房产程序;今天有一位用户找到我说,她无法发布信息了,系统提示:重复信息,拒绝发布。我的反应就是很正常,因为这是我故意设置的,就是为了防止重复信息;但用户说她没看到重复信息,怎么系统也拒绝发布呢。而我也只是采用了简单的select top n的查询进行判断而已,并且这个n设置仅仅为30啊。
    近些时间来,我也发现一些细节问题。有不少用户有意无意地在标题里加上一些无意义的阿拉伯数字,我明白:这些用户也同样的遇到了重复信息拒绝发布的困扰了,这样做也是为了规避这样的限制。结合今天的这位向我反应问题的用户,我意识到:可能是我的程序判断有误了。
    马上本地localhost测试,果然,我发布了一条3个月前的标题相同的信息,系统也提示重复信息,拒绝发布;而这个3个月前的id数字距现在有2万多了的差距了,远远超出了我的select top 30的查询了。
    打开代码,数据库为mssql 2000:
dim rs,sql
Set rs = Server.CreateObject ("ADODB.Recordset")
sql="select top 30 * from data where title='"&title1&"' order by id desc"
rs.Open sql,conn,1,3
if rs.eof then
'入库操作
else
'重复,拒绝发布
end if
    上面的这段代码是有错误的。它和我的原意相反。sql语句里同时存在where和top语句的时候,并且where条件列不是合适的索引,程序执行的是全表扫描,首先是查找符合where条件的记录,而这里的top限制形同虚设。如果全表是百万级别以上的数据表,那么就这么一个简单的判断,就有可能拖垮数据库。
    我们可以采用变通的方法,就是去掉sql查询里的where条件,放入到循环体内做判断;比如采用piaoyi以下这样的代码:
dim rs,sql,cf
cf=0 '初始化重复标识为0
Set rs = Server.CreateObject ("ADODB.Recordset")
sql="select top 30 * from data order by id desc"
rs.Open sql,conn,1,3
do while not rs.eof
if rs("title")=title1 and datediff("h",rs("time"),now())<24 then
'标题相同,且在24小时内发帖
cf=1 ''重复标识为1
exit do
end if
rs.movenext
loop
if cf=0 then
'入库操作
elseif cf=1 then
'拒绝发布重复信息
end if
    如果你希望使用selcet top语句,并且还要附带where条件,那么条件中的列就得是合适的索引,如聚集索引、复合索引里的主列等,同时,where条件里也要尽量避开使用函数,or,判断NULL等会引起全部扫描的语句。这一点要记住,不然执行的是全表扫描。
    另外,也有人问道,如何选出第N条到第2N条记录呢。这样的sql语句就可以了:
select top n * from TABLE_NAME where id not in (select top n id from TABLE_NAME order by id desc) order by id desc
    一个小的细节问题,如果不注意的话,有可能拖累整个程序的稳定性、健壮性;当数据量不大的时候,这种影响可能感觉不出来,而当数据量达到一定的程度的时候,比如有100人同时进行插入数据的操作时,系统很有可能假死,iis崩溃掉。而这,不是我希望看到的。 

作者:Flymorn
来源:
飘易博客
版权所有。转载时必须以链接形式注明作者和
原始出处及本声明。

没有评论: