今天很是郁闷,因为我以下的这些文字是第二次打入,艾,断线,提交失败,数据清空 ,看来要改进我的后台系统了……
前段时间,我编写了一套ASP+MSSQL的房产程序;今天有一位用户找到我说,她无法发布信息了,系统提示:重复信息,拒绝发布。我的反应就是很正常,因为这是我故意设置的,就是为了防止重复信息;但用户说她没看到重复信息,怎么系统也拒绝发布呢。而我也只是采用了简单的select top n的查询进行判断而已,并且这个n设置仅仅为30啊。
近些时间来,我也发现一些细节问题。有不少用户有意无意地在标题里加上一些无意义的阿拉伯数字,我明白:这些用户也同样的遇到了重复信息拒绝发布的困扰了,这样做也是为了规避这样的限制。结合今天的这位向我反应问题的用户,我意识到:可能是我的程序判断有误了。
马上本地localhost测试,果然,我发布了一条3个月前的标题相同的信息,系统也提示重复信息,拒绝发布;而这个3个月前的id数字距现在有2万多了的差距了,远远超出了我的select top 30的查询了。
打开代码,数据库为mssql 2000:
dim rs,sqlSet rs = Server.CreateObject ("ADODB.Recordset")sql="select top 30 * from data where title='"&title1&"' order by id desc"rs.Open sql,conn,1,3if rs.eof then'入库操作else'重复,拒绝发布end if
上面的这段代码是有错误的。它和我的原意相反。sql语句里同时存在where和top语句的时候,并且where条件列不是合适的索引,程序执行的是全表扫描,首先是查找符合where条件的记录,而这里的top限制形同虚设。如果全表是百万级别以上的数据表,那么就这么一个简单的判断,就有可能拖垮数据库。
我们可以采用变通的方法,就是去掉sql查询里的where条件,放入到循环体内做判断;比如采用piaoyi以下这样的代码:
dim rs,sql,cfcf=0 '初始化重复标识为0Set rs = Server.CreateObject ("ADODB.Recordset")sql="select top 30 * from data order by id desc"rs.Open sql,conn,1,3do while not rs.eofif rs("title")=title1 and datediff("h",rs("time"),now())<24 then'标题相同,且在24小时内发帖cf=1 ''重复标识为1exit doend ifrs.movenextloopif cf=0 then'入库操作elseif cf=1 then'拒绝发布重复信息end if
如果你希望使用selcet top语句,并且还要附带where条件,那么条件中的列就得是合适的索引,如聚集索引、复合索引里的主列等,同时,where条件里也要尽量避开使用函数,or,判断NULL等会引起全部扫描的语句。这一点要记住,不然执行的是全表扫描。
另外,也有人问道,如何选出第N条到第2N条记录呢。这样的sql语句就可以了:
select top n * from TABLE_NAME where id not in (select top n id from TABLE_NAME order by id desc) order by id desc
一个小的细节问题,如果不注意的话,有可能拖累整个程序的稳定性、健壮性;当数据量不大的时候,这种影响可能感觉不出来,而当数据量达到一定的程度的时候,比如有100人同时进行插入数据的操作时,系统很有可能假死,iis崩溃掉。而这,不是我希望看到的。
没有评论:
发表评论