我有两个存储表:
- IP 范围 - 国家/地区查找表
- 来自不同 IP 的请求列表
IP 存储为bigint
s 以提高查找性能。
这是表结构:
create table [dbo].[ip2country](
[begin_ip] [varchar](15) NOT NULL,
[end_ip] [varchar](15) NOT NULL,
[begin_num] [bigint] NOT NULL,
[end_num] [bigint] NOT NULL,
[IDCountry] [int] NULL,
constraint [PK_ip2country] PRIMARY KEY CLUSTERED
(
[begin_num] ASC,
[end_num] ASC
)
)
create table Request(
Id int identity primary key,
[Date] datetime,
IP bigint,
CategoryId int
)
我想获取每个国家/地区的请求细分,因此我执行以下查询:
select
ic.IDCountry,
count(r.Id) as CountryCount
from Request r
left join ip2country ic
on r.IP between ic.begin_num and ic.end_num
where r.CategoryId = 1
group by ic.IDCountry
我在表中有很多记录:大约 200,000 inIP2Country
和几百万 in Request
,因此查询需要一段时间。
查看执行计划,最昂贵的部分是索引 PK_IP2Country 上的 Clustered Index Seek,执行多次(Request 中的行数)。
另外,我觉得有点奇怪的是left join ip2country ic on r.IP between ic.begin_num and ic.end_num
零件(不知道是否有更好的方法来执行查找)。
SQLFiddle 中提供了表结构、一些示例数据和查询:http ://www.sqlfiddle.com/#!3/a463e/3 (不幸的是,我认为我不能插入很多记录来重现问题,但这希望给出一个想法)。
我(显然)不是 SQL 性能/优化方面的专家,所以我的问题是:是否有任何明显的方法可以改进我所缺少的这种结构/查询的性能?