AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 4210
Accepted
user4951
user4951
Asked: 2011-08-01 06:59:03 +0800 CST2011-08-01 06:59:03 +0800 CST 2011-08-01 06:59:03 +0800 CST

Yelp 如何有效地计算数据库中的距离?

  • 772

例如,假设我有一张桌子:

Business(BusinessID, Lattitude, Longitude)

当然,所有内容都已编入索引。还有100万条记录

假设我想找到最接近 106,5 的商家,例如,我该怎么做?

如果我做

SELECT *
FROM Business
WHERE (Some formula to compute distance here) < 2000

例如,或者如果我这样做

SELECT *
FROM Business
TOP 20

理论上,计算机必须计算所有商务的距离,而实际上只有那些在一定范围内的纬度和经度才需要计算。

那么我怎样才能在 PhP 或 SQL 中做我想做的事情呢?

到目前为止,我很感激答案。我正在使用 mysql,他们没有比明显的解决方案更有效的方法。MySQL 空间也没有计算距离功能。

optimization mysql-5.5
  • 3 3 个回答
  • 4117 Views

3 个回答

  • Voted
  1. Best Answer
    Jack Douglas
    2011-08-01T23:05:30+08:002011-08-01T23:05:30+08:00

    如果我正确理解了这个问题(我不确定我是否理解),您是否担心"(Some formula to compute distance here)"每次执行查询时都会计算表中的每一行?

    这可以通过使用索引在一定程度上缓解,latitude因此longitude我们只需要计算包含我们实际想要的圆的“盒子”点的距离:

    select * from business
    where (latitude>96 and latitude<116) and 
          (longitude>-5 and longitude<15) and 
          (Some formula to compute distance here) < 2000
    

    选择 96、116 等以匹配值“2000”的单位和地球上您计算距离的点。

    这使用索引的精确程度将取决于您的 RDBMS 及其规划者所做的选择。

    一般而言,这是优化一种最近邻搜索的原始方式。如果您的 RDBMS 支持GiST 索引,例如postgres ,那么您应该考虑使用它们。

    • 8
  2. Brent Ozar
    2011-08-02T03:54:21+08:002011-08-02T03:54:21+08:00

    (披露:我是 Microsoft SQL Server 的人,所以我的答案受此影响。)

    要真正有效地做到这一点,您需要两件事:缓存和本机空间数据支持。 空间数据支持使您可以将地理和几何数据直接存储在数据库中,而无需即时进行密集/昂贵的计算,并允许您构建索引以非常快速地找到离您当前位置最近的点(或最有效的路线或其他任何东西)。

    如果您想扩展,缓存很重要。最快的查询是您从未做过的查询。每当用户询问离他最近的东西时,您会将他的位置和结果集存储在 Redis 或 memcached 等缓存中几个小时。营业地点不会在 4 小时内发生变化 - 好吧,如果有人编辑了一家公司,它们可能会发生变化,但您不一定需要在所有结果集中立即更新。

    • 6
  3. Evan Carroll
    2018-06-22T21:24:07+08:002018-06-22T21:24:07+08:00

    Yelp 可能使用 GIS

    PostgreSQL 具有使用PostGIS的 GIS 参考实现。Yelp 可能正在使用在各方面都较差的 MySQL。对于像 Yelp 这样的东西,他们几乎肯定会保留坐标,

    • 用户
    • 潜在目的地

    这些坐标几乎肯定在 WGS84 中,并存储为地理类型。在 PostgreSQL 和 PostGIS 中,它看起来像这样,

    CREATE TABLE businesses (
      id   int               GENERATED BY DEFAULT AS IDENTITY PRIMARY KEY,
      name text,
      geog geography(point)
    );
    CREATE INDEX ON businesses USING gist(geog);
    .... fill table
    ANALYZE businesses;
    

    他们会填满那张桌子。然后他们从您的手机中获取 WGS84 坐标并生成查询,就像使用 SQL Alchemy(以 Yelp 为例)一样,

    SELECT *
    FROM businesses AS b
    WHERE ST_DWithin( b.geog, ST_MakePoint(userLong,userLat) );
    

    有关更多信息,请参阅我们的空间,并查看地理信息系统@StackExchange

    • 0

相关问题

  • MySQL 事件不运行

  • 查询优化

  • 我应该如何优化此表的存储?

  • oracle 中的 DBMS_REDEFINITION 与 EXCHANGE PARTITION

  • 将 EXPLAIN 成本转换为(挂钟)运行时是否有好的“经验法则”?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    您如何显示在 Oracle 数据库上执行的 SQL?

    • 2 个回答
  • Marko Smith

    如何选择每组的第一行?

    • 6 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    我可以查看在 SQL Server 数据库上运行的历史查询吗?

    • 6 个回答
  • Marko Smith

    如何在 PostgreSQL 中使用 currval() 来获取最后插入的 id?

    • 10 个回答
  • Marko Smith

    如何在 Mac OS X 上运行 psql?

    • 11 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Marko Smith

    将数组参数传递给存储过程

    • 12 个回答
  • Martin Hope
    Manuel Leduc PostgreSQL 多列唯一约束和 NULL 值 2011-12-28 01:10:21 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Stuart Blackler 什么时候应该将主键声明为非聚集的? 2011-11-11 13:31:59 +0800 CST
  • Martin Hope
    pedrosanta 使用 psql 列出数据库权限 2011-08-04 11:01:21 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST
  • Martin Hope
    BrunoLM Guid vs INT - 哪个更好作为主键? 2011-01-05 23:46:34 +0800 CST
  • Martin Hope
    bernd_k 什么时候应该使用唯一约束而不是唯一索引? 2011-01-05 02:32:27 +0800 CST
  • Martin Hope
    Patrick 如何优化大型数据库的 mysqldump? 2011-01-04 13:13:48 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve