AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 44851
Accepted
deceze
deceze
Asked: 2013-06-20 07:23:35 +0800 CST2013-06-20 07:23:35 +0800 CST 2013-06-20 07:23:35 +0800 CST

Usando PL/R para agrupar geometrias

  • 772

Eu tenho um banco de dados Postgres/PostGIS de geographypontos que estou tentando agrupar; o que significa que quero agrupá-los e contá-los por proximidade. Tive primeiro sucesso com a extensão kmeans Postgresql , mas o algoritmo não é ideal para o que eu preciso. Quero experimentar mais algoritmos e R parece ser a melhor escolha para isso. Eu configurei PL/R e posso chamar funções R do Postgres...

Mas e agora? Uma função R simples que retorna um escalar não é problema, mas não tenho certeza de como abordar a mesma solução kmeans em PL/R, mas implementando sozinha uma solução de algoritmo de agrupamento inteira. A extensão kmeans acima vinculada é muito acessível para mim, com uma consulta como:

    SELECT kmeans, count(*)
      FROM (
               SELECT kmeans(ARRAY[ST_X(geom), ST_Y(geom)], 5) OVER (), geom
                 FROM points
           ) AS ksub
  GROUP BY kmeans;

Como kmeans()só retorna um único int, isso é muito compreensível para mim. Mas não sei por onde começar com algumas das soluções de cluster R mais complexas . Seria melhor pós-processar todo o conjunto de resultados em R, como SELECT r_cluster((SELECT ...))? Posso usar uma WINDOWfunção, nesse caso o que eu retornaria do R e como?

Eu gostaria de ver um exemplo de código real de uma declaração e invocação de função PL/R para começar.

-- please fill in the blanks

CREATE OR REPLACE FUNCTION r_cluster()
RETURNS ? AS $$ ? $$ LANGUAGE plr;

SELECT r_cluster(?) OVER (?) FROM points;
postgresql window-functions
  • 1 1 respostas
  • 1296 Views

1 respostas

  • Voted
  1. Best Answer
    deceze
    2013-06-22T03:56:20+08:002013-06-22T03:56:20+08:00

    Depois de algumas experiências, cheguei a isso:

    -- x and y are not actually used, they just give the function its signature
    CREATE FUNCTION R_cluster_dbscan(x float8, y float8, eps float8)
    RETURNS int
    WINDOW
    STRICT
    VOLATILE
    LANGUAGE plr
    AS $$
        if (pg.state.firstpass == TRUE) {
            pg.state.firstpass <<- FALSE
            c <- fpc::dbscan(cbind(farg1, farg2), eps, MinPts = 2, method = "hybrid", seeds = FALSE)
            assign("cluster", c$cluster, env = .GlobalEnv)
        }
    
        return(cluster[prownum])
    $$
    

    Essa função de janela é chamada uma vez para cada linha e retorna o ID do cluster do registro, mas calcula o cluster apenas uma vez usando o algoritmo DBSCAN e o armazena em uma variável global. É usado como:

      SELECT c                             AS cluster_id,
             COUNT(*)                      AS place_count,
             ST_Centroid(ST_Collect(geom)) AS center
        FROM (
                 SELECT R_cluster_dbscan(ST_X(geom), ST_Y(geom), 1) OVER () AS c,
                        geom
                   FROM points
             ) AS sub
    GROUP BY c
    

    Et voilà, uma implementação de agrupamento DBSCAN usando PL/R. Não tenho certeza se esta é a implementação ideal, mas é uma implementação e, com sorte, algum código de amostra útil.

    • 1

relate perguntas

  • Posso ativar o PITR depois que o banco de dados foi usado

  • Práticas recomendadas para executar a replicação atrasada do deslocamento de tempo

  • Os procedimentos armazenados impedem a injeção de SQL?

  • Sequências Biológicas do UniProt no PostgreSQL

  • Qual é a diferença entre a replicação do PostgreSQL 9.0 e o Slony-I?

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Como fazer a saída do sqlplus aparecer em uma linha?

    • 3 respostas
  • Marko Smith

    Selecione qual tem data máxima ou data mais recente

    • 3 respostas
  • Marko Smith

    Como faço para listar todos os esquemas no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Conceder acesso a todas as tabelas para um usuário

    • 5 respostas
  • Marko Smith

    Listar todas as colunas de uma tabela especificada

    • 5 respostas
  • Marko Smith

    Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

    • 4 respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Martin Hope
    Stéphane Como faço para listar todos os esquemas no PostgreSQL? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh Por que o log de transações continua crescendo ou fica sem espaço? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland Listar todas as colunas de uma tabela especificada 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney O MySQL pode realizar consultas razoavelmente em bilhões de linhas? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx Como posso monitorar o andamento de uma importação de um arquivo .sql grande? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    pedrosanta Listar os privilégios do banco de dados usando o psql 2011-08-04 11:01:21 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve