AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 342969
Accepted
Niccolò Caselli
Niccolò Caselli
Asked: 2024-10-12 20:16:22 +0800 CST2024-10-12 20:16:22 +0800 CST 2024-10-12 20:16:22 +0800 CST

MongoDB - Encontrando o grau de separação de dois usuários

  • 772

Conforme sugerido neste post, proponho aqui minha pergunta.

Tenho um MongoDB collections spots que tem documentos que representam a amizade entre dois usuários

{
  "_id":  "64a337de4538a04610900f0c",
  "user1": "6468022102781d442b82afd7",
  "user2": "648c7b6b75231cd99e43d7ab",
  "areFriends": true
}

Meu objetivo é escrever uma agregação que, dados dois IDs de usuários, retorne o grau de separação deles. Para ser claro, algo assim:

  • 1 = amigos diretos
  • 2 = amigos de amigos
  • 3+ etc..

Me deparei com o exemplo acima de $graphLookup e agora estou pensando em como implementar algo semelhante.

A diferença entre meu caso e o outro post é que meus documentos não têm uma relação unidirecional (de-para), mas bidirecional (usuário1, usuário2); portanto, não há garantia de que o usuário desejado seja armazenado como usuário1 ou usuário2.

Em outras seções do meu código, resolvo esse problema ordenando os IDs de entrada ou usando condições como esta:

  $cond: {
              if: { $eq: ['$user1', userId] },
              then: '$user2',
              else: '$user1',
          },

No entanto, entendi que as condições não são suportadas conforme arquivadas (como connectFromField ) em $graphLookup

Alguém tem alguma pista sobre como enfrentar esse problema em particular? Ficaria muito agradecido. Obrigado.

EDIT esta é uma versão revisada do pipeline de agregação proposto por Ray

      { $match: { user1: id1 } },
      {
        $graphLookup: {
          from: 'spots',
          startWith: '$user1',
          connectFromField: 'user2',
          connectToField: 'user1',
          as: 'friendshipsViewLookup',
          depthField: 'degree',
          maxDepth: 2,
        },
      },
      {
        $unwind: {
          path: '$friendshipsViewLookup',
          preserveNullAndEmptyArrays: true,
        },
      },
      { $match: { 'friendshipsViewLookup.user2': id2 } },
      {
        $project: {
          user1: 1,
          user2: '$friendshipsViewLookup.user2',
          degree: {
            $add: ['$friendshipsViewLookup.degree', 1],
          },
        },
      },
      {
        $group: {
          _id: { user1: '$user1', user2: '$user2' },
          minDegree: { $min: '$degree' },
        },
      },
      {
        $project: {
          user1: '$_id.user1',
          user2: '$_id.user2',
          degree: '$minDegree',
        },
      }
mongodb
  • 1 1 respostas
  • 46 Views

1 respostas

  • Voted
  1. Best Answer
    ray
    2024-10-13T09:12:54+08:002024-10-13T09:12:54+08:00

    Você pode criar uma visualização ad-hoc para facilitar sua pesquisa. Ao criar a visualização friendshipsView, você pode limitar o escopo da pesquisa (e, assim, melhorar o desempenho da pesquisa) definindo filtros como "areFriends": true. O ponto mais importante para criar a visualização é que também "classificamos" o campo user1and user2. Usamos $minand $maxpara garantir user1que seja sempre o menor que user2. Dessa forma, você pode executar o $graphLookupnormalmente.

    db.createView("friendshipsView", "friendships", [
      {
        "$match": {
          "areFriends": true
        }
      },
      {
        "$set": {
          "user1": {
            "$min": [
              "$user1",
              "$user2"
            ]
          },
          "user2": {
            "$max": [
              "$user1",
              "$user2"
            ]
          }
        }
      }
    ])
    

    Mongo Playground para demonstrar a criação da vista

    Depois que a visualização for criada, você só precisa executar um comando $graphLookupcomo a resposta do SO que você forneceu.

    db.friendshipsView.aggregate([
      {
        "$match": {
          "user1": "A"
        }
      },
      {
        "$graphLookup": {
          "from": "friendshipsView",
          "startWith": "$user1",
          "connectFromField": "user2",
          "connectToField": "user1",
          "as": "friendshipsViewLookup",
          "depthField": "degree"
        }
      },
      {
        "$unwind": "$friendshipsViewLookup"
      },
      {
        "$match": {
          "friendshipsViewLookup.user2": "C"
        }
      },
      {
        "$project": {
          user1: 1,
          user2: "$friendshipsViewLookup.user2",
          degree: {
            "$add": [
              "$friendshipsViewLookup.degree",
              1
            ]
          }
        }
      }
    ])
    

    Mongo Playground para demonstrar a consulta da visualização


    Nota: Como estamos especificando os 2 usuários de entrada para pesquisa ao criar a visualização, se um novo par de usuários for inserido, precisaremos atualizar/recriar a visualização. Você pode considerar uma "classificação" única e definitiva para a coleção usando uma atualização com um pipeline de agregação como este . Dessa forma, você não precisa criar uma nova visualização toda vez.


    EDIT: Mesmo que a coleção seja indexada, isso pode não beneficiar esse pipeline de agregação, pois estamos realizando a agregação na visualização, que é computada ad-hoc. Você pode considerar usar a visualização materializada sob demanda , que na verdade armazena nossa visualização computada no banco de dados. A etapa é semelhante a como criamos a visualização. Apenas adicionamos um $out/ $mergeno final do pipeline de agregação.

    1. Dependendo do seu uso, você pode querer remover qualquer friendshipsViewcoleção existente.
    db.friendshipsView.drop()
    
    1. crie a visualização materializada com$out
    db.friendships.aggregate([
      {
        "$match": {
          "areFriends": true
        }
      },
      {
        "$set": {
          "user1": {
            "$min": [
              "$user1",
              "$user2"
            ]
          },
          "user2": {
            "$max": [
              "$user1",
              "$user2"
            ]
          }
        }
      },
      {
        "$out": {
          "coll": "friendshipsView"
        }
      }
    ])
    

    Parque infantil Mongo

    1. indexar a visualização
    db.friendshipsView.createIndex( {user1: 1, user2: 1 } )
    

    Agora, sua visualização está pronta para a consulta.

    Com sua consulta revisada, você pode ver que ela está sendo usada IXSCANna exibição indexada.

    explainsaída parcial :

    ...
              "winningPlan": {
                "inputStage": {
                  "inputStage": {
                    "direction": "forward",
                    "indexBounds": {
                      "user1": [
                        "[\"A\", \"A\"]"
                      ],
                      "user2": [
                        "[MinKey, MaxKey]"
                      ]
                    },
                    "indexName": "ix",
                    "indexVersion": 2,
                    "isMultiKey": false,
                    "isPartial": false,
                    "isSparse": false,
                    "isUnique": false,
                    "keyPattern": {
                      "user1": 1,
                      "user2": 1
                    },
                    "multiKeyPaths": {
                      "user1": [],
                      "user2": []
                    },
                    "stage": "IXSCAN"
                  },
                  "stage": "FETCH"
                },
                "stage": "PROJECTION_DEFAULT",
                "transformBy": {
                  "_id": 1,
                  "friendshipsViewLookup.degree": 1,
                  "friendshipsViewLookup.user2": 1,
                  "user1": 1
                }
              }
    ...
    

    Parque infantil Mongo

    • 1

relate perguntas

  • Mongo Map-Reduce ou Sharding?

  • Configurando o Mongo com clustering

  • Diferença entre as chamadas find e findone do MongoDB

  • A fragmentação é eficaz para coleções pequenas?

  • Bons recursos para operar/administrar o MongoDB

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

    • 12 respostas
  • Marko Smith

    Como fazer a saída do sqlplus aparecer em uma linha?

    • 3 respostas
  • Marko Smith

    Selecione qual tem data máxima ou data mais recente

    • 3 respostas
  • Marko Smith

    Como faço para listar todos os esquemas no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Listar todas as colunas de uma tabela especificada

    • 5 respostas
  • Marko Smith

    Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

    • 4 respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Martin Hope
    Jin conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane Como faço para listar todos os esquemas no PostgreSQL? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh Por que o log de transações continua crescendo ou fica sem espaço? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland Listar todas as colunas de uma tabela especificada 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney O MySQL pode realizar consultas razoavelmente em bilhões de linhas? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx Como posso monitorar o andamento de uma importação de um arquivo .sql grande? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve