AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / server / Perguntas / 1063719
Accepted
Holly
Holly
Asked: 2021-05-17 03:53:23 +0800 CST2021-05-17 03:53:23 +0800 CST 2021-05-17 03:53:23 +0800 CST

Quando usar um novo índice no Graylog (Elasticsearch)?

  • 772

Estou procurando há dias para encontrar uma boa explicação sobre como os índices são usados ​​pelo Graylog/Elasticsearch e quando criar um novo. Há muitas informações sobre índices de fragmentação, mas não muito sobre os próprios índices, além de serem um conjunto de configurações de quantos dados reter e como gerenciá-los, mas não por quê. (Ou é o que me parece)

Fundo:

Estamos usando Graylog 4.0 com Elasticsearch 7.10 e MongoDB 3.

Tentamos centralizar os logs de 6 locais de armazenamento (todos a algumas centenas de quilômetros de distância um do outro). Cada um tem 6 a 20 portas RFID, cada uma com um log. Cada porta tem seu middleware de conector ligado a um middleware de controlador central e todos eles possuem logs. Em seguida, há o controlador do armazém automatizado 'AWMS', servidor WMS, servidor ERP e seus frontends. Também consideramos coletar pelo menos alguns dos eventos do Windows Eventlog dos servidores em que esses serviços são executados.

Normalmente, precisamos analisar um problema em um subsistema, portanto, precisamos pesquisar um desses logs. Ocasionalmente, precisamos olhar para todo o fluxo do portão RFID para AWMS, WMS e ERP.

No momento, considero ter um fluxo para cada um desses logs e usar os fluxos relevantes na pesquisa. (ou essa abordagem já é falha, se sim, por quê?)

Perguntas:

  1. Um índice definido no Graylog é apenas as configurações sobre a estratégia de retenção?
  2. Que impacto tem se eu tiver muitos ou poucos índices?
    • no Elasticsearch Index Model , parece que os tamanhos dos fragmentos e sua distribuição têm o principal impacto no desempenho da pesquisa, e os índices são apenas uma estrutura para gerenciar os fragmentos
  3. Quantos conjuntos de índices devo ter para meu caso de uso?
    • Múltiplos por stream?
    • Um por stream?
    • Um por local?
    • Um por subsistema?
    • Um por tempo de retenção ou intervalo de tamanho?
    • Um global?
    • Isso importa do ponto de vista do desempenho?
  4. Onde posso encontrar mais informações sobre essas coisas, que expliquem o 'Porquê', não apenas o 'Como' para gerenciar índices? (Eu estive olhando para o modelo de índice Graylog , modelo de índice Elasticsearch , modelos de índice Elasticsearch )
indexes elasticsearch graylog
  • 1 1 respostas
  • 1221 Views

1 respostas

  • Voted
  1. Best Answer
    Swisstone
    2021-05-18T13:18:30+08:002021-05-18T13:18:30+08:00

    Um índice definido no Graylog é apenas as configurações sobre a estratégia de retenção?

    Não esqueça que um Index Set tem um impacto direto nos índices na infraestrutura subjacente do ElasticSearch, você deve levar isso em consideração porque o ElasticSearch tem tudo a ver com índices e seus fragmentos (distribuição de dados, réplica,...).
    Tipo de dados e campos também são uma coisa: você não pode (não deve) ter o mesmo campo com tipo de dados misto no mesmo conjunto de índices (por exemplo, se o campo deviceexiste Integerporque System1 usa um número de dispositivo, mas System2 requer o tipo Textpara este campo porque o identificador do dispositivo é uma string, então você deve armazenar tudo como string ou criar um conjunto de índices separado para manter ambos os tipos de dados e seus respectivos benefícios sob o mesmo nome de campo).

    Essa é geralmente a razão pela qual você provavelmente não deseja armazenar os logs do Windows no mesmo conjunto de índices que qualquer outra coisa (aplicar isso ao seu caso de uso, isso pode ser verdade para suas fontes de dados ERP/WMS?...) porque eles podem levam facilmente a centenas de campos diferentes (e é recomendado evitar exceder o limite de 1000 campos por índice ).

    Então, não, não se trata apenas da estratégia de retenção. Como ponto de partida para sua reflexão eu recomendo que você considere agrupar vários tipos de fonte de dados em seu Index Set (Um Index Set para Windows Log, outro para servidores Linux, outro para firewalls por exemplo, pois faz sentido a partir de um datatype ponto de vista).

    Que impacto tem se eu tiver muitos ou poucos índices?

    Depende da sua infraestrutura do ElasticSearch, e "muito" é indefinido... dê uma olhada em Sizing ElasticSearch e Size your shards . Ter em mente que tipo de consultas você realizará e em qual intervalo de tempo pode ajudar a encontrar o equilíbrio certo entre o tamanho do índice e o número de índices que o ElasticSearch terá que consultar para atender à sua solicitação.

    Infelizmente, não existe uma estratégia de fragmentação de tamanho único. Uma estratégia que funciona em um ambiente pode não ser dimensionada em outro. Uma boa estratégia de fragmentação deve levar em conta sua infraestrutura, caso de uso e expectativas de desempenho.[...]

    Quantos conjuntos de índices devo ter para meu caso de uso?

    O fluxo está configurado com um conjunto de índices, você não pode definir vários conjuntos de índices para um fluxo. Quanto aos outros pontos, já respondi acima.
    No entanto, observe que você pode configurar vários Streams no mesmo Index Set, isso é muito útil se você quiser usar esses fluxos com os mesmos dados subjacentes e apenas quiser restringir o acesso a um subconjunto de logs para determinados usuários: você pode rotear mensagens com base nas condições que você deseja entre vários fluxos e se todos esses fluxos compartilharem o mesmo Conjunto de Índices, você não duplicará as mensagens.

    • 2

relate perguntas

  • Como excluir índices de backups no SQL Server 2008

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Você pode passar usuário/passar para autenticação básica HTTP em parâmetros de URL?

    • 5 respostas
  • Marko Smith

    Ping uma porta específica

    • 18 respostas
  • Marko Smith

    Verifique se a porta está aberta ou fechada em um servidor Linux?

    • 7 respostas
  • Marko Smith

    Como automatizar o login SSH com senha?

    • 10 respostas
  • Marko Smith

    Como posso dizer ao Git para Windows onde encontrar minha chave RSA privada?

    • 30 respostas
  • Marko Smith

    Qual é o nome de usuário/senha de superusuário padrão para postgres após uma nova instalação?

    • 5 respostas
  • Marko Smith

    Qual porta o SFTP usa?

    • 6 respostas
  • Marko Smith

    Linha de comando para listar usuários em um grupo do Windows Active Directory?

    • 9 respostas
  • Marko Smith

    O que é um arquivo Pem e como ele difere de outros formatos de arquivo de chave gerada pelo OpenSSL?

    • 3 respostas
  • Marko Smith

    Como determinar se uma variável bash está vazia?

    • 15 respostas
  • Martin Hope
    Davie Ping uma porta específica 2009-10-09 01:57:50 +0800 CST
  • Martin Hope
    kernel O scp pode copiar diretórios recursivamente? 2011-04-29 20:24:45 +0800 CST
  • Martin Hope
    Robert ssh retorna "Proprietário incorreto ou permissões em ~/.ssh/config" 2011-03-30 10:15:48 +0800 CST
  • Martin Hope
    Eonil Como automatizar o login SSH com senha? 2011-03-02 03:07:12 +0800 CST
  • Martin Hope
    gunwin Como lidar com um servidor comprometido? 2011-01-03 13:31:27 +0800 CST
  • Martin Hope
    Tom Feiner Como posso classificar a saída du -h por tamanho 2009-02-26 05:42:42 +0800 CST
  • Martin Hope
    Noah Goodrich O que é um arquivo Pem e como ele difere de outros formatos de arquivo de chave gerada pelo OpenSSL? 2009-05-19 18:24:42 +0800 CST
  • Martin Hope
    Brent Como determinar se uma variável bash está vazia? 2009-05-13 09:54:48 +0800 CST

Hot tag

linux nginx windows networking ubuntu domain-name-system amazon-web-services active-directory apache-2.4 ssh

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve