AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / server / Perguntas / 1093488
Accepted
Zareh Kasparian
Zareh Kasparian
Asked: 2022-02-13 11:40:35 +0800 CST2022-02-13 11:40:35 +0800 CST 2022-02-13 11:40:35 +0800 CST

seleção de várias partes de uma string em python

  • 772

Eu tenho um arquivo de log como abaixo:

12-02-2022 15:18:22 +0330 SOCK5.6699 00000 user144 97.251.107.125:38605 1.1.1.1:443 51766 169369 0 CONNECT 1.1.1.1:443
12-02-2022 15:18:27 +0330 SOCK5.6699 00094 user156 32.99.193.2:51242 1.1.1.1:443 715 388 0 CONNECT 1.1.1.1:443
12-02-2022 15:18:56 +0330 SOCK5.6699 00000 user105 191.184.66.98:40048 1.1.1.1:443 18105 29029 0 CONNECT 1.1.1.1:443
12-02-2022 15:18:56 +0330 SOCK5.6699 00000 user105 191.184.66.98:40070 1.1.1.1:443 674 26805 0 CONNECT 1.1.1.1:443
12-02-2022 15:20:24 +0330 SOCK5.6699 00000 user143 112.199.63.119:60682 1.1.1.1:443 475 445 0 CONNECT 1.1.1.1:443
12-02-2022 15:20:37 +0330 SOCK5.6699 00000 user105 191.184.66.98:40102 1.1.1.1:443 12913 18780 0 CONNECT 1.1.1.1:443
12-02-2022 15:20:42 +0330 SOCK5.6699 00000 user143 112.199.63.119:60688 1.1.1.1:443 4530 34717 0 CONNECT 1.1.1.1:443
12-02-2022 15:20:44 +0330 SOCK5.6699 00000 user127 212.167.145.49:2972 1.1.1.1:443 827 267 0 CONNECT 1.1.1.1:443

meu objetivo é extrair duas partes deste arquivo de log:

  1. Nome de usuário
  2. Endereço IP da origem do usuário

abaixo está uma amostra das porções de dados necessárias.

12-02-2022 15:18:22 +0330 SOCK5.6699 00000 usuário144 97.251.107.125 :38605 1.1.1.1:443 51766 169369 0 CONECTAR 1.1.1.1:443

Então eu escrevi um script Python para extrair os dois itens e armazená-los em listas separadas e depois uni-los com a função zip.

import pprint
import collections

iplist=[]
for l in data:
    ip_port=l[53:71]
    iplist.append(ip_port.split(':')[0])


userlist=[]
for u in data:
    user=u[42:52]
    userlist.append(user.replace(" ", ""))

a=list(zip(iplist,userlist))
most_ip=collections.Counter(a).most_common(5)
pprint.pprint(most_ip)

Este código funciona bem e consigo obter o ip mais usado com seu nome de usuário correspondente. Também preciso mencionar que não usei o módulo re , pois estava listando o segundo IP (IP de destino que é 1.1.1.1 - que não me importo com isso)

Pergunta: Existe alguma outra maneira (mais legal) do que a maneira como escrevi o código?

python
  • 2 2 respostas
  • 32 Views

2 respostas

  • Voted
  1. Zareh Kasparian
    2022-02-15T09:52:44+08:002022-02-15T09:52:44+08:00

    Com a sugestão de "shearn89" editei meu código conforme abaixo:

    muito mais simples com uma única iteração.

    userlist=[]
    iplist=[]
    for i in data:
        ip=i.split(' ')[6].split(':')[0]
        user=i.split(' ')[5]
        iplist.append(ip)
        userlist.append(user)
    
    top_used=collections.Counter(zip(iplist,userlist)).most_common(5)
    pprint.pprint(top_used)
    
    • 1
  2. Best Answer
    Misc08
    2022-02-18T15:36:29+08:002022-02-18T15:36:29+08:00

    Existem muitos recursos para otimizar também seu novo código. As duas coisas que mais me prendem:

    Não execute split() mais de uma vez para cada linha do log, apenas execute split() uma vez e armazene o resultado em uma variável, pois cada execução desta função precisa de algum tempo (mesmo que não seja muito, mas irá somar o mais dados que você processa).

    s = i.split(' ')
    ip=s[6].split(':')[0]
    user=s[5]
    

    Por que criar duas listas e depois compactá-las? Basta armazenar as tuplas diretamente em uma lista:

    l = []
    for i in data:
       s = i.split(' ')
       ip=s[6].split(':')[0]
       user=s[5]
       l.append(tuple((ip, user)))
    top_used=collections.Counter(l).most_common(5)
    
    • 1

relate perguntas

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Você pode passar usuário/passar para autenticação básica HTTP em parâmetros de URL?

    • 5 respostas
  • Marko Smith

    Ping uma porta específica

    • 18 respostas
  • Marko Smith

    Verifique se a porta está aberta ou fechada em um servidor Linux?

    • 7 respostas
  • Marko Smith

    Como automatizar o login SSH com senha?

    • 10 respostas
  • Marko Smith

    Como posso dizer ao Git para Windows onde encontrar minha chave RSA privada?

    • 30 respostas
  • Marko Smith

    Qual é o nome de usuário/senha de superusuário padrão para postgres após uma nova instalação?

    • 5 respostas
  • Marko Smith

    Qual porta o SFTP usa?

    • 6 respostas
  • Marko Smith

    Linha de comando para listar usuários em um grupo do Windows Active Directory?

    • 9 respostas
  • Marko Smith

    O que é um arquivo Pem e como ele difere de outros formatos de arquivo de chave gerada pelo OpenSSL?

    • 3 respostas
  • Marko Smith

    Como determinar se uma variável bash está vazia?

    • 15 respostas
  • Martin Hope
    Davie Ping uma porta específica 2009-10-09 01:57:50 +0800 CST
  • Martin Hope
    kernel O scp pode copiar diretórios recursivamente? 2011-04-29 20:24:45 +0800 CST
  • Martin Hope
    Robert ssh retorna "Proprietário incorreto ou permissões em ~/.ssh/config" 2011-03-30 10:15:48 +0800 CST
  • Martin Hope
    Eonil Como automatizar o login SSH com senha? 2011-03-02 03:07:12 +0800 CST
  • Martin Hope
    gunwin Como lidar com um servidor comprometido? 2011-01-03 13:31:27 +0800 CST
  • Martin Hope
    Tom Feiner Como posso classificar a saída du -h por tamanho 2009-02-26 05:42:42 +0800 CST
  • Martin Hope
    Noah Goodrich O que é um arquivo Pem e como ele difere de outros formatos de arquivo de chave gerada pelo OpenSSL? 2009-05-19 18:24:42 +0800 CST
  • Martin Hope
    Brent Como determinar se uma variável bash está vazia? 2009-05-13 09:54:48 +0800 CST

Hot tag

linux nginx windows networking ubuntu domain-name-system amazon-web-services active-directory apache-2.4 ssh

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve