Encontrar threads/scripts associados a uma porta?

Question

Asked: 2024-04-05 14:54:23 +0800 CST2024-04-05 14:54:23 +0800 CST 2024-04-05 14:54:23 +0800 CST

Netfilter e forward chain rastreiam ARP, mas não outros pacotes

772

Estou experimentando o netfilter em um contêiner Docker. Eu tenho três contêineres, um "roteador" e dois "endpoints". Cada um deles é conectado via pipework, portanto, existe uma ponte externa (host) para cada conexão de endpoint<->roteador. Algo assim:

containerA (eth1) -- hostbridgeA -- (eth1) containerR
containerB (eth1) -- hostbridgeB -- (eth2) containerR

Então, dentro do contêiner "roteador" containerR, tenho uma ponte br0configurada assim:

bridge name bridge id          STP enabled     interfaces
br0         8000.3a047f7a7006  no              eth1
                                               eth2

Eu tenho net.bridge.bridge-nf-call-iptables=0no host porque isso estava interferindo em alguns dos meus outros testes.

containerAtem IP 192.168.10.1/24e containerBtem 192.168.10.2/24.

Tenho então um conjunto de regras muito simples que rastreia pacotes encaminhados:

flush ruleset

table bridge filter {
    chain forward {
        type filter hook forward priority 0; policy accept;
        meta nftrace set 1
    }
}

Com isso, descubro que apenas os pacotes ARP são rastreados, e não os pacotes ICMP. Em outras palavras, se eu executar nft monitorwhile containerAis ping containerB, poderei ver os pacotes ARP rastreados, mas não os pacotes ICMP. Isso me surpreende, porque com base no meu entendimento dos tipos de cadeia de filtros de ponte do nftables , a única vez que um pacote não passaria pelo forwardestágio seria se fosse enviado inputpara o host (neste caso containerR). De acordo com o diagrama de fluxo de pacotes do Linux:

Eu ainda esperaria que os pacotes ICMP seguissem o caminho de encaminhamento, assim como o ARP. Eu vejo os pacotes se rastrear o pré e o pós-roteamento. Então minha pergunta é: o que está acontecendo aqui? Existe uma tabela de fluxo ou outro curto-circuito que não conheço? É específico para rede de contêineres e/ou Docker? ~~Posso verificar com VMs em vez de containers~~ , mas estou interessado se outras pessoas souberem ou já encontraram isso.

Editar: desde então, criei uma configuração semelhante com um conjunto de máquinas virtuais Alpine no VirtualBox. Os pacotes ICMP chegam à forwardcadeia, então parece que algo no host, ou Docker, está interferindo nas minhas expectativas. Deixarei isso sem resposta até que eu, ou outra pessoa, consiga identificar o motivo, caso seja útil para outras pessoas saberem.

Obrigado!

Exemplo mínimo reproduzível

Para isso estou utilizando o Alpine Linux 3.19.1 em uma VM, com o communityrepositório habilitado em /etc/apk/respositories:

# Prerequisites of host
apk add bridge bridge-utils iproute2 docker openrc
service docker start

# When using linux bridges instead of openvswitch, disable iptables on bridges
sysctl net.bridge.bridge-nf-call-iptables=0

# Pipework to let me avoid docker's IPAM
git clone https://github.com/jpetazzo/pipework.git
cp pipework/pipework /usr/local/bin/

# Create two containers each on their own network (bridge)
pipework brA $(docker create -itd --name hostA alpine:3.19) 192.168.10.1/24
pipework brB $(docker create -itd --name hostB alpine:3.19) 192.168.10.2/24

# Create bridge-filtering container then connect it to both of the other networks
R=$(docker create --cap-add NET_ADMIN -itd --name hostR alpine:3.19)
pipework brA -i eth1 $R 0/0
pipework brB -i eth2 $R 0/0
# Note: `hostR` doesn't have/need an IP address on the bridge for this example

# Add bridge tools and netfilter to the bridging container
docker exec hostR apk add bridge bridge-utils nftables
docker exec hostR brctl addbr br
docker exec hostR brctl addif br eth1 eth2
docker exec hostR ip link set dev br up

# hostA should be able to ping hostB
docker exec hostA ping -c 1 192.168.10.2
# 64 bytes from 192.168.10.2...

# Set nftables rules
docker exec hostR nft add table bridge filter
docker exec hostR nft add chain bridge filter forward '{type filter hook forward priority 0;}'
docker exec hostR nft add rule bridge filter forward meta nftrace set 1

# Now ping hostB from hostA while nft monitor is running...
docker exec hostA ping -c 4 192.168.10.2 & docker exec hostR nft monitor

# Ping will succeed, nft monitor will not show any echo-request/-response packets traced, only arps
# Example:
trace id abc bridge filter forward packet: iif "eth2" oif "eth1" ether saddr ... daddr ... arp operation request
trace id abc bridge filter forward rule meta nfrtrace set 1 (verdict continue)
trace id abc bridge filter forward verdict continue
trace id abc bridge filter forward policy accept
...
trace id def bridge filter forward packet: iif "eth1" oif "eth2" ether saddr ... daddr ... arp operation reply
trace id def bridge filter forward rule meta nfrtrace set 1 (verdict continue)
trace id def bridge filter forward verdict continue
trace id def bridge filter forward policy accept

# Add tracing in prerouting and the icmp packets are visible:
docker exec hostR nft add chain bridge filter prerouting '{type filter hook prerouting priority 0;}'
docker exec hostR nft add rule bridge filter prerouting meta nftrace set 1

# Run again
docker exec hostA ping -c 4 192.168.10.2 & docker exec hostR nft monitor
# Ping still works (obviously), but we can see its packets in prerouting, which then disappear from the forward chain, but ARP shows up in both.
# Example:
trace id abc bridge filter prerouting packet: iif "eth1" ether saddr ... daddr ... ... icmp type echo-request ...
trace id abc bridge filter prerouting rule meta nfrtrace set 1 (verdict continue)
trace id abc bridge filter prerouting verdict continue
trace id abc bridge filter prerouting policy accept
...
trace id def bridge filter prerouting packet:  iif "eth2" ether saddr ... daddr ... ... icmp type echo-reply ...
trace id def bridge filter prerouting rule meta nfrtrace set 1 (verdict continue)
trace id def bridge filter prerouting verdict continue
trace id def bridge filter prerouting policy accept
...
trace id 123 bridge filter prerouting packet: iif "eth1" ether saddr ... daddr ... ... arp operation request
trace id 123 bridge filter prerouting rule meta nfrtrace set 1 (verdict continue)
trace id 123 bridge filter prerouting verdict continue
trace id 123 bridge filter prerouting policy accept
trace id 123 bridge filter forward packet: iif "eth1" oif "eth2" ether saddr ... daddr ... arp operation request
trace id 123 bridge filter forward rule meta nfrtrace set 1 (verdict continue)
trace id 123 bridge filter forward verdict continue
trace id 123 bridge filter forward policy accept
...
trace id 456 bridge filter prerouting packet:  iif "eth2" ether saddr ... daddr ... ... arp operation reply
trace id 456 bridge filter prerouting rule meta nfrtrace set 1 (verdict continue)
trace id 456 bridge filter prerouting verdict continue
trace id 456 bridge filter prerouting policy accept
trace id 456 bridge filter forward packet: iif "eth2" oif "eth1" ether saddr ... daddr ... arp operation reply
trace id 456 bridge filter forward rule meta nfrtrace set 1 (verdict continue)
trace id 456 bridge filter forward verdict continue
trace id 456 bridge filter forward policy accept
# Note the trace id matching across prerouting and forward chains

Eu tentei isso com openvswitch também, mas para simplificar, usei um exemplo de ponte Linux que produz o mesmo resultado de qualquer maneira. A única diferença real com o openvswitch é que net.bridge.bridge-nf-call-iptables=0não é necessário, IIRC.

1 respostas

Voted

A.B · Answer 1 · 2024-04-07T03:00:49+08:00

Introdução e configuração simplificada do reprodutor

Docker carrega obr_netfilter módulo. Uma vez carregado, afeta todos os namespaces de rede atuais e futuros . Isso ocorre por motivos históricos e de compatibilidade, conforme descrito em minha resposta a esta pergunta/resposta .

Então, quando isso for feito no host:

service docker start

# When using linux bridges instead of openvswitch, disable iptables on bridges
sysctl net.bridge.bridge-nf-call-iptables=0

Isso afeta apenas o namespace da rede host. O futuro namespace de rede criado hostRainda terá:

# docker exec hostR sysctl net.bridge.bridge-nf-call-iptables
net.bridge.bridge-nf-call-iptables = 1

Abaixo está um reprodutor de bugs muito mais simples que o OP. Não requer Docker nem VM: pode ser executado no host Linux atual, exigindo apenas o iproute2pacote e criando uma única ponte: dentro do hostRnamespace da rede nomeada afetada:

#!/bin/sh

modprobe br_netfilter # as would have done Docker

sysctl net.bridge.bridge-nf-call-iptables=0 # actually it won't matter: netns hostR will still get 1 when created

ip netns add hostA
ip netns add hostB
ip netns add hostR

ip -n hostR link add name br address 02:00:00:00:01:00 up type bridge
ip -n hostR link add name eth1 up master br type veth peer netns hostA name eth1
ip -n hostR link add name eth2 up master br type veth peer netns hostB name eth1

ip -n hostA addr add dev eth1 192.168.10.1/24
ip -n hostA link set eth1 up
ip -n hostB addr add dev eth1 192.168.10.2/24
ip -n hostB link set eth1 up

ip netns exec hostR nft -f - <<'EOF'
table bridge filter        # for idempotence
delete table bridge filter # for idempotence

table bridge filter {
    chain forward {
        type filter hook forward priority 0;
        meta nftrace set 1
    }
}
EOF

Observe que br_netfilterainda possui suas configurações padrão no hostRnamespace da rede:

# ip netns exec hostR sysctl net.bridge.bridge-nf-call-iptables
net.bridge.bridge-nf-call-iptables = 1

Correndo de um lado:

ip netns exec hostR nft monitor trace

E em outro lugar:

ip netns exec hostA ping -c 4 192.168.10.2

irá desencadear o problema: nenhum IPv4 visto, apenas ARP (que geralmente é visto atrasado alguns segundos depois, em uma atualização ARP preguiçosa típica). Isso sempre é acionado para kernels 6.6.x ou inferiores, e pode ser acionado ou não para kernels 6.7.x ou superiores (veja mais adiante).

Efeitos de`br_netfilter`

Este módulo cria interações entre o caminho da ponte e os ganchos do Netfilter para IPv4, normalmente para o caminho de roteamento, mas agora também para o caminho da ponte. Aqui, os ganchos para IPv4 são iptables e nftables da ipfamília (da mesma forma, isso acontece para ARP e IPv6. IPv6 não é usado, não falaremos mais sobre isso).

Isso significa que agora os quadros alcançam os ganchos do Netfilter conforme descrito na interação ebtables/iptables em uma ponte baseada em Linux: 5. Travessia de cadeia para pacotes IP em ponte :

Travessia de cadeia para pacotes IP em ponte

Um pacote em ponte nunca entra em nenhum código de rede acima da camada 1 (camada de link). Portanto, um pacote/quadro IP em ponte nunca inserirá o código IP. Portanto, todas as cadeias do iptables serão percorridas enquanto o pacote IP estiver no código da ponte. A travessia da cadeia ficará assim:

Figura 5. Travessia de cadeia para pacotes IP em ponte

Eles devem chegar bridge filter forwardprimeiro (azul) seguido por ip filter forward(verde)...

... mas não quando as prioridades originais do gancho são alteradas e, por sua vez, alteram a ordem das caixas acima. As prioridades originais dos ganchos para a família de pontes são descritas em nft(8):

Tabela 7. Nomes de prioridade padrão e compatibilidade de gancho para a família de pontes

Nome Valor Ganchos

dstnat -300 pré-roteamento

filtro -200 todos

fora 100 saída

srcnat 300 pós-roteamento

Portanto, o esquema acima espera que o filtro forward atinja a prioridade -200 e não 0. Se usar 0, todas as apostas serão canceladas.

Na verdade, quando o kernel em execução foi compilado com a opção CONFIG_NETFILTER_NETLINK_HOOK, nft list hookspode ser usado para consultar todos os ganchos em uso no namespace atual, incluindo br_netfilteros '. Para kernel 6.6.x ou anterior:

# ip netns exec hostR nft list hooks
family ip {
    hook prerouting {
        -2147483648 ip_sabotage_in [br_netfilter]
    }
    hook postrouting {
        -0000000225 apparmor_ip_postroute
    }
}
family ip6 {
    hook prerouting {
        -2147483648 ip_sabotage_in [br_netfilter]
    }
    hook postrouting {
        -0000000225 apparmor_ip_postroute
    }
}
family bridge {
    hook prerouting {
         0000000000 br_nf_pre_routing [br_netfilter]
    }
    hook input {
        +2147483647 br_nf_local_in [br_netfilter]
    }
    hook forward {
        -0000000001 br_nf_forward_ip [br_netfilter]
         0000000000 chain bridge filter forward [nf_tables]
         0000000000 br_nf_forward_arp [br_netfilter]
    }
    hook postrouting {
        +2147483647 br_nf_post_routing [br_netfilter]
    }
}

pode-se ver que o módulo do kernel br_netfilter(não desativado neste namespace de rede) conecta em -1 para IPv4 e novamente em 0 para ARP: a ordem de gancho esperada não é atendida e a interrupção ocorre na bridge filter forwardprioridade 0 do OP.

No kernel 6.7.x e posterior, desde este commit , a ordem padrão após a execução do reprodutor muda:

# ip netns exec hostR nft list hooks
[...]
family bridge {
    hook prerouting {
         0000000000 br_nf_pre_routing [br_netfilter]
    }
    hook input {
        +2147483647 br_nf_local_in [br_netfilter]
    }
    hook forward {
         0000000000 chain bridge filter forward [nf_tables]
         0000000000 br_nf_forward [br_netfilter]
    }
    hook postrouting {
        +2147483647 br_nf_post_routing [br_netfilter]
    }
}

With the simplification, br_netfilter hooks only at priority 0 to handle forwarding, but what matters is it's now after bridge filter forward: the expected order, which won't cause OP's issue.

As having two hooks at same priority is to be considered undefined behavior, this is a frail setup: one can still trigger from here the problem (at least on kernel 6.7.x) simply by running:

rmmod br_netfilter
modprobe br_netfilter

which now changes the order:

[...]
    hook forward {
         0000000000 br_nf_forward [br_netfilter]
         0000000000 chain bridge filter forward [nf_tables]
    }
[...]

triggering again the problem since now br_netfilter is again before bridge filter forward.

How to avoid this

To work around this in the network namespace (or container) choose one of these:

don't have br_netfilter loaded at all

On host:
```
rmmod br_netfilter
```
or disable the effects of br_netfilter in the additional network namespace

As explained, each new network namespace gets again this feature enabled when created. It has to be disabled where it matters: in hostR network namespace:
```
ip netns exec hostR sysctl net.bridge.bridge-nf-call-iptables=0
```
Once done, all br_netfilter hooks disappear in hostR causing no more any disruption when the unexpected order happens.

There's one caveat. This doesn't work when using only Docker:
```
# docker exec hostR sysctl net.bridge.bridge-nf-call-iptables=0
sysctl: error setting key 'net.bridge.bridge-nf-call-iptables': Read-only file system
# docker exec --privileged hostR sysctl net.bridge.bridge-nf-call-iptables=0
sysctl: error setting key 'net.bridge.bridge-nf-call-iptables': Read-only file system
```
because Docker protected some settings to prevent them to be tampered with by the container.

Instead, one has to bind-mount (using ip netns attach ...) the container's network namespace, so it can be used by ip netns exec ... without getting its mount namespace in the way:
```
ip netns attach hostR $(docker inspect --format '{{.State.Pid}}' hostR)
```
Which now allows to run the previous command and affect the container:
```
ip netns exec hostR sysctl net.bridge.bridge-nf-call-iptables=0
```

or use a priority that guarantees bridge filter forward to happen first

Conforme visto na tabela anterior, a prioridade padrão ( priority forward) na família de pontes é -200. Então use -200, ou então no máximo o valor -2 para acontecer sempre antes de br_netfilterqualquer versão do kernel:

ip netns exec hostR nft delete chain bridge filter forward
ip netns exec hostR nft add chain bridge filter forward '{ type filter hook forward priority -200; }'
ip netns exec hostR nft add rule bridge filter forward meta nftrace set 1

ou da mesma forma, se estiver usando Docker:

docker exec hostR nft delete chain bridge filter forward
docker exec hostR nft add chain bridge filter forward '{ type filter hook forward priority -200; }'
docker exec hostR nft add rule bridge filter forward meta nftrace set 1

Testado em:

(OPs) alpino 3.19.1
Debian 12.5 com
- estoque kernel Debian 6.1.x
- 6.6.x comCONFIG_NETFILTER_NETLINK_HOOK
- 6.7.11 comCONFIG_NETFILTER_NETLINK_HOOK

Não testado com pontes openvswitch.

Nota final: evite ao máximo o Docker ou o br_netfiltermódulo do kernel ao fazer experimentos de rede . Como mostra meu reprodutor, é muito fácil experimentar ip netnssozinho quando há apenas rede envolvida (isso pode se tornar mais difícil se daemons (como OpenVPN) forem necessários em um experimento).

Netfilter e forward chain rastreiam ARP, mas não outros pacotes

Exemplo mínimo reproduzível

Introdução e configuração simplificada do reprodutor

Efeitos de`br_netfilter`

How to avoid this

Possível firmware ausente /lib/firmware/i915/* para o módulo i915

Falha ao buscar o repositório de backports jessie

Como exportar uma chave privada GPG e uma chave pública para um arquivo

Como podemos executar um comando armazenado em uma variável?

Como configurar o systemd-resolved e o systemd-networkd para usar o servidor DNS local para resolver domínios locais e o servidor DNS remoto para domínios remotos?

apt-get update error no Kali Linux após a atualização do dist [duplicado]

Como ver as últimas linhas x do log de serviço systemctl

Nano - pule para o final do arquivo

erro grub: você precisa carregar o kernel primeiro

Como baixar o pacote não instalá-lo com o comando apt-get?

Netfilter e forward chain rastreiam ARP, mas não outros pacotes

Exemplo mínimo reproduzível

1 respostas

Introdução e configuração simplificada do reprodutor

Efeitos debr_netfilter

How to avoid this

relate perguntas

Efeitos de`br_netfilter`