Como posso descrever ou explicar "buffers" na saída de free
?
$ free -h
total used free shared buff/cache available
Mem: 501M 146M 19M 9.7M 335M 331M
Swap: 1.0G 85M 938M
$ free -w -h
total used free shared buffers cache available
Mem: 501M 146M 19M 9.7M 155M 180M 331M
Swap: 1.0G 85M 938M
Não tenho nenhum problema (conhecido) com este sistema. Estou apenas surpreso e curioso ao ver que "buffers" é quase tão alto quanto "cache" (155M vs 180M). Eu pensei que "cache" representava o cache da página do conteúdo do arquivo e tendia a ser a parte mais significativa de "cache/buffers". Não tenho certeza do que são "buffers".
Por exemplo, comparei isso com meu laptop, que tem mais RAM. No meu laptop, o número de "buffers" é uma ordem de grandeza menor que "cache" (200M vs 4G). Se eu entendesse o que eram "buffers", poderia começar a ver por que os buffers cresceram em uma proporção tão maior no sistema menor.
De man proc
(eu ignoro a definição hilariante e desatualizada de "grande"):
Buffers %lu
Armazenamento relativamente temporário para blocos de disco brutos que não devem ficar muito grandes (20 MB ou mais).
%lu em cache
Cache na memória para arquivos lidos do disco (o cache da página). Não inclui SwapCached.
$ free -V
free from procps-ng 3.3.12
$ uname -r # the Linux kernel version
4.9.0-6-marvell
$ systemd-detect-virt # this is not inside a virtual machine
none
$ cat /proc/meminfo
MemTotal: 513976 kB
MemFree: 20100 kB
MemAvailable: 339304 kB
Buffers: 159220 kB
Cached: 155536 kB
SwapCached: 2420 kB
Active: 215044 kB
Inactive: 216760 kB
Active(anon): 56556 kB
Inactive(anon): 73280 kB
Active(file): 158488 kB
Inactive(file): 143480 kB
Unevictable: 10760 kB
Mlocked: 10760 kB
HighTotal: 0 kB
HighFree: 0 kB
LowTotal: 513976 kB
LowFree: 20100 kB
SwapTotal: 1048572 kB
SwapFree: 960532 kB
Dirty: 240 kB
Writeback: 0 kB
AnonPages: 126912 kB
Mapped: 40312 kB
Shmem: 9916 kB
Slab: 37580 kB
SReclaimable: 29036 kB
SUnreclaim: 8544 kB
KernelStack: 1472 kB
PageTables: 3108 kB
NFS_Unstable: 0 kB
Bounce: 0 kB
WritebackTmp: 0 kB
CommitLimit: 1305560 kB
Committed_AS: 1155244 kB
VmallocTotal: 507904 kB
VmallocUsed: 0 kB
VmallocChunk: 0 kB
$ sudo slabtop --once
Active / Total Objects (% used) : 186139 / 212611 (87.5%)
Active / Total Slabs (% used) : 9115 / 9115 (100.0%)
Active / Total Caches (% used) : 66 / 92 (71.7%)
Active / Total Size (% used) : 31838.34K / 35031.49K (90.9%)
Minimum / Average / Maximum Object : 0.02K / 0.16K / 4096.00K
OBJS ACTIVE USE OBJ SIZE SLABS OBJ/SLAB CACHE SIZE NAME
59968 57222 0% 0.06K 937 64 3748K buffer_head
29010 21923 0% 0.13K 967 30 3868K dentry
24306 23842 0% 0.58K 4051 6 16204K ext4_inode_cache
22072 20576 0% 0.03K 178 124 712K kmalloc-32
10290 9756 0% 0.09K 245 42 980K kmalloc-96
9152 4582 0% 0.06K 143 64 572K kmalloc-node
9027 8914 0% 0.08K 177 51 708K kernfs_node_cache
7007 3830 0% 0.30K 539 13 2156K radix_tree_node
5952 4466 0% 0.03K 48 124 192K jbd2_revoke_record_s
5889 5870 0% 0.30K 453 13 1812K inode_cache
5705 4479 0% 0.02K 35 163 140K file_lock_ctx
3844 3464 0% 0.03K 31 124 124K anon_vma
3280 3032 0% 0.25K 205 16 820K kmalloc-256
2730 2720 0% 0.10K 70 39 280K btrfs_trans_handle
2025 1749 0% 0.16K 81 25 324K filp
1952 1844 0% 0.12K 61 32 244K kmalloc-128
1826 532 0% 0.05K 22 83 88K trace_event_file
1392 1384 0% 0.33K 116 12 464K proc_inode_cache
1067 1050 0% 0.34K 97 11 388K shmem_inode_cache
987 768 0% 0.19K 47 21 188K kmalloc-192
848 757 0% 0.50K 106 8 424K kmalloc-512
450 448 0% 0.38K 45 10 180K ubifs_inode_slab
297 200 0% 0.04K 3 99 12K eventpoll_pwq
288 288 100% 1.00K 72 4 288K kmalloc-1024
288 288 100% 0.22K 16 18 64K mnt_cache
287 283 0% 1.05K 41 7 328K idr_layer_cache
240 8 0% 0.02K 1 240 4K fscrypt_info
Buffers
servem?Buffers
em particular, que seja maior ou menor?1. Qual é a diferença entre "buffers" e outro tipo de cache?
Buffers
mostra a quantidade de cache de página usada para dispositivos de bloco. "Dispositivos de bloco" são o tipo mais comum de dispositivo de armazenamento de dados.O kernel tem que subtrair deliberadamente esta quantidade do resto do cache da página quando ele relata
Cached
. Veja meminfo_proc_show() :2. Por que essa distinção é tão proeminente? Por que algumas pessoas dizem "cache de buffer" quando falam sobre o conteúdo do arquivo em cache?
O cache de página funciona em unidades do tamanho da página MMU, normalmente um mínimo de 4096 bytes. Isso é essencial para
mmap()
, ou seja, acesso a arquivos mapeados na memória.[1][2] Ele foi projetado para compartilhar páginas de programa carregado/código de biblioteca entre processos separados e permitir o carregamento de páginas individuais sob demanda. (Também para descarregar páginas quando algo mais precisa de espaço e não foi usado recentemente).[1] E/S mapeada em memória - O manual da biblioteca GNU C.
[2]
mmap
- Wikipédia.O UNIX antigo tinha um "cache de buffer" de blocos de disco e não tinha mmap(). Aparentemente, quando mmap() foi adicionado pela primeira vez, eles adicionaram o cache da página como uma nova camada no topo. Isso é tão confuso quanto parece. Eventualmente, o sistema operacional baseado em UNIX se livrou do cache de buffer separado. Portanto, agora todo o cache de arquivos está em unidades de páginas. As páginas são procuradas por (arquivo, deslocamento), não por localização no disco. Isso foi chamado de "cache de buffer unificado", talvez porque as pessoas estivessem mais familiarizadas com "cache de buffer".[3]
[3] UBC: Um E/S Unificado Eficiente e Subsistema de Cache de Memória para NetBSD
("Uma reviravolta interessante que o Linux adiciona é que os números do bloco de dispositivo onde uma página é armazenada no disco são armazenados em cache com a página na forma de uma lista de
buffer_head
estruturas. Quando uma página modificada deve ser gravada de volta no disco, o I/ As solicitações podem ser enviadas para o driver do dispositivo imediatamente, sem a necessidade de ler nenhum bloco indireto para determinar onde os dados da página devem ser gravados."[3])No Linux 2.2, havia um "cache de buffer" separado usado para gravações, mas não para leituras. "O cache de página usou o cache de buffer para gravar novamente seus dados, precisando de uma cópia extra dos dados e dobrando os requisitos de memória para algumas cargas de gravação".[4] Não vamos nos preocupar muito com os detalhes, mas esse histórico seria uma das razões pelas quais o Linux relata
Buffers
o uso separadamente.[4] Substituição de página no gerenciamento de memória do Linux 2.4 , Rik van Riel.
Por outro lado, no Linux 2.4 e superior, a cópia extra não existe. "O sistema faz I/O de disco diretamente de e para a página de cache da página."[4] O Linux 2.4 foi lançado em 2001.
3. Para que
Buffers
servem?Os dispositivos de bloco são tratados como arquivos e, portanto, possuem cache de página. Isso é usado "para metadados do sistema de arquivos e cache de dispositivos de blocos brutos".[4] Mas nas versões atuais do Linux, os sistemas de arquivos não copiam o conteúdo do arquivo por meio dele, portanto, não há "cache duplo".
Penso na
Buffers
parte do cache da página como sendo o cache do buffer do Linux. Algumas fontes podem discordar dessa terminologia.Quanto cache de buffer o sistema de arquivos usa, se houver, depende do tipo de sistema de arquivos. O sistema na pergunta usa ext4. ext3/ext4 usam o cache de buffer do Linux para o diário, para o conteúdo do diretório e alguns outros metadados.
-- Artigo por e - mail de Ted Tso , 2013
-- Um par de respostas do Quora por Robert Love , atualizado pela última vez em 2013.
Ambos os escritores são desenvolvedores Linux que trabalharam com gerenciamento de memória do kernel Linux. A primeira fonte é mais específica sobre detalhes técnicos. A segunda fonte é um resumo mais geral, que pode ser contradito e desatualizado em alguns detalhes.
É verdade que os sistemas de arquivos podem executar gravações de metadados de página parcial, mesmo que o cache seja indexado em páginas. Mesmo os processos do usuário podem executar gravações de página parcial quando usam
write()
(ao contrário demmap()
), pelo menos diretamente em um dispositivo de bloco. Isso se aplica apenas a gravações, não a leituras. Quando você lê o cache da página, o cache da página sempre lê páginas inteiras.Linus gostava de reclamar que o cache do buffer não é necessário para fazer gravações do tamanho de bloco e que os sistemas de arquivos podem fazer gravações de metadados de página parcial mesmo com o cache de página anexado a seus próprios arquivos em vez do dispositivo de bloco. Tenho certeza de que ele está certo ao dizer que o ext2 faz isso. ext3/ext4 com seu sistema de journalling não. É menos claro quais foram os problemas que levaram a esse projeto. As pessoas com quem ele estava reclamando se cansaram de explicar.
ext4_readdir() não foi alterado para satisfazer o discurso de Linus. Também não vejo a abordagem desejada usada em readdir () de outros sistemas de arquivos. Acho que o XFS também usa o cache de buffer para diretórios. bcachefs não usa o cache da página para readdir(); ele usa seu próprio cache para btrees. Não tenho certeza sobre btrfs.
4. Por que podemos esperar,
Buffers
em particular, que seja maior ou menor?Nesse caso, o tamanho do diário ext4 para meu sistema de arquivos é 128M. Isso explica por que 1) meu cache de buffer pode se estabilizar em pouco mais de 128M; 2) o cache do buffer não é dimensionado proporcionalmente com a maior quantidade de RAM no meu laptop.
Para algumas outras causas possíveis, consulte Qual é a coluna de buffers na saída de free? Observe que "buffers" relatados por
free
são, na verdade, uma combinação deBuffers
memória slab do kernel recuperável.Para verificar se as gravações do diário usam o cache do buffer, simulei um sistema de arquivos em RAM rápida e agradável (tmpfs) e comparei o uso máximo do buffer para diferentes tamanhos de diário.
História desta resposta: Como vim a olhar para o diário
Encontrei o e-mail de Ted Tso primeiro e fiquei intrigado com o fato de ele enfatizar o cache de gravação . Eu acharia surpreendente se dados "sujos" não gravados pudessem atingir 30% da RAM no meu sistema.
sudo atop
mostra que, em um intervalo de 10 segundos, o sistema em questão grava consistentemente apenas 1 MB. O sistema de arquivos em questão seria capaz de acompanhar mais de 100 vezes essa taxa. (Está em uma unidade de disco rígido USB2, taxa de transferência máxima ~ 20 MB/s).O uso de blktrace (
btrace -w 10 /dev/sda
) confirma que os IOs que estão sendo armazenados em cache devem ser gravados, porque quase não há dados sendo lidos. Além disso, essemysqld
é o único processo de espaço de usuário fazendo IO.Parei o serviço responsável pelas gravações (icinga2 gravando no mysql) e verifiquei novamente. Eu vi "buffers" cair para menos de 20M - não tenho explicação para isso - e ficar lá. Reiniciar o gravador novamente mostra "buffers" aumentando em ~ 0,1M para cada intervalo de 10 segundos. Observei que ele mantém essa taxa de forma consistente, subindo de volta para 70M e acima.
A execução
echo 3 | sudo tee /proc/sys/vm/drop_caches
foi suficiente para reduzir os "buffers" novamente, para 4,5M. Isso prova que meu acúmulo de buffers é um cache "limpo", que o Linux pode descartar imediatamente quando necessário. Este sistema não está acumulando dados não gravados . (drop_caches
não executa nenhum write-back e, portanto, não pode descartar páginas sujas. Se você quiser executar um teste que limpe o cache primeiro, use osync
comando).Todo o diretório mysql tem apenas 150M. Os buffers acumulados devem representar blocos de metadados das gravações do mysql, mas me surpreendeu pensar que haveria tantos blocos de metadados para esses dados.
Sua versão de
free
tem a ideia certa. Por padrão, ele combina buffers e cache em seu relatório. Isso ocorre porque eles são basicamente a mesma coisa. Ambos são o computador lembrando na RAM (Mais rápido que o armazenamento secundário: Discos e SSD), o que ele já viu ao ler Disco e SSD.Se o sistema operacional sentir que a memória é melhor usada por outra coisa, ele pode liberá-la. Portanto, não se preocupe com buffer e cache.
No entanto, assistir a um DVD pode fazer com que o buffer suba e elimine outro conteúdo de buffer/cache. Portanto, você pode usar o nocache para executar o reprodutor de DVD ( se estiver causando um problema ).