Exceto quando definido pelo usuário ou um script de usuário, o valor de OFS parece ser sempre um espaço. Mesmo quando a entrada usa abas:
$ printf 'one\ntwo\tthree\nfour' | awk '{NF=NF}1' | sed -n l
one$
two three$
four$
No entanto, para uma variável semelhante (ORS), às vezes é dito que: deixe ORS sozinho para que ele retenha qualquer valor que deveria ter para sua plataforma . Eu poderia imaginar que em algumas plataformas o ORS padrão poderia ser \r\n
. Pode parecer sensato em algumas plataformas.
A questão para o OFS então é:
- O OFS muda entre plataformas?.
- Existe alguma implementação onde OFS não é um espaço?
Editar Comentário: Desculpe por qualquer confusão que minha pergunta possa ter gerado, espero que esteja claro agora.
Não é possível votar (ainda).
Como eu (agora) comentei lá, o ORS sempre tem como padrão
"\n"
, mas no Windows a implementação C (que se aplica a muitos outros programas além do awk) traduz\n
de e para CR LF -- para todos os\n
caracteres, independentemente de serem produzidos a partir do ORS , ou combinado com RS na entrada.Da mesma forma, sim OFS sempre tem como padrão (um) espaço . FS também tem como padrão um espaço, mas é tratado especialmente: quando FS é igual a um espaço, seja por padrão ou configuração explícita, os campos são realmente divididos por qualquer sequência de espaços em branco (incluindo uma guia no caso que você postou). Qualquer outro FS de caractere único é tratado como um caractere literal e qualquer valor de vários caracteres como um regexp.
Assim, para os casos de espaço único ou regexp, um registro pode ser dividido em delimitadores que variam de campo para campo e/ou registro para registro, mas se você reconstruir $0 atribuindo à NF como fez ou a qualquer campo, a linha reconstruída usa o valor fixo de OFS entre todos os campos (se houver mais de um). Além disso, se você usar
print x,y,z
com várias expressões, elas serão separadas por OFS (fixo). E, claro, se você imprimir explicitamente ou usar uma expressão de string contendo (ou consistindo em) OFS, você obterá o valor de OFS.Padrão RS pode ser definido para qualquer caractere único, ou a string vazia para causar o modo 'parágrafo' onde os registros são divididos por uma ou mais linhas vazias (novas linhas consecutivas); neste modo, por padrão, ele divide os campos em nova linha além do caso normal. Apenas no GNU awk, RS pode ser definido como um regex de vários caracteres e o resultado da correspondência está disponível em RT. Veja o resumo na parte inferior desta página no documento GNU .