aptitudeusa o POSIX regcomp()/ regexec()API da biblioteca C do sistema para fazer correspondência de regexp e chamadasregcomp() com REG_ICASE | REG_EXTENDEDflags , para que você obtenha basicamente o mesmo que grep -iE¹ e não há suporte integrado para desativar a insensibilidade a maiúsculas e minúsculas.
Agora, se você estiver disposto a despender um pouco de esforço, ainda há coisas que você pode fazer. Afinal, é tudo software gratuito e de código aberto, então nunca há limite no que você pode fazer.
Por exemplo, você poderia interceptar as regcomp()invocações da função libc através de um LD_PRELOADtruque para remover esse REG_ICASEsinalizador:
$ cat case-sensitive.c
#define _GNU_SOURCE
#include <dlfcn.h>
#include <regex.h>
int regcomp (regex_t *_Restrict_ __preg,
const char *_Restrict_ __pattern,
int __cflags)
{
static int (*orig) (regex_t *_Restrict_ __preg,
const char *_Restrict_ __pattern,
int __cflags) = 0;
if (!orig)
orig = (int (*) (regex_t *_Restrict_ __preg,
const char *_Restrict_ __pattern,
int __cflags)) dlsym (RTLD_NEXT, "regcomp");
return (*orig)(__preg, __pattern, __cflags & ~REG_ICASE);
}
Então você pode ver seu efeito, por exemplo, procurando o zshpacote cuja descrição contém Zsh is a UNIX command interpreter:
$ apt-cache show zsh
Package: zsh
[...]
Description-en_GB: shell with lots of features
Zsh is a UNIX command interpreter (shell) usable as an interactive login
[...]
Isso pode ser usado para qualquer coisa que use a API / case-insensive.solibc . Você pode dizer se isso ocorre para uma correspondência regular específica com um depurador ou, por exemplo.regcomp()regexec()ltrace
Com int regcomp(addr, string, bitvec(int));adicionado a ~/.ltrace.conf:
(com sinalizadores aqui mostrados como vetor de bits com 0 sendo REG_EXTENDEDe 1 REG_ICASE)
Veja como aptitudetambém invoca regcomp()indiretamente em algumas bibliotecas apt onde nosso desligamento REG_ICASEpode causar problemas.
Certifique-se também de não usar isso para outra coisa senão searchem aptitude. Em particular, como essa $LD_PRELOADvariável será passada para todos os comandos que ela executa, você não desejará instalar nenhum pacote aptitudeiniciado em tal ambiente. Nesse sentido, pré-carregar esse arquivo de objeto compartilhado /lib/x86_64-linux-gnu/ld-linux-x86-64.so.2 --preload "$PWD/case-sensitive.so" /usr/bin/aptitude search...seria preferível, pois garantiria que ele fosse pré-carregado apenas para arquivos aptitude.
EREs padrão não têm operadores para ativar ou desativar a insensibilidade a maiúsculas e minúsculas, mas os regexps perl têm (?i)(?-i), assim como os PCRE2, que é uma biblioteca destinada a trazer regexps perl para outras ferramentas. E os regexps perl são principalmente compatíveis com EREs.
E o PCRE2 tem suporte para uma API regcomp()/ regexec()padrão em sua libpcre-posixbiblioteca.
Isso torna relativamente fácil modificar aptitudepara usar PCRE2 em vez de EREs padrão.
Por exemplo, como PoC, tudo que eu precisava fazer era:
¹ embora no caso de GNU grep, o mecanismo de regex e API usado varie de acordo com a versão e vários fatores, provavelmente não usará o regcomp()/ regexec()da libc do sistema, mesmo em sistemas onde essa é a libc GNU.
aptitude
usa o POSIXregcomp()
/regexec()
API da biblioteca C do sistema para fazer correspondência de regexp e chamadasregcomp()
comREG_ICASE | REG_EXTENDED
flags , para que você obtenha basicamente o mesmo quegrep -iE
¹ e não há suporte integrado para desativar a insensibilidade a maiúsculas e minúsculas.Agora, se você estiver disposto a despender um pouco de esforço, ainda há coisas que você pode fazer. Afinal, é tudo software gratuito e de código aberto, então nunca há limite no que você pode fazer.
Por exemplo, você poderia interceptar as
regcomp()
invocações da função libc através de umLD_PRELOAD
truque para remover esseREG_ICASE
sinalizador:Então você pode ver seu efeito, por exemplo, procurando o
zsh
pacote cuja descrição contémZsh is a UNIX command interpreter
:Isso pode ser usado para qualquer coisa que use a API /
case-insensive.so
libc . Você pode dizer se isso ocorre para uma correspondência regular específica com um depurador ou, por exemplo.regcomp()
regexec()
ltrace
Com
int regcomp(addr, string, bitvec(int));
adicionado a~/.ltrace.conf
:(com sinalizadores aqui mostrados como vetor de bits com 0 sendo
REG_EXTENDED
e 1REG_ICASE
)Veja como
aptitude
também invocaregcomp()
indiretamente em algumas bibliotecas apt onde nosso desligamentoREG_ICASE
pode causar problemas.Certifique-se também de não usar isso para outra coisa senão
search
emaptitude
. Em particular, como essa$LD_PRELOAD
variável será passada para todos os comandos que ela executa, você não desejará instalar nenhum pacoteaptitude
iniciado em tal ambiente. Nesse sentido, pré-carregar esse arquivo de objeto compartilhado/lib/x86_64-linux-gnu/ld-linux-x86-64.so.2 --preload "$PWD/case-sensitive.so" /usr/bin/aptitude search...
seria preferível, pois garantiria que ele fosse pré-carregado apenas para arquivosaptitude
.GNU
ed
também usa a API regex POSIX da libc:EREs padrão não têm operadores para ativar ou desativar a insensibilidade a maiúsculas e minúsculas, mas os regexps perl têm
(?i)
(?-i)
, assim como os PCRE2, que é uma biblioteca destinada a trazer regexps perl para outras ferramentas. E os regexps perl são principalmente compatíveis com EREs.E o PCRE2 tem suporte para uma API
regcomp()
/regexec()
padrão em sualibpcre-posix
biblioteca.Isso torna relativamente fácil modificar
aptitude
para usar PCRE2 em vez de EREs padrão.Por exemplo, como PoC, tudo que eu precisava fazer era:
Crie um
src/regex.h
como:Então construa com:
Que falhou por causa do arquivo
-lpcre2-posix
. E tudo que eu tive que fazer foi:(aqui usando a
MAYBE_LIBGTK
variável make não definida referenciada no estágio de vinculação para evitar a necessidade de modificar qualquer arquivo).Então agora tenho um
aptitude
usoPCRE2
de regexps:¹ embora no caso de GNU
grep
, o mecanismo de regex e API usado varie de acordo com a versão e vários fatores, provavelmente não usará oregcomp()
/regexec()
da libc do sistema, mesmo em sistemas onde essa é a libc GNU.