AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / unix / 问题 / 779284
Accepted
Make42
Make42
Asked: 2024-07-01 17:43:48 +0800 CST2024-07-01 17:43:48 +0800 CST 2024-07-01 17:43:48 +0800 CST

删除文件中的重复项(不进行排序!)保留最后出现的项

  • 772

继https://www.baeldung.com/linux/history-remove-avoid-duplicates之后,我添加了

clean_history() {
    awk '!a[$0]++' $HOME/.bash_history > $HOME/.bash_history.tmp && mv $HOME/.bash_history.tmp $HOME/.bash_history
}
trap clean_history DEBUG # execute after every command

添加到我的 ~/.bashrc 文件中,以确保在执行每个命令后,删除重复的条目。这对我来说很重要,因为 kile(KDE LaTeX 编辑器)在历史记录中留下了大量“clear”和“cd ...”命令,这实际上会破坏单个 LaTeX 编写会话中的历史记录。而且我还没有找到任何方法可以阻止 kile 这样做。

无论如何……上面的代码行有效地删除了命令的所有后续条目,并将第一个条目保留在历史记录中。但是,我希望最后一个条目保留在历史记录中,并删除所有先前的条目。如何做到这一点?

顺便说一句:Kile 无视

HISTCONTROL=ignoredups:erasedups

因此使用这种方法似乎不是一个选择。

如果我们能够一起阻止凯尔写入历史,我也会很高兴。

非重复:

  • 删除文本文件中的重复条目将保留文件中的第一个条目
  • 那么如何删除文本文件中的重复行并获取删除的行数?
  • 如何停止 Bash 追加历史记录HISTCONTROL
bash
  • 4 4 个回答
  • 348 Views

4 个回答

  • Voted
  1. Stephen Kitt
    2024-07-01T17:51:19+08:002024-07-01T17:51:19+08:00

    您可以反转文件,处理它,然后将其反转回来。大多数系统都有tail -rGNU tac(或其 busybox 或 toybox 克隆)来实现这一点:

    (
      umask 077 # make sure the new ~/.bash_history remains private
      tac ~/.bash_history |
        awk '!seen[$0]++' |
        tac > ~/.bash_history.tmp &&
        mv ~/.bash_history.tmp ~/.bash_history
    )
    
    • 6
  2. Best Answer
    Kaz
    2024-07-02T15:45:07+08:002024-07-02T15:45:07+08:00
    awk '{ delete line[lnum[$0]]; line[NR] = $0; lnum[$0] = NR }
         END { for (n = 1; n <= NR; n++) { if (n in line) print line[n] } }'
    

    我们维护两个关联数组。line[i]给出行号的内容i。当我们扫描输入时,lnum[str]给出包含的最新行号str。

    在每个步骤中,我们首先line[]通过在反向索引中查找行号来从数组中删除当前看到的行lnum。然后,我们将当前行输入到数组中line,并将当前行号更新lnum为该行的最近出现。因此,如果当前行之前出现过,则会将其从数组中删除line并由新条目取代。

    然后最后我们只需遍历行号并打印line[i],前提是它尚未被删除。

    虽然该tac方法awk大大简化了代码,但命令的可移植性较差,并且增加了额外的传递。该解决方案仍然会根据看到的行(尽管只有一行)构建关联表。

    注意:我们希望在END块中只执行for (n in line) print line[n],但 Awk 不保证关联数组索引的顺序。我认为这在 GNU Awk 中可以工作,但不可移植。

    • 1
  3. waltinator
    2024-07-09T10:55:14+08:002024-07-09T10:55:14+08:00

    您可以kile通过以 方式调用它来防止污染您的历史记录unset HISTFILE;HISTSIZE=0 kile。

    另外,请参阅我的 AskUbuntu 回答: https://askubuntu.com/questions/80371/bash-history-handling-with-multiple-terminals/80882#80882

    • 1
  4. Matthew
    2024-07-09T06:08:43+08:002024-07-09T06:08:43+08:00

    我不会按照书面形式回答问题,而是会提出解决根本问题的建议。

    首先,如果您还没有这样做,请针对 Kile 提交错误报告;似乎至少应该有一个选项让 Kile 关闭 shell 历史记录。(当然,由于它可能无法依赖特定的 shell,这可能有点复杂,但例如运行特定的用户脚本仍然是一种解决方案,即使它需要更多的用户努力。)

    其次...由于我们已经在谈论摆弄.bashrc(我假设是由 Kile 运行的),更好的解决方案是教它.bashrc检测 shell 是否由 Kile 运行,并在这种情况下禁用历史记录:

    # in your .bashrc...
    has_ancestor() {
      i=( $(ps --no-headers -o ppid,cmd $1) )
      [ "${i[0]}" == 1 ] && return 1
      [ "$2" == "${i[1]##*/}" ] && return 0
      has_ancestor ${i[0]} "$2"
    }
    
    if has_ancestor $$ kile; then
      set -o history # ...or whatever
    fi
    

    这将从 shell 的 PID ( $$) 开始遍历进程树直到 pid 1,检查命令名称(##*/删除可能存在也可能不存在的前导路径)是否与某个指定名称(在本例中为kile)匹配。Kile 很可能是其正在运行的 shell 的父进程。(有多种方法可以与生成进程分离,但 Kile 不太可能这样做。至少 Konsole 不会这样做。)

    这也可能是矫枉过正;但ps --no-headers -o cmd $(ps --no-headers -o ppid $$)可能就足够了。无论如何,目标很简单;检测 bash 的父级/祖先是否是kile,并据此“做某事”。我猜“某事”是set -o history。

    • 0

相关问题

  • 通过命令的标准输出以编程方式导出环境变量[重复]

  • 从文本文件传递变量的奇怪问题

  • 虽然行读取保持转义空间?

  • `tee` 和 `bash` 进程替换顺序

  • 运行一个非常慢的脚本直到它成功

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    模块 i915 可能缺少固件 /lib/firmware/i915/*

    • 3 个回答
  • Marko Smith

    无法获取 jessie backports 存储库

    • 4 个回答
  • Marko Smith

    如何将 GPG 私钥和公钥导出到文件

    • 4 个回答
  • Marko Smith

    我们如何运行存储在变量中的命令?

    • 5 个回答
  • Marko Smith

    如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域?

    • 3 个回答
  • Marko Smith

    dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

    • 2 个回答
  • Marko Smith

    如何从 systemctl 服务日志中查看最新的 x 行

    • 5 个回答
  • Marko Smith

    Nano - 跳转到文件末尾

    • 8 个回答
  • Marko Smith

    grub 错误:你需要先加载内核

    • 4 个回答
  • Marko Smith

    如何下载软件包而不是使用 apt-get 命令安装它?

    • 7 个回答
  • Martin Hope
    user12345 无法获取 jessie backports 存储库 2019-03-27 04:39:28 +0800 CST
  • Martin Hope
    Carl 为什么大多数 systemd 示例都包含 WantedBy=multi-user.target? 2019-03-15 11:49:25 +0800 CST
  • Martin Hope
    rocky 如何将 GPG 私钥和公钥导出到文件 2018-11-16 05:36:15 +0800 CST
  • Martin Hope
    Evan Carroll systemctl 状态显示:“状态:降级” 2018-06-03 18:48:17 +0800 CST
  • Martin Hope
    Tim 我们如何运行存储在变量中的命令? 2018-05-21 04:46:29 +0800 CST
  • Martin Hope
    Ankur S 为什么 /dev/null 是一个文件?为什么它的功能不作为一个简单的程序来实现? 2018-04-17 07:28:04 +0800 CST
  • Martin Hope
    user3191334 如何从 systemctl 服务日志中查看最新的 x 行 2018-02-07 00:14:16 +0800 CST
  • Martin Hope
    Marko Pacak Nano - 跳转到文件末尾 2018-02-01 01:53:03 +0800 CST
  • Martin Hope
    Kidburla 为什么真假这么大? 2018-01-26 12:14:47 +0800 CST
  • Martin Hope
    Christos Baziotis 在一个巨大的(70GB)、一行、文本文件中替换字符串 2017-12-30 06:58:33 +0800 CST

热门标签

linux bash debian shell-script text-processing ubuntu centos shell awk ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve