/usr/share/dict/words
我正在考虑在需要字典的项目的公共 GitHub 存储库中包含我的文件副本。这是一个坏主意吗?如果是的话,为什么?
我对隐私/安全(甚至法律?)方面特别感兴趣。是否有常见的程序可以将单词添加到该词典中,例如,如果我在拼写检查器中选择“添加到词典”?该文件是否可能包含任何敏感信息,例如我的用户名(我检查过,但没有,但可能存在我不想检查的类似内容)。浏览全部 104,334 个单词是不切实际的。也许只是usr
路上的事情让我不必要地担心。
我读过这些 关于这些词的来源的问题。然而,是否有可能添加或删除了任何单词?
我想如果没有任何改变,我就可以获得来源。但如果某些程序添加了有用的(非个人的)词语,我想保留它们。
如果它很重要,我正在运行 Ubuntu 23.10。但如果可能的话,我更喜欢一个稍微笼统的答案。
笔记
我完全清楚
但是,我对使用不同的列表而不是这个列表不感兴趣(在这种情况下,我宁愿只使用两者)。如果我使用列表,则有必要包含实际文件。
/usr/share/dict/words
非 root 用户通常无法修改它,因此您经常使用使用它进行拼写检查的程序不会修改它。事实上,由于它位于 中
/usr
,因此在大多数系统上它“属于”系统,并且只能通过系统更新进行修改(在您的情况下为 Ubuntu)。至少在 Linux 系统上,它通常是SCOWL(面向拼写检查器的单词列表)提供的单词列表之一。因此,只要您遵守许可条款,复制和分发就是安全的。另一种方法可能只是依赖于
/usr/share/dict/words
项目的用户系统 - 您提到您不想这样做,但在许多情况下该文件将与您系统上可用的文件相同。这甚至可以包括 CI——在典型的基于 Ubuntu 的 CI 环境中,安装wamerican
以获得默认的 US/usr/share/dict/words
文件。