我为阿拉伯语制作了字典文件,以便在 LibreOffice 和 LyX 中使用。它包含超过 270 万个阿拉伯语单词。
有时,我们可以用 来写这个词ه
,有时ة
如果它在词尾,我们可以用 。
我想用一个带有sed
or的脚本tr
来表示,如果有两个单词相同,除了最后一个字母,并且这两个单词的最后一个字母是ة
and ه
,删除包含 的单词ه
。
示例输入:
الجنة
الجنه
الشجرة
الشجره
输出:
الجنة
الشجرة
我为阿拉伯语制作了字典文件,以便在 LibreOffice 和 LyX 中使用。它包含超过 270 万个阿拉伯语单词。
有时,我们可以用 来写这个词ه
,有时ة
如果它在词尾,我们可以用 。
我想用一个带有sed
or的脚本tr
来表示,如果有两个单词相同,除了最后一个字母,并且这两个单词的最后一个字母是ة
and ه
,删除包含 的单词ه
。
示例输入:
الجنة
الجنه
الشجرة
الشجره
输出:
الجنة
الشجرة
尝试这个:
我试图通过创建自定义来做一些更聪明的事情
LC_COLLATE
,但没有管理它;-)也许是这样的:
cat yourDictionary |grep -i yourWord |sed /$ه/d
/$ه/d
- 删除以特殊符号结尾的所有内容(d 标志用于删除)grep -i
- 以不区分大小写的方式匹配您还可以添加-w
到 grep 以完全匹配字符串