我有一个文件夹,其中包含以下名称的 .txt 文件:
A_COR_001_I
A_COR_001_II
A_COR_002_I
A_COR_002_II
A_COR_003_I
A_COR_003_II
A_COR_003_III
A_COR_004_I
A_COR_004_II
A_COR_004_III
A_COR_004_IV
...
每个字符串末尾的罗马数字表示特定文档的最终草稿,由前面的阿拉伯数字标识,如 002。我正在尝试使用 list.files() 函数仅提取具有正则表达式模式的最终草稿,但问题是每个文档的草稿数量不可预测,所以我需要一种方法将每个文档的草稿分组在一起并挑选出编号最高的草稿,因此是 A_COR_004_IV 而不是 A_COR_004_III 或任何其他。关于如何继续有什么想法吗?提前致谢!