我想对目录中的所有文件运行此命令。
tesseract /home/kong/Documents/input/248.jpg stdout --psm 1 --oem 1 --dpi 300 tsv >/home/kong/Documents/input/ocr_output/input/248.tsv
输入和输出应具有相同的数字,如248.jpg
和248.tsv
。我尝试编写一个 python 脚本,它导致了分隔符问题。
有人可以帮我弄这个吗 ?我是 bash 新手。
这是我写的python脚本
comm = shlex.split(command)
out_dir = '/home/kong/Documents/input/ocr_output/input'
for file in tqdm(files):
base_name = os.path.basename(file)
number = base_name.split('.')[0]
out_path = '>' + out_dir + '/' + number + '.tsv'
comm[1] = file
comm[-1] = out_path
# tsv = number + '.tsv'
with open(out_path, 'w') as f:
subprocess.run(comm, shell=True, stdout=f)
尝试这个:
作为替代方案,您可以将此脚本与 Python 3.5 或更高版本一起使用。