我有一个每天生成的文本文件。它是一种固定宽度的格式,但有一个令人沮丧的例外。第三列 (NAME) 的宽度可变。该列的长度始终等于数据集中最长的名称 + 1 个空格。这使得每天的文件都有不同的列起点和终点。
有没有人有聪明的方法来每天处理导入这个文件?更改源程序不是一种选择。
我愿意在导入前修改文件。
我愿意使用几乎任何工具,包括但不限于 SSIS、C#、PowerShell。
我正在寻找具有高可靠性的最不“混乱”的解决方案。
例子
A/R Patient PICASI, LINDA 00691685 90409843 Inpatient
Revenue Patient SIMPSON, RHASIRA B 00000000 00000000 Emergency
根据您的示例数据,看起来总共有 6 列。
COL1、COL2、COL4、COL5、COL6 = 全部固定宽度。
COL3 = 这是给定日期的固定宽度,但它每天都在变化(根据我的理解)。
您应该能够根据任何给定线的长度每天计算出 COL3 的宽度。你知道 COL1,2,4,5,6 都是固定宽度的。取线总数并减去 COL1、2、4、5、6 以获得 COL3 每天的宽度。
获得 COL3 的宽度后,您将能够计算出所有的起点和终点。