我们自动生成的大多数文件都包含整数、小数、日期、时间,有时还包含 varchar。这是仪表数据。由于我们会将这些文件直接上传到 SQL Server 数据库,因此我们试图确定从我们的仪器自动生成最有效的文件格式。
将数据上传到 SQL Server 数据库最有效的文件格式是什么?我以为它会是文本格式,但是当我用 CSV 进行实验时,CSV 往往占用更少的空间,并且用户也更容易分析。
数据文件大小从 50K 到 250K 不等。只有几个 MB 范围。
我正在创建一个将数据上传到数据库的应用程序。我们将 LabView 用于我们的仪器数据,这就是我们想要标准化文件格式的地方。
我倾向于CSV。我对 XML 没有太多经验,所以我可能会认为,如果优势远远超过 CSV。我只关心质量控制方面的可读性。在某些情况下,用户可能希望在上传之前更改或修复某些数据。速度也很重要,但对于如此小的文件大小,我并不太担心。
通常,CSV 是非二进制(文本)数据的最小文件大小。XML 添加了大量使文件变大的 xml 代码。因此 CSV 往往导入速度更快。但是 XML 导入器可以处理更复杂的异常情况等。
在我的职业生涯中,我曾在四种不同类型的实验室从事仪器进口工作。在没有直接的 LIMS(实验室信息管理系统)到仪器接口系统的地方,我们发现分隔文本文件是编写工作导入脚本的最快速度。
CSV 是一个逗号分隔的文本文件。如果您的输入数据将包含逗号,那么使用不同的分隔符可能更有意义,例如管道字符:| CSV 文件或管道分隔文件通常遵循这样的规则,即从第 1 列到行尾回车的每一行/行文本代表数据库中的一行样本数据。然后在该行中,数据库中的每一列数据通过分隔符与其他列分开,分隔符可以是逗号或管道或您想要使用的任何内容。
只要数据随着时间的推移保持一致,文本文件就很棒。