在 SQL Server Management Studio (SSMS) 2008 R2 中,我希望将格式不太正确的 CSV 导入到数据库表中。我试图在<database name>
-> Tasks
->处使用向导Import Data
。
与 CSV“标准”的区别
- 空值由逗号之间的空格表示
- 一些字段中间有逗号并且没有引号转义
- 除了标题行(WTF??),所有行都有一个终端逗号
我最终通过在导入前编辑 CSV 手动解决了这些问题。问题 2 已通过将导致它的 4 个单元格值系列的逗号替换为破折号来解决。第 3 期我通过搜索和替换这些终端逗号来解决。问题 1,这是数字字段的问题,也有搜索和替换, ,
-> ,,
。
当我的文件最终正确导入时,空值被替换为零,即使我在字段定义中允许空值。
我的基本问题:有没有一种方法可以在 SSMS 导入期间更改CAST
/CONVERT
操作的代码?我可以访问 SQL 代码的唯一阶段是在创建的表的字段定义中(从Select Source Tables and Views
-> Edit Mappings
-> Edit SQL
- 当且仅当我没有更改Select Source Tables
页面上的目标表名称时才可用),但是只是为了CREATE TABLE
定义,根本没有解决导入过程。在我看来,我应该能够允许将单字符空格字符串转换为数字时转换为空值(而不是向导失败并声明值超出范围)。此外,空字符串当然应该转换为空值整数,而不是 0。
我可以保存一个 SSIS 包,但我不清楚如何编辑和运行它以实现我想做的事情。有没有我可以编辑的模板文件,以允许将空字符串转换为空整数值(就像这里的东西......)?有没有办法使用部分导入向导来生成 tSQL 代码?我应该使用BULK INSERT
语句而不是向导吗?
导入/导出向导在幕后构建一个 SSIS 包,但向导构建的包仅执行 ETL 的 E 和 L(提取、转换、加载)。您正在寻找的是T,因为您需要将这些奇怪的数据转换为更易于管理的数据。
对于奇怪的标题行,您始终可以指定没有标题行,连接管理器应该跳过 N 行。
不幸的是,当有嵌入式定界符时,您对解析本身无能为力。从逻辑上讲,您可以看到密苏里州堪萨斯城全是一个字段,但解析器过于简单,会在分隔符处打断字符串,露出一个转义字符。
对于空格而不是空字符串,Import-Export 向导的方法是导入到一个包含所有 varchar 列的表,然后编写一个提取查询,执行任何首选魔术以使其成为 NULL
NULLIF(RTRIM(MyCol), '') AS MyCol
给未来读者的随机笔记
如果您使用的是 2005 或 2008,那么获得 SSIS 编辑器 BIDS(商业智能设计工作室)的唯一方法是拥有 SQL Server 安装介质的副本。2012+ Microsoft 允许下载和安装 SQL Server Data Tools-BI 版本,而无需安装 SQL Server。
导入/导出向导在所有版本的 SQL Server 中都可用,包括 Express,但这里的限制是如果您使用的是 Express,则无法保存生成的 SSIS 包。所有其他版本都可以正常工作。