我正在使用 polybase 导入镶木地板文件。
随着时间的推移,我们可能会在文件中添加或删除命名列。
当我添加一个额外的列时,我收到以下错误:
由于内部错误,外部文件访问失败:'文件 test.parquet:HdfsBridge::CreateRecordReader - 创建记录读取器时遇到意外错误:HadoopExecutionException:列数不匹配。源文件有 16 列,外部表定义有 15 列。
这是因为我添加了一个不在外部表定义中的附加列。
由于 parquet 包含文件模式并且外部表知道每列的名称,有没有办法可以设置它忽略额外未使用的列?