AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题

问题[azure-sql-data-warehouse](dba)

Martin Hope
Neil P
Asked: 2020-03-25 07:34:33 +0800 CST

如何忽略 parquet/polybase 导入中的列?

  • 2

我正在使用 polybase 导入镶木地板文件。

随着时间的推移,我们可能会在文件中添加或删除命名列。

当我添加一个额外的列时,我收到以下错误:

由于内部错误,外部文件访问失败:'文件 test.parquet:HdfsBridge::CreateRecordReader - 创建记录读取器时遇到意外错误:HadoopExecutionException:列数不匹配。源文件有 16 列,外部表定义有 15 列。

这是因为我添加了一个不在外部表定义中的附加列。

由于 parquet 包含文件模式并且外部表知道每列的名称,有没有办法可以设置它忽略额外未使用的列?

azure-sql-data-warehouse polybase
  • 1 个回答
  • 679 Views
Martin Hope
Nick Haslam
Asked: 2020-02-22 08:08:44 +0800 CST

如何防止删除表但允许在模式中创建它们

  • 1

是否可以在特定架构中允许用户创建表并从中进行选择,但不允许他们在初始创建后删除或更新行,并防止他们删除它?

Create Table as Select需要 Select 的选择权限,但是Create Table需要 Create table 和 Alter Schema on Schema。

Alter Schema 权限还包括删除表的权限,这是我们不想要的。

我们正在使用 Azure SQL 数据仓库,所以不能使用触发器..

sql-server azure-sql-data-warehouse
  • 1 个回答
  • 297 Views
Martin Hope
Neil P
Asked: 2018-05-19 01:38:59 +0800 CST

为什么循环分布更适合偏斜数据集?

  • 1

我有一个倾斜的数据集,其中大多数行落入我的最佳候选分布键的最大 10 个值中。我的数据由两个大表组成,它们只共享两个键——我最好的候选键,再加上另一个,但那个键在 80% 的时间里是空的,所以我把它作为一个选项打折了。

传统观点认为,如果数据有偏差,我应该使用循环分布。查看表上连接生成的解释计划,我看到我的候选列是随机移动的随机键。这让我怀疑我是否应该将分布从循环法更改为散列分布,从而节省每次执行时移动数据所需的时间。

我的逻辑正确吗?我觉得这与使用分布式 sql 时的传统观念背道而驰。我不希望有任何不需要此连接的查询,因此其他人可能会从中看到好处。

azure-sql-data-warehouse
  • 1 个回答
  • 907 Views
Martin Hope
Brian Vallelunga
Asked: 2018-05-11 06:36:22 +0800 CST

如何判断 Azure SQL DW 是否使用二级索引?

  • 1

使用 Azure SQL DW,我在表中的单个列上创建了二级索引,但我不确定我的查询是否使用过该索引。性能仍然很慢,但我正在搜索大约 70 亿行数据。

我的表本质上是:

CREATE TABLE FactBusinessEvent
(
    [EmailAddress] [nvarchar](200) NOT NULL,
    [EventDate] [datetime] NOT NULL,
    [EventDate_key] [int] NOT NULL,
   -- OTHER COLUMNS HERE
)
WITH
(
    DISTRIBUTION = HASH ( [EmailAddress] ),
    CLUSTERED COLUMNSTORE INDEX
);

CREATE INDEX IX_FactBusinessEvent_EmailAddress ON FactBusinessEvent
(
   EmailAddress ASC
);

我的查询是:

SELECT * FROM FactBusinessEvent WHERE EmailAddress = '[email protected]'

使用 SSMS 17.6,我可以显示估计的查询计划,它完全忽略二级索引,显示表中的单个Get。我似乎无法在 SQL DW 中使用提示,那么还有什么可以尝试的吗?

感谢您的任何见解。

index azure-sql-data-warehouse
  • 1 个回答
  • 230 Views
Martin Hope
Neil P
Asked: 2018-02-21 04:14:06 +0800 CST

select 以批处理模式运行,但 CTAS 以行模式运行

  • 1

我有相同的查询,当作为选择语句运行时显示为以批处理模式运行,但当相同查询是 CTAS 操作的选择部分时显示为行模式。两个表(加上结果表)都是分布对齐的。

为什么是这样?显然,如果可能的话,我希望它以批处理模式运行。

导致行模式执行:

create table mytable1
with
(
    distribution = hash(c1)
)
as

询问:

with  filterData as 
(
    select 
        a
        ,b
        ,c
        ,d
        ,DateStamp
    from [DW_reporting].[table1] 
    where num > 0
)

    select 
        p.[DateStamp]
        ,p.[a1]
        ,p.b1
        ,p.c1
        ,p.d1
        ,e.a
        ,e.b
        ,case when e.d is not null then 1 else 0 end as Flag
    from SOmeOtherTable p
    left join filterData e on e.a = p.a1
                                            and e.c = p.c1
                                            and e.DateStamp < p.DateStamp       
azure-sql-data-warehouse columnstore
  • 1 个回答
  • 52 Views
Martin Hope
Neil P
Asked: 2017-12-23 08:05:55 +0800 CST

Azure SQL DW 是否支持分区视图?

  • 4

我在数据仓库中有一个非常昂贵的连接,它不是分布对齐的。不幸的是,连接键可以为空,并且只有一半的数据有值,这意味着它不是分布键的良好候选者。

是否可以创建一个分区视图,其中表的空一半是循环分布的,另一半是分布在可用键值上的?

azure-sql-data-warehouse
  • 1 个回答
  • 140 Views
Martin Hope
Neil P
Asked: 2017-07-27 03:03:14 +0800 CST

Azure Sql 数据仓库 - 有什么办法可以看到真正的查询计划吗?

  • 2

Azure SQL DWH / PDW 具有EXPLAIN显示并行查询计划的关键字。这对于查看数据移动操作非常有用,但是我想知道是否有与传统 sql server 查询计划等效的方法。我正在假设仅仅因为没有任何数据移动,并不一定意味着查询得到了很好的优化。

azure azure-sql-data-warehouse
  • 1 个回答
  • 509 Views
Martin Hope
Neil P
Asked: 2017-07-08 01:15:40 +0800 CST

SQL 数据仓库 - 是否可以将整个表切换到分区?

  • 1

可能是个愚蠢的问题,但我想知道是否可以将整个表切换为更大表的分区?

我猜不会,因为无法使用检查约束来约束分区边界上的表。

azure-sql-data-warehouse
  • 1 个回答
  • 903 Views
Martin Hope
Neil P
Asked: 2017-07-04 02:53:37 +0800 CST

Azure SQL 数据仓库 - 事务限制是否适用于 CTAS 操作?

  • 0

Azure SQL 数据仓库对事务的最大大小有限制(如此处记录)。由于不能在事务内执行 CTAS 操作,我想知道这些限制是否仍然适用?

azure-sql-data-warehouse
  • 1 个回答
  • 628 Views
Martin Hope
Neil P
Asked: 2017-06-27 03:23:17 +0800 CST

如何在 sql azure 数据仓库中添加检查约束?

  • 2

我想在 azure data warehouse中的表中添加一个检查约束。

我有以下脚本:

alter table [FactTbl_Test] add constraint Ck_Test_id check ([Test_Id] != 'Unknown')

这会导致以下错误:

第 2 行第 74 列的解析错误:“检查”附近的语法不正确。

编辑:

如果在表声明中创建约束,也会出现同样的错误。

azure-sql-data-warehouse
  • 3 个回答
  • 3726 Views

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目

    • 12 个回答
  • Marko Smith

    如何让sqlplus的输出出现在一行中?

    • 3 个回答
  • Marko Smith

    选择具有最大日期或最晚日期的日期

    • 3 个回答
  • Marko Smith

    如何列出 PostgreSQL 中的所有模式?

    • 4 个回答
  • Marko Smith

    列出指定表的所有列

    • 5 个回答
  • Marko Smith

    如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

    • 4 个回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Martin Hope
    Jin 连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane 如何列出 PostgreSQL 中的所有模式? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh 为什么事务日志不断增长或空间不足? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland 列出指定表的所有列 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney MySQL 能否合理地对数十亿行执行查询? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx 如何监控大型 .sql 文件的导入进度? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve