是否有任何 MySQL 基准测试工具？[关闭]

Question

Asked: 2021-10-01 22:10:06 +0800 CST2021-10-01 22:10:06 +0800 CST 2021-10-01 22:10:06 +0800 CST

自加入表获取一对值但无法收到预期结果

772

我正在尝试自我加入关系演员（movie_id，cast_id，cast_name）。我想查询一对演员至少一起出现在 1 部电影中。必须排除自身对，并保留镜像对。这是关系表：

电影编号	cast_id	cast_name
12345	10	中
12340	10	中
12341	10	中
12342	10	中
12343	11	蒂
12340	12	尼
12341	12	尼
12342	12	尼
12343	12	尼
12340	13	大卫
12345	12	尼

这是我尝试过的：

SELECT c.cast_id, c2.cast_id, c.movie_id
FROM casts c, casts c2
WHERE c.cast_id != c2.cast_id AND c.movie_id = c2.movie_id;

我没有得到成对的不同cast_id，而是成对的相同cast_id。

cast_id	cast_id	电影编号
10	10	12345
10	10	12340
10	10	12340
10	10	12341
10	10	12342
11	11	12343
12	12	12340
12	12	12340
12	12	12341
12	12	12342
12	12	12343
13	13	12340
13	13	12340
12	12	12345

但是，如果我尝试将其中一个属性替换为cast_name喜欢，我会得到不同的演员对：

SELECT c.cast_name, c2.cast_id, c.movie_id
FROM casts c, casts c2
WHERE c.cast_id != c2.cast_id AND c.movie_id = c2.movie_id;

cast_id	cast_id	电影编号
尼	10	12345
大卫	10	12340
尼	10	12340
尼	10	12341
尼	10	12342
尼	11	12343
大卫	12	12340
中	12	12340
中	12	12341
中	12	12342
蒂	12	12343
尼	13	12340
中	13	12340
中	12	12345

您能否解释一下这种行为的原因以及如何解决它以获得预期的结果？谢谢！

1 个回答

Voted

Vérace · Answer 1 · 2021-10-02T09:35:24+08:00

为了解决您的问题，我执行了以下操作（下面的所有代码都可以在此处的小提琴中找到）：

CREATE TABLE actor
(
  movie_id SMALLINT NOT NULL,
  cast_id  SMALLINT NOT NULL,
  cast_name TEXT NOT NULL
);

并填充它（注意这些对作为注释 - 有 7 对）：

INSERT INTO actor VALUES

(12340, 13, 'David'),  -- David/Nhi, David/Trung, Nhi/Trung - ORDER BY cast_name
(12340, 12, 'Nhi'),
(12340, 10, 'Trung'),

(12341, 12, 'Nhi'),  -- Nhi/Trung
(12341, 10, 'Trung'),


(12342, 12, 'Nhi'),  -- Nhi/Trung
(12342, 10, 'Trung'),

(12343, 12, 'Nhi'),   -- Nhi/Thi
(12343, 11, 'Thi'),

(12345, 12, 'Nhi'),    -- Nhi/Trung
(12345, 10, 'Trung'),

--
--  Three extra records with actors who share a surname - added by me.
--

(12999, 25, 'Nguyen'), -- Nguyen(25)/Nguyen(26) - Nguyen(25)/Nguyen(27) - Nguyen(26)/Nguyen(27)
(12999, 26, 'Nguyen'),
(12999, 27, 'Nguyen');

有 3 种可能的方法来做到这一点。

方法1（使用`cast_name`）：

SELECT 
  a1.movie_id, a1.cast_name, a1.cast_id,
  a2.movie_id, a2.cast_name, a2.cast_id
FROM 
  actor a1
JOIN actor a2
  ON  a1.movie_id = a2.movie_id
  AND a1.cast_name < a2.cast_name              -- note cast_name
ORDER BY a1.movie_id, a1.cast_name, a2.cast_name;

结果：

movie_id    cast_name   cast_id     movie_id    cast_name   cast_id
   12340        David        13        12340          Nhi        12
   12340        David        13        12340        Trung        10
   12340          Nhi        12        12340        Trung        10
   12341          Nhi        12        12341        Trung        10
   12342          Nhi        12        12342        Trung        10
   12343          Nhi        12        12343          Thi        11
   12345          Nhi        12        12345        Trung        10

这种方法的优点是，如果需要，它会按字母顺序ORDER BY在记录的下方 ( ) 和记录之间( a1.cast_name < a2.cast_name) 显示名称。最大的缺点是3个重复Nguyen的s已经消失了！

方法2（使用`cast_id`）：

SELECT 
  a1.movie_id, a1.cast_name, a1.cast_id,
  a2.movie_id, a2.cast_name, a2.cast_id
FROM 
  actor a1
JOIN actor a2
  ON  a1.movie_id = a2.movie_id
  AND a1.cast_id < a2.cast_id                    -- note cast_id
ORDER BY a1.movie_id, a1.cast_name, a2.cast_name;

结果：

movie_id    cast_name   cast_id     movie_id    cast_name   cast_id
   12340          Nhi        12        12340        David        13
   12340        Trung        10        12340        David        13
   12340        Trung        10        12340          Nhi        12
   12341        Trung        10        12341          Nhi        12
   12342        Trung        10        12342          Nhi        12
   12343          Thi        11        12343          Nhi        12
   12345        Trung        10        12345          Nhi        12
   12999       Nguyen        25        12999       Nguyen        26
   12999       Nguyen        25        12999       Nguyen        27
   12999       Nguyen        26        12999       Nguyen        27

这里的优点是我们保留了Nguyen重复项，但现在名称没有按字母顺序在记录中排序。

方法3（复杂）：

SELECT 
  a1.movie_id, 
  CASE
    WHEN a1.cast_name = a2.cast_name THEN a1.cast_name
    ELSE LEAST(a1.cast_name, a2.cast_name)
  END AS l_name,
  CASE
    WHEN a1.cast_name = a2.cast_name THEN a1.cast_id
    ELSE 
    (
      SELECT a.cast_id FROM actor a 
      WHERE a.cast_name = LEAST(a1.cast_name, a2.cast_name)
      AND   a.movie_id = a1.movie_id
    )
  END AS c1_id,
  a2.movie_id, 
  CASE
    WHEN a1.cast_name = a2.cast_name THEN a2.cast_name
    ELSE GREATEST(a1.cast_name, a2.cast_name)
  END AS g_name,
  CASE
    WHEN a1.cast_name = a2.cast_name THEN a2.cast_id
    ELSE 
    (
      SELECT a.cast_id FROM actor a 
      WHERE a.cast_name = GREATEST(a1.cast_name, a2.cast_name)
      AND   a.movie_id = a1.movie_id
    )
  END AS c2_id
FROM 
  actor a1
JOIN actor a2
  ON  a1.movie_id = a2.movie_id
  AND a1.cast_id < a2.cast_id
ORDER BY a1.movie_id, l_name, g_name;

结果：

movie_id    l_name  c1_id   movie_id    g_name  c2_id
   12340     David     13      12340       Nhi     12
   12340     David     13      12340     Trung     10
   12340       Nhi     12      12340     Trung     10
   12341       Nhi     12      12341     Trung     10
   12342       Nhi     12      12342     Trung     10
   12343       Nhi     12      12343       Thi     11
   12345       Nhi     12      12345     Trung     10
   12999    Nguyen     25      12999    Nguyen     26
   12999    Nguyen     25      12999    Nguyen     27
   12999    Nguyen     26      12999    Nguyen     27
10 rows

瞧！结果按要求排序，我们有重复的Nguyen您可以根据需要省略字段。

这个最终的解决方案使用了LEAST()andGREATEST()函数（在这里解释得很好），这是 SQL 库中使用率最低的两个函数！

将来，在问这样的问题时，您能否提供一下您的表结构和数据。

自加入表获取一对值但无法收到预期结果

方法1（使用`cast_name`）：

方法2（使用`cast_id`）：

方法3（复杂）：

连接到 PostgreSQL 服务器：致命：主机没有 pg_hba.conf 条目

如何让sqlplus的输出出现在一行中？

选择具有最大日期或最晚日期的日期

如何列出 PostgreSQL 中的所有模式？

列出指定表的所有列

如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

你如何mysqldump特定的表？

使用 psql 列出数据库权限

如何从 PostgreSQL 中的选择查询中将值插入表中？

如何使用 psql 列出所有数据库和表？

自加入表获取一对值但无法收到预期结果

1 个回答

方法1（使用cast_name）：

方法2（使用cast_id）：

方法3（复杂）：

相关问题

方法1（使用`cast_name`）：

方法2（使用`cast_id`）：