AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 286110
Accepted
L M
L M
Asked: 2021-02-27 15:34:37 +0800 CST2021-02-27 15:34:37 +0800 CST 2021-02-27 15:34:37 +0800 CST

Como normalizar uma tabela com várias células que possuem vários valores?

  • 772

Então, estou fazendo uma tarefa em que pego uma lista enorme (mais de 30.000) de filmes na Wikipedia que têm várias colunas (como o nome do filme, o gênero, o elenco, o enredo etc.) e carrego no Elasticsearch. No entanto, depois de fazer isso, agora quero fazer com que a tabela esteja em pelo menos 1NF. Não tenho muita experiência em design de banco de dados e a última vez que fiz algo com o Normal Form foi há alguns anos. Então eu estou olhando para esta tabela e pensando, como eu poderia colocar isso no 1NF. É fácil se, por exemplo, houver apenas 1 coluna com vários valores, mas o que você faz quando há várias colunas com vários valores, como visto abaixo.

Nome do filme Diretor Elenco Gênero Página Wiki Enredo
Chimmie Fadden Out West Cecil B. DeMile Victor Moore Comédia, Ocidental https://en.wikipedia.org/wiki/Chimme_Fadden_Out_West Chimmie é enviada para o oeste...
20.000 Léguas Submarinas Stuart Paton Lois Alexander, Curtis Benton, Wallace Clarke, Allen Holubar Ação e aventura https://en.wikipedia.org/wiki/20,000_Leagues_Under_the_Sea_(1916_film) Um estranho...
O Gato e o Canário Paulo Leni Laura La Plante, Forrest Stanley, Creighton Hale Comédia, Terror, Mistério https://en.wikipedia.org/wiki/The_Cat_and_the_Canary_(1927_film)| Em um...

Você teria que fazer algo assim...

Nome do filme Diretor Elenco Gênero Página Wiki Enredo
Chimmie Fadden Out West Cecil B. DeMile Victor Moore Comédia https://en.wikipedia.org/wiki/Chimme_Fadden_Out_West Chimmie é enviada para o oeste...
Chimmie Fadden Out West Cecil B. DeMile Victor Moore Ocidental https://en.wikipedia.org/wiki/Chimme_Fadden_Out_West Chimmie é enviada para o oeste...
20.000 Léguas Submarinas Stuart Paton Luís Alexandre Ação https://en.wikipedia.org/wiki/20,000_Leagues_Under_the_Sea_(1916_film) Um estranho...
20.000 Léguas Submarinas Stuart Paton Luís Alexandre Aventura https://en.wikipedia.org/wiki/20,000_Leagues_Under_the_Sea_(1916_film) Um estranho...
20.000 Léguas Submarinas Stuart Paton Curtis Benton Ação https://en.wikipedia.org/wiki/20,000_Leagues_Under_the_Sea_(1916_film) Um estranho...
20.000 Léguas Submarinas Stuart Paton Curtis Benton Aventura https://en.wikipedia.org/wiki/20,000_Leagues_Under_the_Sea_(1916_film) Um estranho...
20.000 Léguas Submarinas Stuart Paton Wallace Clarke Aventura https://en.wikipedia.org/wiki/20,000_Leagues_Under_the_Sea_(1916_film) Um estranho...
20.000 Léguas Submarinas Stuart Paton Wallace Clarke Ação https://en.wikipedia.org/wiki/20,000_Leagues_Under_the_Sea_(1916_film) Um estranho...

etc? Certamente estou perdendo algo extremamente simples quando se trata de converter uma tabela com várias células com vários valores em 1NF, mas não tenho certeza do quê.

Obrigado.

database-design normalization
  • 2 2 respostas
  • 1386 Views

2 respostas

  • Voted
  1. nbk
    2021-02-27T16:07:05+08:002021-02-27T16:07:05+08:00

    Normalização é remover informações de tabelas, que são repetidas muitas vezes e ids como int são menores que qualquer texto.

    As tabelas de ponte que você precisa, porque você tem uma relação am:n entre filme e usuários (elenco, diretor, músico...)

    Ocupação é na minha opinião um atributo da relação entre filme e usuário

    Film (idfilm,Titel, plot,Wiki_Page, year,... )
    
    Film2user (idfilm,iduser,idtype)
    
    type  (idtype,occupation)
    
    user (iduser, Name, Birth,...)
    
    genre (idgenre,name)
    
    Film2genre(idfilm, idgenre)
    

    à medida que você desenvolve mais, você pode adicionar mais atributos ou tabelas se encontrar mais informações redundantes

    • 2
  2. Best Answer
    J.D.
    2021-02-27T20:37:56+08:002021-02-27T20:37:56+08:00

    Portanto, é muito fácil normalizar quando há vários campos, alguns com quantidades variadas de pontos de dados em um único campo da mesma linha. Basta seguir esta regra: Qualquer coluna que tenha vários pontos de dados dentro da coluna da mesma linha deve se tornar sua própria tabela. Então, no seu exemplo, isso poderia ser Caste Genre. É imediatamente aparente que essas duas colunas representam um relacionamento muitos para muitos devido ao fato de que há vários valores armazenados em uma única coluna da mesma linha.

    Como nbk menciona, você precisará de uma tabela de ligação/ponte para armazenar esse relacionamento muitos para muitos. Portanto, embora sua nova Casttabela possa ter colunas como CastId(chave primária), FirstName, e LastName, sua tabela de vinculação entre Caste Filmseria nomeada como FilmCaste teria o campo FilmId(da sua Filmtabela) com uma referência de chave estrangeira, e também teria o CastIdcom um referência de chave estrangeira para a Casttabela. Em seguida, cada linha nessa FilmCast tabela de vinculação representaria uma única Castpessoa específica para um único específico Film.

    Você repetiria essa mesma ideologia para cada outra coluna em sua Filmstabela com vários pontos de dados por linha. Depois de ter as tabelas apropriadas para cada coluna normalizada, você não precisará mais armazenar esses dados na Filmtabela principal e poderá remover essas colunas dela.

    • 2

relate perguntas

  • É melhor armazenar os valores calculados ou recalculá-los a pedido? [duplicado]

  • Armazenar vs calcular valores agregados

  • Quais são algumas maneiras de implementar um relacionamento muitos-para-muitos em um data warehouse?

  • As formas normalizadas superiores sempre atendem aos critérios das inferiores?

  • Recursos de exercícios de normalização

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

    • 12 respostas
  • Marko Smith

    Como fazer a saída do sqlplus aparecer em uma linha?

    • 3 respostas
  • Marko Smith

    Selecione qual tem data máxima ou data mais recente

    • 3 respostas
  • Marko Smith

    Como faço para listar todos os esquemas no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Listar todas as colunas de uma tabela especificada

    • 5 respostas
  • Marko Smith

    Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

    • 4 respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Martin Hope
    Jin conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane Como faço para listar todos os esquemas no PostgreSQL? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh Por que o log de transações continua crescendo ou fica sem espaço? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland Listar todas as colunas de uma tabela especificada 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney O MySQL pode realizar consultas razoavelmente em bilhões de linhas? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx Como posso monitorar o andamento de uma importação de um arquivo .sql grande? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve