AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / coding / Perguntas / 76939838
Accepted
Pouria Paimard
Pouria Paimard
Asked: 2023-08-20 22:20:34 +0800 CST2023-08-20 22:20:34 +0800 CST 2023-08-20 22:20:34 +0800 CST

Comparando e classificando valores entre colunas em Python (com a coluna "Não correspondente")

  • 772

Pergunta: Estou trabalhando em um projeto Python onde tenho um dataset com duas colunas: "Big List" e "Small List". Meu objetivo é comparar os valores na coluna "Pequena lista" com os valores na coluna "Grande lista" e classificá-los de acordo. Se um valor da coluna "Small List" for encontrado na coluna "Big List", desejo classificar a linha correspondente na coluna "Small List". Além disso, se um valor da coluna "Small List" não for encontrado na coluna "Big List", desejo listá-lo em uma nova coluna chamada "Not Matched to Big List".

Os valores na "Big List" não são exclusivos, mas os valores na "Small List" são exclusivos.

Aqui está um exemplo:

Grande Lista Lista Pequena
10 17
2 15
15 42
17 31
30 45
40 30
45
47
50

Nesse caso, quero comparar cada valor na coluna "Pequena lista" com os valores na coluna "Grande lista". Se for encontrada uma correspondência, desejo classificar a linha correspondente na coluna "Lista pequena". Se uma correspondência não for encontrada, desejo listar o valor na coluna "Não correspondente à lista grande".

Resultado esperado:

Grande Lista Lista Pequena Não corresponde à lista grande
10 31
2 42
15 15
17 17
30 30
40
45 45
47
50

Estou lutando para classificar a linha na coluna "Small List" quando uma correspondência é encontrada e como preencher a coluna "Not Matched to Big List" quando não há correspondência. Qualquer ajuda ou sugestão sobre como conseguir isso seria muito apreciada!

Aqui está o código que tenho até agora:

import pandas as pd

data = {'Big List': [10,2,15,17,30,40,45,47,50], 'Small List': [17,15,42,31,45,30]}
df = pd.DataFrame(data)

# Loop through rows and compare values
for index, row in df.iterrows():
    if row['Small List'] in df['Big List']:
        # Sort the row in the "Small List" column
        # Stuck here
    else:
        # Add value to "Not Matched to Big List" column
        # Stuck here

print(df)
python-3.x
  • 2 2 respostas
  • 25 Views

2 respostas

  • Voted
  1. Best Answer
    gtomer
    2023-08-20T22:44:33+08:002023-08-20T22:44:33+08:00

    Aqui está (embora eu deva acrescentar que esta solução é bastante complicada, pois o dataframe do Pandas deve expressar relações entre as diferentes colunas e o que é feito aqui não tem):

    import pandas as pd
    
    data = {'Big List': [10,2,15,17,30,40,45,47,50], 'Small List': [17,15,42,31,45,30, None, None, None]}
    df = pd.DataFrame(data)
    new_df = df[['Big List']].merge(df[['Small List']], left_on='Big List', right_on='Small List', how='left')
    new_df.sort_values(by='Big List', inplace=True)
    notfound_df = df[['Big List']].merge(df[['Small List']], left_on='Big List', right_on='Small List', how='right')
    notfound_df = notfound_df[notfound_df['Big List'].isna()].dropna(how='all')
    notfound_list = notfound_df['Small List'].to_list()
    for i in range(new_df.shape[0] - len(notfound_list)):
        notfound_list.append(None)
    new_df = pd.concat([new_df, pd.DataFrame(notfound_list, columns=['Not Matched to Big List'])], axis=1)
    new_df
    
       Big List  Small List  Not Matched to Big List
    1         2         NaN                     31.0
    0        10         NaN                     42.0
    2        15        15.0                      NaN
    3        17        17.0                      NaN
    4        30        30.0                      NaN
    5        40         NaN                      NaN
    6        45        45.0                      NaN
    7        47         NaN                      NaN
    8        50         NaN                      NaN
    
    • 1
  2. Andrej Kesely
    2023-08-21T01:23:04+08:002023-08-21T01:23:04+08:00

    Outra solução:

    df = pd.concat(
        [
            df,
            pd.Series(
                np.sort(
                    df.loc[~df["Small List"].isin(df["Big List"]), "Small List"]
                    .dropna()
                    .values
                ),
                name="Not Matched to Big List",
            ),
        ],
        axis=1,
    )
    
    df["Small List"] = df.loc[df["Big List"].isin(df["Small List"]), "Big List"]
    
    print(df.replace(np.nan, None))
    

    Estampas:

       Big List Small List Not Matched to Big List
    0        10       None                    31.0
    1         2       None                    42.0
    2        15       15.0                    None
    3        17       17.0                    None
    4        30       30.0                    None
    5        40       None                    None
    6        45       45.0                    None
    7        47       None                    None
    8        50       None                    None
    
    • 1

relate perguntas

  • Preenchendo valores ausentes no dataframe do Pandas usando outro dataframe

  • Comparando e classificando valores em duas colunas de um DataFrame e classificando na mesma linha em python

  • Esta versão do ChromeDriver suporta apenas 114

  • Por que lista vazia para funcionar?

  • A configuração do Python-Django Multi-Index of Pandas DataFrame não agrupa/mescla o último índice

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    destaque o código em HTML usando <font color="#xxx">

    • 2 respostas
  • Marko Smith

    Por que a resolução de sobrecarga prefere std::nullptr_t a uma classe ao passar {}?

    • 1 respostas
  • Marko Smith

    Você pode usar uma lista de inicialização com chaves como argumento de modelo (padrão)?

    • 2 respostas
  • Marko Smith

    Por que as compreensões de lista criam uma função internamente?

    • 1 respostas
  • Marko Smith

    Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

    • 1 respostas
  • Marko Smith

    java.lang.NoSuchMethodError: 'void org.openqa.selenium.remote.http.ClientConfig.<init>(java.net.URI, java.time.Duration, java.time.Duratio

    • 3 respostas
  • Marko Smith

    Por que 'char -> int' é promoção, mas 'char -> short' é conversão (mas não promoção)?

    • 4 respostas
  • Marko Smith

    Por que o construtor de uma variável global não é chamado em uma biblioteca?

    • 1 respostas
  • Marko Smith

    Comportamento inconsistente de std::common_reference_with em tuplas. Qual é correto?

    • 1 respostas
  • Marko Smith

    Somente operações bit a bit para std::byte em C++ 17?

    • 1 respostas
  • Martin Hope
    fbrereto Por que a resolução de sobrecarga prefere std::nullptr_t a uma classe ao passar {}? 2023-12-21 00:31:04 +0800 CST
  • Martin Hope
    æ¯”å°”ç›–å­ Você pode usar uma lista de inicialização com chaves como argumento de modelo (padrão)? 2023-12-17 10:02:06 +0800 CST
  • Martin Hope
    Amir reza Riahi Por que as compreensões de lista criam uma função internamente? 2023-11-16 20:53:19 +0800 CST
  • Martin Hope
    Michael A formato fmt %H:%M:%S sem decimais 2023-11-11 01:13:05 +0800 CST
  • Martin Hope
    God I Hate Python std::views::filter do C++20 não filtrando a visualização corretamente 2023-08-27 18:40:35 +0800 CST
  • Martin Hope
    LiDa Cute Por que 'char -> int' é promoção, mas 'char -> short' é conversão (mas não promoção)? 2023-08-24 20:46:59 +0800 CST
  • Martin Hope
    jabaa Por que o construtor de uma variável global não é chamado em uma biblioteca? 2023-08-18 07:15:20 +0800 CST
  • Martin Hope
    Panagiotis Syskakis Comportamento inconsistente de std::common_reference_with em tuplas. Qual é correto? 2023-08-17 21:24:06 +0800 CST
  • Martin Hope
    Alex Guteniev Por que os compiladores perdem a vetorização aqui? 2023-08-17 18:58:07 +0800 CST
  • Martin Hope
    wimalopaan Somente operações bit a bit para std::byte em C++ 17? 2023-08-17 17:13:58 +0800 CST

Hot tag

python javascript c++ c# java typescript sql reactjs html

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve