AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / coding / Perguntas / 77323901
Accepted
firmo23
firmo23
Asked: 2023-10-19 20:48:59 +0800 CST2023-10-19 20:48:59 +0800 CST 2023-10-19 20:48:59 +0800 CST

Substitua todos os NAs ou valores "N/A" em um conjunto de dados pela média de cada coluna existente

  • 772

No dataframe abaixo que possui colunas apenas com valores numéricos, quero encontrar ou NAs"N/A" de cada coluna e substituí-los pelo valor médio do restante das linhas de cada coluna

data <- structure(list(`Review Star` = c("N/A", "5", "5", "4", NA, "5", 
"3.4", NA), `Total Review` = c("N/A", "1", "5", "5", NA, "1", 
"5", NA)), row.names = c(NA, -8L), class = c("tbl_df", "tbl", 
"data.frame"))

library(dplyr)
data <- data %>% 
  mutate_all(~ifelse(. %in% c("N/A", "NA"), mean(., na.rm = TRUE), .))
  • 3 3 respostas
  • 45 Views

3 respostas

  • Voted
  1. Best Answer
    jpsmith
    2023-10-19T20:54:53+08:002023-10-19T20:54:53+08:00

    O zoopacote possui uma na.aggregatefunção para esse fim ("Substituir NA por agregação"). Como você tem um caractere "N/A", precisará converter seus dados em numéricos usando as.numeric, o que definirá o caractere "N/A"como padrão NA:

    zoo::na.aggregate(apply(data, 2, as.numeric))
    
    #      Review Star Total Review
    # [1,]        4.48          3.4
    # [2,]        5.00          1.0
    # [3,]        5.00          5.0
    # [4,]        4.00          5.0
    # [5,]        4.48          3.4
    # [6,]        5.00          1.0
    # [7,]        3.40          5.0
    # [8,]        4.48          3.4
    

    Ou, alternativamente, usando sapplye especificando as colunas específicas:

    zoo::na.aggregate(sapply(data[c("Review Star", "Total Review")], as.numeric))
    
    • 4
  2. Maël
    2023-10-19T20:55:37+08:002023-10-19T20:55:37+08:00

    É assim que eu faria de uma só vez dplyr. Usando type.convertpara converter para numérico facilmente e depois mutate+ replace.

    library(dplyr)
    type.convert(data, as.is = TRUE) |> 
      mutate(across(everything(), \(x) replace(x, is.na(x), mean(x, na.rm = TRUE))))
    
    #   Review Star Total Review
    # 1        4.48          3.4
    # 2           5            1
    # 3           5            5
    # 4           4            5
    # 5        4.48          3.4
    # 6           5            1
    # 7         3.4            5
    # 8        4.48          3.4
    

    Ou em combinação com imputeTS::na_meanou zoo::na.aggregate:

    imputeTS::na_mean(type.convert(data, as.is = TRUE))
    zoo::na.aggregate(type.convert(data, as.is = TRUE))
    
    • 2
  3. GordonShumway
    2023-10-19T21:02:14+08:002023-10-19T21:02:14+08:00

    Mantendo-se próximo de sua solução original, você teve alguns problemas:

    1. Seus números são strings - corrija usandoas.numeric
    2. Você precisa usar is.na()para encontrar NAs porque a string "NA" não equivale a NA
    3. O uso da função tilda ~requer o uso de .xanotação em vez de.

    Então a solução fica assim:

    data <- data %>% 
      mutate_all(~ifelse(.x %in% c("N/A")|is.na(.x), mean(as.numeric(.x), na.rm = TRUE), .x))
    
    • 1

relate perguntas

  • Adicionar número de série para atividade de cópia ao blob

  • A fonte dinâmica do empacotador duplica artefatos

  • Selecione linhas por grupo com 1s consecutivos

  • Lista de chamada de API de gráfico subscritoSkus estados Privilégios insuficientes enquanto os privilégios são concedidos

  • Função para criar DFs separados com base no valor da coluna

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    destaque o código em HTML usando <font color="#xxx">

    • 2 respostas
  • Marko Smith

    Por que a resolução de sobrecarga prefere std::nullptr_t a uma classe ao passar {}?

    • 1 respostas
  • Marko Smith

    Você pode usar uma lista de inicialização com chaves como argumento de modelo (padrão)?

    • 2 respostas
  • Marko Smith

    Por que as compreensões de lista criam uma função internamente?

    • 1 respostas
  • Marko Smith

    Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

    • 1 respostas
  • Marko Smith

    java.lang.NoSuchMethodError: 'void org.openqa.selenium.remote.http.ClientConfig.<init>(java.net.URI, java.time.Duration, java.time.Duratio

    • 3 respostas
  • Marko Smith

    Por que 'char -> int' é promoção, mas 'char -> short' é conversão (mas não promoção)?

    • 4 respostas
  • Marko Smith

    Por que o construtor de uma variável global não é chamado em uma biblioteca?

    • 1 respostas
  • Marko Smith

    Comportamento inconsistente de std::common_reference_with em tuplas. Qual é correto?

    • 1 respostas
  • Marko Smith

    Somente operações bit a bit para std::byte em C++ 17?

    • 1 respostas
  • Martin Hope
    fbrereto Por que a resolução de sobrecarga prefere std::nullptr_t a uma classe ao passar {}? 2023-12-21 00:31:04 +0800 CST
  • Martin Hope
    比尔盖子 Você pode usar uma lista de inicialização com chaves como argumento de modelo (padrão)? 2023-12-17 10:02:06 +0800 CST
  • Martin Hope
    Amir reza Riahi Por que as compreensões de lista criam uma função internamente? 2023-11-16 20:53:19 +0800 CST
  • Martin Hope
    Michael A formato fmt %H:%M:%S sem decimais 2023-11-11 01:13:05 +0800 CST
  • Martin Hope
    God I Hate Python std::views::filter do C++20 não filtrando a visualização corretamente 2023-08-27 18:40:35 +0800 CST
  • Martin Hope
    LiDa Cute Por que 'char -> int' é promoção, mas 'char -> short' é conversão (mas não promoção)? 2023-08-24 20:46:59 +0800 CST
  • Martin Hope
    jabaa Por que o construtor de uma variável global não é chamado em uma biblioteca? 2023-08-18 07:15:20 +0800 CST
  • Martin Hope
    Panagiotis Syskakis Comportamento inconsistente de std::common_reference_with em tuplas. Qual é correto? 2023-08-17 21:24:06 +0800 CST
  • Martin Hope
    Alex Guteniev Por que os compiladores perdem a vetorização aqui? 2023-08-17 18:58:07 +0800 CST
  • Martin Hope
    wimalopaan Somente operações bit a bit para std::byte em C++ 17? 2023-08-17 17:13:58 +0800 CST

Hot tag

python javascript c++ c# java typescript sql reactjs html

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve