Bantha Hunter提出的问题 -coding

Bantha Hunter

Asked: 2023-08-24 23:39:33 +0800 CST

Extraia a string da linha duplicada, remova a duplicata, forneça a contagem de strings [duplicada]

Sou relativamente novo em Python/panda. Aqui está o meu problema: eu tenho um df parecido com este:

df = pd.DataFrame({
    'ZIP Code': ['1234','1234', '5678', '9101'],
    'City Name': ['City A', 'City A', 'City B', 'City C'],
    'Newspaper': ['City A News', 'City A Newspaper', 'News for City B', 'C News'],
})

Como você pode ver, para a Cidade A, existem dois Jornais, mas eles estão listados em duas linhas diferentes. No meu DF real, tenho vários casos de cidades, listadas em linhas separadas, completamente idênticas entre si, exceto o jornal listado.

Então, eu quero criar um df parecido com isto:

df_wanted = pd.DataFrame({
'ZIP Code': ['1234', '5678', '9101'],
'City Name': ['City A', 'City B', 'City C'],
'Newspaper': ['City A News, City A Newspaper', 'News for City B', 'C News'],
'Number of Newspapers': [2, 1, 0]

})

Basicamente, quero remover as linhas duplicadas e adicionar a string do jornal não duplicado à primeira entrada da cidade.

Além disso, quero criar uma coluna que conte o número de jornais para que possa usar os números para análises posteriores.

Espero que você possa me ajudar com meu problema! Desde já, obrigado :)

Até agora não encontrei solução para meu problema.

Extraia a string da linha duplicada, remova a duplicata, forneça a contagem de strings [duplicada]

Reformatar números, inserindo separadores em posições fixas

Por que os conceitos do C++20 causam erros de restrição cíclica, enquanto o SFINAE antigo não?

Problema com extensão desinstalada automaticamente do VScode (tema Material)

Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

`(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

Bantha Hunter's questions