AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / user-14923149

Umar's questions

Martin Hope
Umar
Asked: 2024-04-20 16:17:45 +0800 CST

Como criar um mapa de calor combinado em Python usando matplotlib com dados normalizados e valores originais de teste t?

  • 6

Eu tenho um DataFrame contendo vários recursos junto com seus resultados de teste t e valores p associados. Meu objetivo é gerar um mapa de calor combinado em Python usando Seaborn. Neste mapa de calor, uma seção deve exibir os recursos com dados normalizados usando pontuações z (para garantir a visibilidade dos valores altos e baixos), enquanto a outra seção deve apresentar os valores originais do teste t e valores p.

Pretendo criar um único mapa de calor com esquemas de cores distintos para cada seção para diferenciá-las claramente. No entanto, minhas tentativas de traçar dois mapas de calor separados e combiná-los resultaram em gráficos separados, em vez de um mapa de calor unificado.

Alguém poderia me orientar sobre como criar um único mapa de calor combinado onde ambas as seções aparecem anexadas?

Aqui está o código que tentei até agora: import pandas as pd import numpy as np import seaborn as sns import matplotlib.pyplot as plt from matplotlib import gridspec

# Example DataFrame
data = {
    'Feature1': np.random.randn(10),
    'Feature2': np.random.randn(10),
    'Feature3': np.random.randn(10),
    't test': np.random.randn(10),
    'p value': np.random.rand(10)
}

df = pd.DataFrame(data)

# Drop the last two columns
df_heatmap = df.iloc[:, :-2]

# Calculate z-scores for the DataFrame
df_heatmap_zscore = (df_heatmap - df_heatmap.mean()) / df_heatmap.std()

# Set up the layout
fig = plt.figure(figsize=(12, 8))
gs = gridspec.GridSpec(1, 4, width_ratios=[1, 1, 0.05, 0.05])  # 4 columns: 2 for heatmaps, 2 for colorbars

# Heatmap for the DataFrame excluding t-test and p-value columns
ax1 = plt.subplot(gs[0])
sns.heatmap(df_heatmap_zscore, cmap='coolwarm', annot=True, cbar=False)
plt.title('Heatmap without t-test and p-value')

# Heatmap for t-test p-values
ax2 = plt.subplot(gs[1])
sns.heatmap(df[['t test', 'p value']], cmap='viridis', annot=True, fmt=".4f", cbar=False, ax=ax2)
plt.title('Heatmap for t-test p-values')

# Create a single colorbar for the z-score
cbar_ax1 = plt.subplot(gs[2])
cbar1 = plt.colorbar(ax1.collections[0], cax=cbar_ax1, orientation='vertical')
cbar1.set_label('Z-score')

# Create a single colorbar for the t-test p-values
cbar_ax2 = plt.subplot(gs[3])
cbar2 = plt.colorbar(ax2.collections[0], cax=cbar_ax2, orientation='vertical')
cbar2.set_label('p-value')

plt.tight_layout()
plt.show()

insira a descrição da imagem aqui

Existe uma maneira de combinar esses mapas de calor em um único gráfico, para que apareçam anexados e tenham padrões de cores e barras de legenda diferentes?

insira a descrição da imagem aqui

python
  • 1 respostas
  • 42 Views
Martin Hope
Umar
Asked: 2023-12-02 19:43:11 +0800 CST

Problema com bordas de triângulos no Matplotlib

  • 6

Estou enfrentando um problema ao desenhar bordas triangulares usando Matplotlib em Python. Quero criar um padrão específico, mas estou encontrando um comportamento inesperado. Preciso de ajuda para identificar e resolver o problema.

este é o meu código

import numpy as np
import matplotlib.pyplot as plt
N = 5
A = np.array([(x, y) for y in range(N, -1, -1) for x in range(N + 1)])
t = np.array([[1, 1], [-1, 1]])
A = np.dot(A, t)

# I have defined a triangle
fig = plt.figure(figsize=(10, 10))
triangle = fig.add_subplot(111)

X = A[:, 0].reshape(N + 1, N + 1)
Y = A[:, 1].reshape(N + 1, N + 1)

for i in range(1, N + 1):
    for j in range(i):
        line_x = np.array([X[i, j + 1], X[i, j], X[i - 1, j]])
        line_y = np.array([Y[i, j + 1], Y[i, j], Y[i - 1, j]])
        triangle.plot(line_y,line_x,  color='black', linewidth=1)

plt.show()

mas estou recebendo esta imagem, como você pode ver,insira a descrição da imagem aqui

Na esquina, linhas extras estão chegando, conforme eu as contornei. Não quero essa linha extra, tentei resolver usando loop, embora uma linha extra continue permanecendo

for i in range(6):
    if i == N-1 :
        for j in range(i-1):
            line_x = np.array([X[i , j+1], X[i, j],X[i-1, j]])
            line_y = np.array([Y[i, j+1], Y[i, j], Y[i-1, j]])
            triangle.plot(line_y, line_x, color='black', linewidth=1)
        pass
    else:
        for j in range(i):
            line_x = np.array([X[i , j+1], X[i, j],X[i-1, j]])
            line_y = np.array([Y[i, j+1], Y[i, j], Y[i-1, j]])
            triangle.plot(line_y,line_x, color='black', linewidth=1)
        pass  

plt.show() gentilmente resolva o problema

python
  • 2 respostas
  • 60 Views
Martin Hope
Umar
Asked: 2023-11-05 20:34:18 +0800 CST

Como analisar dados hierárquicos e formatá-los em um arquivo TSV em Python?

  • 6

Tenho um conjunto de dados com informações hierárquicas e números KO, e estou procurando formatar esses dados em um arquivo TSV (Tab-Separated Values) em Python, onde a primeira coluna contém números KO, a segunda coluna contém descrições, e a terceira coluna contém coluna contém uma hierarquia baseada na seção 'A' mais próxima nos dados de entrada. A hierarquia deve incluir elementos começando com 'A', 'B' e 'C' até a seção 'C' mais próxima. Além disso, se o mesmo número KO estiver presente em uma hierarquia diferente, essa hierarquia deverá ser separada por | na mesma linha, os dados de entrada estão no formato file.keg. Dados de entrada:

A09100 Metabolism
B
B  09101 Carbohydrate metabolism
C    00010 Glycolysis / Gluconeogenesis [PATH:ko00010]
D      K00844  HK; hexokinase [EC:2.7.1.1]
D      K12407  GCK; glucokinase [EC:2.7.1.2]
D      K00001  E1.1.1.1, adh; alcohol dehydrogenase [EC:1.1.1.1]
B  09103 Lipid metabolism
C    00071 Fatty acid degradation [PATH:ko00071]
D      K00001  E1.1.1.1, adh; alcohol dehydrogenase [EC:1.1.1.1]
A09120 Genetic Information Processing
B
B  09121 Transcription
C    03020 RNA polymerase [PATH:ko03020]
D      K03043  rpoB; DNA-directed RNA polymerase subunit beta [EC:2.7.7.6]
D      K13797  rpoBC; DNA-directed RNA polymerase subunit beta-beta' [EC:2.7.7.6]

Resultado esperado:

    KO      metadata_KEGG_Description        metadata_KEGG_Pathways
K00844  HK; hexokinase [EC:2.7.1.1]     Metabolism, Carbohydrate metabolism, Glycolysis / Gluconeogenesis
K12407  GCK; glucokinase [EC:2.7.1.2]   Metabolism, Carbohydrate metabolism, Glycolysis / Gluconeogenesis
K00001  E1.1.1.1, adh; alcohol dehydrogenase [EC:1.1.1.1]    Metabolism, Carbohydrate metabolism, Glycolysis / Gluconeogenesis|Metabolism, Lipid metabolism, Fatty acid degradation
K03043  rpoB; DNA-directed RNA polymerase subunit beta [EC:2.7.7.6]  Genetic Information Processing, Transcription, RNA polymerase
K13797  rpoBC; DNA-directed RNA polymerase subunit beta-beta' [EC:2.7.7.6]  Genetic Information Processing, Transcription, RNA polymerase

Eu apreciaria qualquer ajuda ou orientação sobre como processar corretamente esses dados em um arquivo TSV desejado com base nas informações hierárquicas fornecidas. Obrigado pela sua ajuda!

este é o meu código

data = """A09100 Metabolism
B
B  09101 Carbohydrate metabolism
C    00010 Glycolysis / Gluconeogenesis [PATH:ko00010]
D      K00844  HK; hexokinase [EC:2.7.1.1]
D      K12407  GCK; glucokinase [EC:2.7.1.2]
D      K00001  E1.1.1.1, adh; alcohol dehydrogenase [EC:1.1.1.1]
B  09103 Lipid metabolism
C    00071 Fatty acid degradation [PATH:ko00071]
D      K00001  E1.1.1.1, adh; alcohol dehydrogenase [EC:1.1.1.1]
A09120 Genetic Information Processing
B
B  09121 Transcription
C    03020 RNA polymerase [PATH:ko03020]
D      K03043  rpoB; DNA-directed RNA polymerase subunit beta [EC:2.7.7.6]
D      K13797  rpoBC; DNA-directed RNA polymerase subunit beta-beta' [EC:2.7.7.6]"""


lines = data.split('\n')

result = []

ko = None
description = None
hierarchy_names = []

for line in lines:
    parts = line.strip().split()
    if parts:
        if parts[0].startswith('A'):
            # Reset hierarchy for a new 'A' section
            hierarchy_names = [" ".join(parts[1:])]
        elif parts[0] == 'K':
            ko = parts[0]
            description = " ".join(parts[1:])
        elif parts[0] == 'D' and len(parts) >= 3:
            ko = parts[1]
            description = " ".join(parts[2:])
        else:
            hierarchy_names.append(" ".join(parts[1:]))

    if ko and description:
        hierarchy_str = ", ".join(hierarchy_names)
        result.append([ko, description, hierarchy_str])

# Add the header row
result.insert(0, ["KO", "metadata_KEGG_Description", "metadata_KEGG_Pathways"])

# Specify the filename for the TSV file
tsv_filename = "output_data.tsv"

with open(tsv_filename, 'w') as tsv_file:
    for row in result:
        tsv_file.write("\t".join(row) + "\n")

print(f"Data saved to {tsv_filename}")
python
  • 2 respostas
  • 60 Views

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Reformatar números, inserindo separadores em posições fixas

    • 6 respostas
  • Marko Smith

    Por que os conceitos do C++20 causam erros de restrição cíclica, enquanto o SFINAE antigo não?

    • 2 respostas
  • Marko Smith

    Problema com extensão desinstalada automaticamente do VScode (tema Material)

    • 2 respostas
  • Marko Smith

    Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

    • 1 respostas
  • Marko Smith

    Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

    • 1 respostas
  • Marko Smith

    Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

    • 6 respostas
  • Marko Smith

    `(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

    • 3 respostas
  • Marko Smith

    Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

    • 1 respostas
  • Marko Smith

    PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

    • 2 respostas
  • Marko Smith

    AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

    • 1 respostas
  • Martin Hope
    Fantastic Mr Fox Somente o tipo copiável não é aceito na implementação std::vector do MSVC 2025-04-23 06:40:49 +0800 CST
  • Martin Hope
    Howard Hinnant Encontre o próximo dia da semana usando o cronógrafo 2025-04-21 08:30:25 +0800 CST
  • Martin Hope
    Fedor O inicializador de membro do construtor pode incluir a inicialização de outro membro? 2025-04-15 01:01:44 +0800 CST
  • Martin Hope
    Petr Filipský Por que os conceitos do C++20 causam erros de restrição cíclica, enquanto o SFINAE antigo não? 2025-03-23 21:39:40 +0800 CST
  • Martin Hope
    Catskul O C++20 mudou para permitir a conversão de `type(&)[N]` de matriz de limites conhecidos para `type(&)[]` de matriz de limites desconhecidos? 2025-03-04 06:57:53 +0800 CST
  • Martin Hope
    Stefan Pochmann Como/por que {2,3,10} e {x,3,10} com x=2 são ordenados de forma diferente? 2025-01-13 23:24:07 +0800 CST
  • Martin Hope
    Chad Feller O ponto e vírgula agora é opcional em condicionais bash com [[ .. ]] na versão 5.2? 2024-10-21 05:50:33 +0800 CST
  • Martin Hope
    Wrench Por que um traço duplo (--) faz com que esta cláusula MariaDB seja avaliada como verdadeira? 2024-05-05 13:37:20 +0800 CST
  • Martin Hope
    Waket Zheng Por que `dict(id=1, **{'id': 2})` às vezes gera `KeyError: 'id'` em vez de um TypeError? 2024-05-04 14:19:19 +0800 CST
  • Martin Hope
    user924 AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos 2024-03-20 03:12:31 +0800 CST

Hot tag

python javascript c++ c# java typescript sql reactjs html

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve