Como divido o loop for em 3 quadros de dados individuais?

Question

Cedric Martens

Asked: 2024-09-24 01:37:09 +0800 CST2024-09-24 01:37:09 +0800 CST 2024-09-24 01:37:09 +0800 CST

Por que estou recebendo "RuntimeError: Tentando retroceder no gráfico uma segunda vez"?

772

Meu código:

import torch
import random


image_width, image_height = 128, 128

def apply_ellipse_mask(img, pos, axes):
    r = torch.arange(image_height)[:, None]
    c = torch.arange(image_width)[None, :]
    val_array = ((c - pos[0]) ** 2) / axes[0] ** 2 + ((r - pos[1]) ** 2) / axes[1] ** 2
    mask = torch.where((0.9 < val_array) & (val_array < 1), torch.tensor(1.0), torch.tensor(0.0))

    return img * (1.0 - mask) + mask


random.seed(0xced)

sphere_radius = image_height / 3
sphere_position = torch.tensor([image_width / 2, image_height / 2 ,0], requires_grad=True)

ref_image = apply_ellipse_mask(torch.zeros(image_width, image_height, requires_grad=True), sphere_position, [sphere_radius, sphere_radius, sphere_radius])

ellipsoid_pos = torch.tensor([sphere_position[0], sphere_position[1], 0], requires_grad=True)
ellipsoid_axes = torch.tensor([image_width / 3 + (random.random() - 0.5) * image_width / 5, image_height / 3 + (random.random() - 0.5) * image_height / 5, image_height / 2], requires_grad=True)

optimizer = torch.optim.Adam([ellipsoid_axes], lr=0.1)
criterion = torch.nn.MSELoss()
for _ in range(100):

    optimizer.zero_grad()
    current_image = torch.zeros(image_width, image_height, requires_grad=True)
    current_image = apply_ellipse_mask(current_image, ellipsoid_pos, ellipsoid_axes)

    loss = criterion(current_image, ref_image)
    loss.backward()
    print(_, loss)
    optimizer.step()

Erro:

RuntimeError: Tentando retroceder no gráfico uma segunda vez (ou acessar diretamente tensores salvos após eles já terem sido liberados). Valores intermediários salvos do gráfico são liberados quando você chama .backward() ou autograd.grad(). Especifique retain_graph=True se você precisar retroceder no gráfico uma segunda vez ou se precisar acessar tensores salvos após chamar backward.

Por que ele estaria tentando retroceder pelo mesmo gráfico uma segunda vez? Estou acessando diretamente os tensores salvos depois que eles foram liberados?

1 respostas

Voted

tbrugere · Answer 1 · 2024-09-24T01:59:56+08:00

Você criou muitos nós folha (variáveis que requerem gradiente), incluindo:

ref_image = apply_ellipse_mask(torch.zeros(image_width, image_height, requires_grad=True), sphere_position, [sphere_radius, sphere_radius, sphere_radius])

que cria um nó folha (com torch.zeros(image_width, image_height, requires_grad=True)) e aplica alguns cálculos para que você obtenha um gráfico de cálculo. Mas então você reutiliza o resultado a cada iteração. Você não o recomputa a cada iteração, então você está tentando voltar no mesmo gráfico várias vezes. As únicas coisas que você deve ter require_grad = Truesão parâmetros que você otimiza.

Você está tendo um problema de diferenciabilidade

Você está tentando fazer o gradiente fluir para ellipsoid_axeso cálculo da máscara, mas o cálculo da máscara não é diferenciável em axes(ele retorna 0-1 de qualquer forma). Você deve fazer a máscara "suave" usando algum tipo de sigmoide em vez disso.

na sua apply_ellipse_maskfunção

Isto é mais um comentário, pois este código ainda causará o mesmo erro. Evite for-loops como este com PyTorch, pois eles são lentos. Em vez disso, você pode escrever:

def apply_ellipse_mask(img, pos, axes):
    r = torch.arange(image_height)[:, None]
    c = torch.arange(image_width)[None, :]
    val_array = ((c - pos[0])**2) / axes[0]**2 + ((r - pos[1])**2) / axes[1]**2
    mask = torch.where(0.9 < val < 1, torch.tensor(1.0),  torch.tensor(0.0))

    return img * (1.0 - mask) + mask

Por que estou recebendo "RuntimeError: Tentando retroceder no gráfico uma segunda vez"?

Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

Por que esse código Java simples e pequeno roda 30x mais rápido em todas as JVMs Graal, mas não em nenhuma JVM Oracle?

Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

`(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

Quando devo usar um std::inplace_vector em vez de um std::vector?

Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

Por que estou recebendo "RuntimeError: Tentando retroceder no gráfico uma segunda vez"?

1 respostas

relate perguntas