Pytorch 是否有与 topk 相反的方法，返回最小的 k 个元素？

Question

JTT

Asked: 2024-05-08 00:52:29 +0800 CST2024-05-08 00:52:29 +0800 CST 2024-05-08 00:52:29 +0800 CST

使用虚拟变量最小化 PyTorch 中的函数

772

我是 PyTorch 的新手，所以我的问题可能很微不足道。

我正在尝试最小化一个可以在片段中恢复的函数


def target_function(params):
    vector = torch.zeros(10)
    μr = torch.zeros(2, requires_grad=True)
   
    θ = torch.zeros(2, requires_grad=True)

    μr = torch.tensor([params[0], params[4]], requires_grad=True)

    θ = torch.tensor([params[3], params[7]], requires_grad=True)
 
    for i in range(2):
        vector[i] += (μr[i]**2 - θ[i] ).sum()

    return torch.norm(vector)

我尝试通过执行优化

import matplotlib.pyplot as plt


# Initialize parameters with random values between 0 and 1
params = torch.rand(10, requires_grad=True)


# Choose an optimizer (e.g., SGD) and specify the learning rate
optimizer = SGD([params], lr=0.01)

num_steps = 100

# Lists to store the values of the target function during optimization
target_values = []

# Optimization loop
for i in range(num_steps):
    # Zero gradients
    optimizer.zero_grad()
    
    # Compute the function value
    output = target_function(params)
    
    # Store the function value
    target_values.append(output.item())
    
    # Compute gradients
    output.backward()
    
    # Update parameters
    optimizer.step()

# Plot the values of the target function during optimization
plt.plot(target_values)
plt.xlabel('Iteration')
plt.ylabel('Target Function Value')
plt.title('Optimization Progress')
plt.show()

但函数的值似乎在循环期间不会变化。调试我发现它可能取决于使用变量μr 和θ代码中。也许我正在做一些不应该做的事情，但我不明白如何解决这个问题，保持变量μr 和θ。

感谢您的任何帮助或解释

1 个回答

Voted

MinhNH · Answer 1 · 2024-05-08T15:02:10+08:00

Best Answer

MinhNH

2024-05-08T15:02:10+08:002024-05-08T15:02:10+08:00

你的问题是μr = torch.tensor([params[0], params[4]], requires_grad=True)和θ = torch.tensor([params[3], params[7]], requires_grad=True)。您创建新的张量，它们的引用与参数不同，因此参数不会在训练循环中更新。您可以将它们更改为

    μr = torch.stack([params[0], params[4]])
    θ = torch.stack([params[3], params[7]])

然后你就可以正常训练了

0

使用虚拟变量最小化 PyTorch 中的函数

Vue 3：创建时出错“预期标识符但发现‘导入’”[重复]

为什么这个简单而小的 Java 代码在所有 Graal JVM 上的运行速度都快 30 倍，但在任何 Oracle JVM 上却不行？

具有指定基础类型但没有枚举器的“枚举类”的用途是什么？

如何修复未手动导入的模块的 MODULE_NOT_FOUND 错误？

`(表达式，左值) = 右值` 在 C 或 C++ 中是有效的赋值吗？为什么有些编译器会接受/拒绝它？

何时应使用 std::inplace_vector 而不是 std::vector？

在 C++ 中，一个不执行任何操作的空程序需要 204KB 的堆，但在 C 中则不需要

PowerBI 目前与 BigQuery 不兼容：Simba 驱动程序与 Windows 更新有关

AdMob：MobileAds.initialize() - 对于某些设备，“java.lang.Integer 无法转换为 java.lang.String”

我正在尝试仅使用海龟随机和数学模块来制作吃豆人游戏

使用虚拟变量最小化 PyTorch 中的函数

1 个回答

相关问题