PyTorch：一个非常简单的模型未经训练

Question

Tobias Strauß

Asked: 2023-10-06 20:49:24 +0800 CST2023-10-06 20:49:24 +0800 CST 2023-10-06 20:49:24 +0800 CST

从 PyTorch IMDb 数据集中仅获取负样本

772

我正在尝试可视化几个 PyTorch 数据集。对于 IMDb 数据集，我仅获得负训练样本。在原始数据集中，正样本和负样本是平衡的。

这是我正在使用的代码。它基于T5教程

from torch.utils.data import DataLoader
from functools import partial
from torchtext.datasets import IMDB

imdb_datapipe = IMDB(split='test')

labels = {"1": "negative", "2": "positive"}
def process_labels(labels, x):
    return x[1], labels[str(x[0])]


imdb_datapipe = imdb_datapipe.map(partial(process_labels, labels))
imdb_datapipe = imdb_datapipe.batch(2)
imdb_datapipe = imdb_datapipe.shuffle()
imdb_datapipe = imdb_datapipe.rows2columnar(["text", "label"])
imdb_dataloader = DataLoader(imdb_datapipe, batch_size=None)

it = iter(imdb_dataloader)

for _ in range(10):
    sample = next(it)
    for text,label in zip(sample['text'], sample['label']):
        print(f"{label}: {text[:100]}")

我缺少什么？

1 个回答

Voted

Vadym Hadetskyi · Answer 1 · 2023-10-06T21:08:57+08:00

Best Answer

Vadym Hadetskyi

2023-10-06T21:08:57+08:002023-10-06T21:08:57+08:00

在干净的（Colab）环境中运行代码，一切正常，同时获得正面和负面示例：输出屏幕截图

这可能是环境问题。也许，尝试重新安装 torchtext 并再次运行您的代码。torchtext==0.15.2适合torch==2.0.1我。

1

从 PyTorch IMDb 数据集中仅获取负样本

使用 <font color="#xxx"> 突出显示 html 中的代码

为什么在传递 {} 时重载解析更喜欢 std::nullptr_t 而不是类？

您可以使用花括号初始化列表作为（默认）模板参数吗？

为什么列表推导式在内部创建一个函数？

我正在尝试仅使用海龟随机和数学模块来制作吃豆人游戏

java.lang.NoSuchMethodError: 'void org.openqa.selenium.remote.http.ClientConfig.<init>(java.net.URI, java.time.Duration, java.time.Duratio

为什么 'char -> int' 是提升，而 'char -> Short' 是转换（但不是提升）？

为什么库中不调用全局变量的构造函数？

std::common_reference_with 在元组上的行为不一致。哪个是对的？

C++17 中 std::byte 只能按位运算？

从 PyTorch IMDb 数据集中仅获取负样本

1 个回答

相关问题