具有复数的 matlab accumarray

Question

Asked: 2024-07-03 11:32:24 +0800 CST2024-07-03 11:32:24 +0800 CST 2024-07-03 11:32:24 +0800 CST

如何从标记文档中提取所有名词？

772

我正在尝试从标记化文档中提取所有名词并选择前 3 个。它不起作用，我怀疑是因为我没有正确使用 strcmp 命令。这是我的代码

sT2 = tokenizedDocument([
    "a strongly worded collection of words and letters"
    "another collection of words"]);

tD = tokenizedDocument(sT2);

tD = addPartOfSpeechDetails(tD);

tdetails = tokenDetails(tD);

td7 = table2cell(tdetails(:,7)); % PARTS OF SPEECH

siztd7 = size(td7);

cc = 1;

for ii = 1:siztd7

    if strcmp(td7(ii,1), 'noun') == 1

        tDNoun(cc) = tdetails(1,:);

        cc = cc + 1;

    end

end

bag = bagOfWords(tDNoun);

tb100 = topkwords(bag,3)

1 个回答

Voted

Edric · Answer 1 · 2024-07-03T13:40:48+08:00

该变量tdetails是 MATLAB ，您可以使用索引table直接从中提取名词，如下所示：table

nouns = tdetails{tdetails.PartOfSpeech == "noun", "Token"}

第一个下标将table变量PartOfSpeech与“名词”匹配，第二个下标仅提取table变量“Token”。使用括号索引，即{}提取数据 - 在本例中为string单词数组。

然后可以直接使用它bagOfWords，尽管我们必须使用transpose数组nouns来获取该函数所需的行向量：

bag = bagOfWords(nouns')
topkwords(bag, 3)

如何从标记文档中提取所有名词？

PowerBI 目前与 BigQuery 不兼容：Simba 驱动程序与 Windows 更新有关

寻求从 .NET Framework 4.8 到 .NET 8 扩展操作顺序变化的解释

将 NULL 和 nullptr 传递给模板参数有什么区别？

如果在子类中进行替换，C++ 如何选择“delete”运算符？

为什么双破折号 (--) 会导致此 MariaDB 子句评估为 true？

AdMob：MobileAds.initialize() - 对于某些设备，“java.lang.Integer 无法转换为 java.lang.String”

Selenium urllib.error.HTTPError：HTTP 错误 404：未找到

Box::new() 会从堆栈复制到堆吗？

使用 <font color="#xxx"> 突出显示 html 中的代码

我正在尝试仅使用海龟随机和数学模块来制作吃豆人游戏

如何从标记文档中提取所有名词？

1 个回答

相关问题