是否有任何 MySQL 基准测试工具？[关闭]

Question

jonsca

Asked: 2012-01-08 23:55:18 +0800 CST2012-01-08 23:55:18 +0800 CST 2012-01-08 23:55:18 +0800 CST

具有可变列数的行？

772

我正在尝试为一个程序设计一个数据库，该程序用于存储和操作 Twitter 上的推文。

我正在使用代码将推文分割成单词、用户名和主题标签，所以

I'm meeting @President over coffee to talk about my new job #cabinet #woot

会分解成{meeting, over, coffee, talk, about, new, job}（去掉 2 个字母以下的单词和去除标点符号后的单词）{president}、和{cabinet,woot}.

由于我在这方面缺乏经验，我希望能够根据需要增加列中的行数，但我的直觉告诉我，这将是一场噩梦。我考虑过的另一种可能性是选择一个任意数字，例如 10 列来存储单词，5 列用于存储用户名等，但这会有点粗略，因为我不确定会有多少，并且我不得不扔掉可能有价值的信息。

就目前而言，我有 3 varchars 足够长的时间来举行“喝咖啡讨论新工作”、“总统”和“内阁会议”。因此，每当我需要获取特定推文的信息时，我都会检索该行并分解字符串。

这是“正确”的路线吗？我是否错过了一种让我的生活更轻松的明显方法？（我在网上找到了一些关于 using的内容array，但我使用的是 MySQL，它似乎不支持该数据类型。

1 个回答

Voted

Simon Righarts · Answer 1 · 2012-01-09T00:48:23+08:00

经过提问者的几条评论后编辑！：

更好的设计理念：新示例架构

（如果你不熟悉这些图，那是七个表，外键链接如图所示[三个_Link表都有两个引用数据表的外键]。看起来我把事情复杂化了，但相信我， “标记一次并存储在数据库中”比“每次检索数据时标记数据”效率高得多。）

示例数据，使用简单的推文（暂时忽略用户，但概念相同）：“测试推文！#howdoesthiswork #newbie”

      Tweet
TweetID   WordCount
   1         2

Tweet_Word_Link
TweetID   WordID
   1         1
   1         2

      Word
WordID    Word
   1      test
   2      tweet

Tweet_Hashtag_Link
TweetID  HashtagID
   1         1
   1         2

      Hashtag
HashtagID  Hashtag
    1      #howdoesthiswork
    2      #newbie

这使您可以轻松地将所有用户链接到推文中：

SELECT U.UserName
FROM  User U
        INNER JOIN
      Tweet_User_Link TUL ON U.UserID = TUL.UserID
        INNER JOIN
      Tweet T ON TUL.TweetID = T.TweetID
WHERE T.TweetID = <your ID here>

（根据主题标签和单词更改表格名称）

或者，稍微复杂一点，获取所有提及特定主题标签的推文的前 10 个单词：

SELECT TOP 10 W.Word, COUNT(*) AS WordCount
FROM  Word W
        INNER JOIN
      Tweet_Word_Link TWL ON TWL.WordID = W.WordID
        INNER JOIN
      Tweet T ON TWL.TweetID = T.TweetID
        INNER JOIN
      Tweet_Hashtag_Link THL ON THL.TweetID = T.TweetID
        INNER JOIN
      Hashtag H ON H.HashtagID = THL.HashtagID
WHERE H.Hashtag = <your hashtag here>
GROUP By W.Word

（我使用过 ANSI SQL 语法，我不能 100% 确定 MySQL 是否支持所有 ANSI SQL - 但它应该足够接近。）

具有可变列数的行？

如何查看 Oracle 中的数据库列表？

mysql innodb_buffer_pool_size 应该有多大？

列出指定表的所有列

从 .frm 和 .ibd 文件恢复表？

如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

你如何mysqldump特定的表？

如何选择每组的第一行？

使用 psql 列出数据库权限

如何从 PostgreSQL 中的选择查询中将值插入表中？

如何使用 psql 列出所有数据库和表？

具有可变列数的行？

1 个回答

相关问题