Tenho uma tabela que se parece com isso:
post_id tags
--- ----
1 {'tag1','tag2','tag3'}
2 {'foo','tag3', 'tag1'}
3 {'bar','tag3','anothertag'}
...
Tags é uma coluna de matriz .
Existe alguma maneira de obter as tags mais comuns (por exemplo, para gerar uma nuvem de tags )?
Por exemplo, como você classifica os nomes das tags por popularidade ou as 10 principais tags usadas? (no exemplo acima, na ordem: tag3
, tag1
, etc.)
É possível calcular isso de forma eficiente (para milhares de linhas)?