Eu tenho o que acredito ser um conjunto de dados de série temporal (corrija-me se estiver errado) que possui vários valores associados.
Um exemplo seria modelar um carro e rastrear seus vários atributos durante uma viagem. Por exemplo:
carimbo de data/hora | velocidade | distância percorrida | temperatura | etc
Qual seria a melhor maneira de armazenar esses dados para que um aplicativo da Web possa consultar com eficiência os campos para encontrar máximos, mínimos e plotar cada conjunto de dados ao longo do tempo?
Comecei uma abordagem ingênua de analisar o despejo de dados e armazenar em cache os resultados para que nunca precisassem ser armazenados. Depois de brincar um pouco com isso, no entanto, parece que esta solução não seria dimensionada a longo prazo devido a restrições de memória e, se o cache fosse limpo, todos os dados precisariam ser reanalisados e armazenados novamente em cache.
Além disso, supondo que os dados sejam rastreados a cada segundo com a rara possibilidade de conjuntos de dados de mais de 10 horas, geralmente é recomendável truncar o conjunto de dados por amostragem a cada N segundos?