Estou coletando dados de cada mês em peças medidas em um único arquivo para o ano inteiro. Ao usar uma "consulta de pasta", consigo reunir todos os dados, formatá-los e classificá-los com uma exceção. Cada peça tem uma versão "A" e uma "B". Infelizmente, devido à ordem de produção, às vezes a peça "B" é medida antes da peça "A". Nesse caso, eu não gostaria de classificar por tempo, pois a ordem seria, por exemplo, A,B,A,B, B, A,A,B,B. Quero sempre colocar a parte "A" antes da parte "B". As peças são medidas duas vezes por dia, então não posso classificar por dia e depois por letra da peça, porque seria, por exemplo, A, A , B, B ,A,A,B,B. Como posso classificar os dados de forma que eles sejam por dia, depois por hora e, em seguida, sobrescrevam a hora para manter o padrão A,B,A,B?
Para complicar ainda mais as coisas, às vezes o coletor de dados bagunça e rotula incorretamente uma das partes. Nesse caso, ele classificaria como, por exemplo, A,B,A,B, A,A ,A,B,A,B. Como posso encontrar esse erro e corrigi-lo automaticamente antes de colar os dados consolidados em uma tabela.
(Os dados foram simplificados por razões de confidencialidade)
Você pode ver que na manhã de 2 de maio A/B estão invertidos porque os dados B foram coletados antes dos dados A. Classificar os dados por hora bagunçou a ordem.
Você pode ver que na manhã do dia 2 de abril (13h é o turno da manhã) há duas partes A quando uma delas deveria ser B (para esse erro, podemos supor que elas foram tiradas na ordem de "A" antes de "B", então o horário da coleta de dados se aplica).
Sou novo no uso de consultas e, honestamente, estou tendo muita dificuldade com isso. Por favor, ajude-me não apenas a resolver esse problema, mas também a entendê-lo.
Aqui estão as versões em texto dos dados:
Abr
Data | Tempo | Carta | Dados |
---|---|---|---|
01/04/2024 | 7:25:08 da manhã | UM | 0,7 |
01/04/2024 | 7:30:56 da manhã | B | 0,5 |
01/04/2024 | 20h32min51s | UM | 0,6 |
01/04/2024 | 20h36min44s | B | 0,5 |
02/04/2024 | 13h32min59s | UM | 1 |
02/04/2024 | 13h38min36s | UM | 0,5 |
02/04/2024 | 20h46min11s | UM | 0,7 |
02/04/2024 | 20:51:31 | B | 0,7 |
Poderia
Data | Tempo | Carta | Dados |
---|---|---|---|
01/05/2024 | 13h35min12s | UM | 0,6 |
01/05/2024 | 13h39min05s | B | 0,4 |
01/05/2024 | 18:07:11 | UM | 0,8 |
01/05/2024 | 18:10:43 | B | 0,5 |
02/05/2024 | 10:59:32 da manhã | UM | 0,8 |
02/05/2024 | 8:42:16 da manhã | B | 0,1 |
02/05/2024 | 18:15:07 | UM | 0,4 |
02/05/2024 | 18:18:40 | B | 0,2 |
YTD (Produção atual)
Data | Tempo | Carta | Dados |
---|---|---|---|
01/04/2024 | 7:25:08 da manhã | UM | 0,7 |
01/04/2024 | 7:30:56 da manhã | B | 0,5 |
01/04/2024 | 20h32min51s | UM | 0,6 |
01/04/2024 | 20h36min44s | B | 0,5 |
02/04/2024 | 13h32min59s | UM | 1 |
02/04/2024 | 13h38min36s | UM | 0,5 |
02/04/2024 | 20h46min11s | UM | 0,7 |
02/04/2024 | 20:51:31 | B | 0,7 |
01/05/2024 | 13h35min12s | UM | 0,6 |
01/05/2024 | 13h39min05s | B | 0,4 |
01/05/2024 | 18:07:11 | UM | 0,8 |
01/05/2024 | 18:10:43 | B | 0,5 |
02/05/2024 | 8:42:16 da manhã | B | 0,1 |
02/05/2024 | 10:59:32 da manhã | UM | 0,8 |
02/05/2024 | 18:15:07 | UM | 0,4 |
02/05/2024 | 18:18:40 | B | 0,2 |
YTD (Saída desejada)
Data | Tempo | Carta | Dados |
---|---|---|---|
01/04/2024 | 7:25:08 da manhã | UM | 0,7 |
01/04/2024 | 7:30:56 da manhã | B | 0,5 |
01/04/2024 | 20h32min51s | UM | 0,6 |
01/04/2024 | 20h36min44s | B | 0,5 |
02/04/2024 | 13h32min59s | UM | 1 |
02/04/2024 | 13h38min36s | B | 0,5 |
02/04/2024 | 20h46min11s | UM | 0,7 |
02/04/2024 | 20:51:31 | B | 0,7 |
01/05/2024 | 13h35min12s | UM | 0,6 |
01/05/2024 | 13h39min05s | B | 0,4 |
01/05/2024 | 18:07:11 | UM | 0,8 |
01/05/2024 | 18:10:43 | B | 0,5 |
02/05/2024 | 10:59:32 da manhã | UM | 0,8 |
02/05/2024 | 8:42:16 da manhã | B | 0,1 |
02/05/2024 | 18:15:07 | UM | 0,4 |
02/05/2024 | 18:18:40 | B | 0,2 |
Usei uma consulta simples do Power Query, como visto aqui , e, além disso, em ordem, alterei todos os tipos de dados para o tipo correto, classifiquei por data, classifiquei por hora, removi o nome da fonte e removi duplicatas.
O motivo pelo qual não posso confiar em nomes de arquivo para classificar os dados e mantê-los como estão dentro do arquivo é porque estou puxando dados de planilhas que têm o mesmo nome, mas estão em suas próprias pastas mensais respectivas. As pastas são classificadas em ordem alfabética, então a ordem dos meses estaria errada se eu não as classificasse manualmente.