AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / coding / Perguntas / 76985318
Accepted
David Frick
David Frick
Asked: 2023-08-27 08:29:11 +0800 CST2023-08-27 08:29:11 +0800 CST 2023-08-27 08:29:11 +0800 CST

Kotlin - Como processar dados em paralelo corretamente?

  • 772

Estou vasculhando um site em busca de informações. Um fragmento contém dois métodos que recuperam os dados e depois os desenha. Tive que processar os dados de forma assíncrona para evitar que o thread principal fosse bloqueado. No entanto, quando executo meu código, fica claro que o processamento assíncrono de dados está ocorrendo fora de ordem e isso está fazendo com que algum índice fique fora dos limites. Não tenho certeza do que fazer. Tentei limitar o paralelismo que não ajudou. o que estou perdendo?

 private fun openinsiderGetData(): DataFrame<Any> {
        val doc = Jsoup.connect("http://openinsider.com/search?q=TSLA").get()
        val table = doc.select(".tinytable")
        val dataMap =  HashMap<String, ArrayList<String>>()


        table.select("thead").select("tr").forEach {row ->
            row.getElementsByTag("th").forEach { cell ->
                dataMap[cell.text()] = ArrayList<String>()
            }
        }
        // Get the table body cells
        val keys = dataMap.keys.toList()
        Log.d("Keys", keys.toString())

        table.select("tbody").select("tr").forEach {row ->
            var index = 0
            for (i in 0..row.getElementsByTag("td").size) {
                val key = keys[index]
                Log.d("Key", key)
                index += 1
                Log.d("CELL TEXT:", row.getElementsByTag("td")[i].text())
                dataMap[key]?.add(row.getElementsByTag("td")[i].text())
                Log.d("DATA SO FAR", dataMap.toString())
            }
        }
        Log.d("Map:", dataMap.toString())

        val df = emptyDataFrame<Any>()
        for (key in dataMap.keys) {
            val column = columnOf(dataMap[key]) named key
            df.add(column)
        }
        Log.d("Dataframe:", df.toString())
 
        // process the data further
        return df
    }

}

  private fun setupData() {
        lifecycleScope.launch {
            withContext(Dispatchers.Default.limitedParallelism(1)) {
                data = openinsiderGetData()
                val rows = data.values(byRows=true)
                Log.d("ROWS:", rows.toString())
            }
// TODO - Refactor Draw the table

Meu registro dos meus dados fornece:

{Insider Name=[D], Filing Date=[2023-08-08 20:01:17], 1w=[2023-08-04], Ticker=[TSLA], Title=[Taneja Vaibhav], Trade Type=[CFO, CAO], ΔOwn=[S - Sale+OE], 1d=[$261.00], Owned=[-4,000], Price=[104,504], Qty=[-4%], 6m=[-$1,044,000], X=[], Value=[], Trade Date=[], 1m=[]}

o que está claramente fora de ordem. Estou perplexo sobre como isso acontece e como evitá-lo.

kotlin
  • 2 2 respostas
  • 25 Views

2 respostas

  • Voted
  1. Best Answer
    broot
    2023-08-27T09:18:04+08:002023-08-27T09:18:04+08:00

    Seu problema não tem nada a ver com o processamento dos dados em paralelo. Na verdade, você não processa nada em paralelo aqui, não importa se limita o paralelismo ou não. Você lançou apenas uma única corrotina, portanto não há nada para executar em paralelo.

    Como na sua pergunta anterior, você parece assumir que as chaves em um mapa usam alguma ordem específica, elas têm seus índices. Eles geralmente não o fazem. Depois de adicionar dados ao mapa, se buscarmos suas chaves, as obteremos em ordem aleatória.

    Uma maneira de corrigir o problema é usar o LinkedHashMapem vez de HashMap. Esta é uma implementação especial de um mapa, que preserva o pedido de inserção. Melhor ainda, use mutableMapOf<String, List<String>>()a função que é a forma padrão de criar mapas em Kotlin e abaixo dela usa a extensão LinkedHashMap.

    Uma solução mais explícita seria criar uma lista de chaves enquanto analisa o arquivo thead. Ou podemos armazenar ArrayListobjetos tanto em um mapa quanto em uma lista:

    val dataMap =  HashMap<String, ArrayList<String>>()
    val dataList =  ArrayList<ArrayList<String>>()
    
    // while parsing thead:
    val list = ArrayList<String>()
    dataMap[cell.text()] = list
    dataList += list
    
    
    // while parsing the data:
    dataList[index]?.add(row.getElementsByTag("td")[i].text())
    
    • 3
  2. Jamal N
    2023-08-27T10:12:13+08:002023-08-27T10:12:13+08:00

    O problema pode estar no seu HashMap, pois ele não mantém a ordem de inserção, tente usar LinkedHashMap.

    • 0

relate perguntas

  • como combinar anotação e estilo no Compose?

  • Kotlin coleta SharedFlow não está coletando

  • Como usar o filtro de vários termos no Spring Data Elasticsearch?

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    destaque o código em HTML usando <font color="#xxx">

    • 2 respostas
  • Marko Smith

    Por que a resolução de sobrecarga prefere std::nullptr_t a uma classe ao passar {}?

    • 1 respostas
  • Marko Smith

    Você pode usar uma lista de inicialização com chaves como argumento de modelo (padrão)?

    • 2 respostas
  • Marko Smith

    Por que as compreensões de lista criam uma função internamente?

    • 1 respostas
  • Marko Smith

    Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

    • 1 respostas
  • Marko Smith

    java.lang.NoSuchMethodError: 'void org.openqa.selenium.remote.http.ClientConfig.<init>(java.net.URI, java.time.Duration, java.time.Duratio

    • 3 respostas
  • Marko Smith

    Por que 'char -> int' é promoção, mas 'char -> short' é conversão (mas não promoção)?

    • 4 respostas
  • Marko Smith

    Por que o construtor de uma variável global não é chamado em uma biblioteca?

    • 1 respostas
  • Marko Smith

    Comportamento inconsistente de std::common_reference_with em tuplas. Qual é correto?

    • 1 respostas
  • Marko Smith

    Somente operações bit a bit para std::byte em C++ 17?

    • 1 respostas
  • Martin Hope
    fbrereto Por que a resolução de sobrecarga prefere std::nullptr_t a uma classe ao passar {}? 2023-12-21 00:31:04 +0800 CST
  • Martin Hope
    比尔盖子 Você pode usar uma lista de inicialização com chaves como argumento de modelo (padrão)? 2023-12-17 10:02:06 +0800 CST
  • Martin Hope
    Amir reza Riahi Por que as compreensões de lista criam uma função internamente? 2023-11-16 20:53:19 +0800 CST
  • Martin Hope
    Michael A formato fmt %H:%M:%S sem decimais 2023-11-11 01:13:05 +0800 CST
  • Martin Hope
    God I Hate Python std::views::filter do C++20 não filtrando a visualização corretamente 2023-08-27 18:40:35 +0800 CST
  • Martin Hope
    LiDa Cute Por que 'char -> int' é promoção, mas 'char -> short' é conversão (mas não promoção)? 2023-08-24 20:46:59 +0800 CST
  • Martin Hope
    jabaa Por que o construtor de uma variável global não é chamado em uma biblioteca? 2023-08-18 07:15:20 +0800 CST
  • Martin Hope
    Panagiotis Syskakis Comportamento inconsistente de std::common_reference_with em tuplas. Qual é correto? 2023-08-17 21:24:06 +0800 CST
  • Martin Hope
    Alex Guteniev Por que os compiladores perdem a vetorização aqui? 2023-08-17 18:58:07 +0800 CST
  • Martin Hope
    wimalopaan Somente operações bit a bit para std::byte em C++ 17? 2023-08-17 17:13:58 +0800 CST

Hot tag

python javascript c++ c# java typescript sql reactjs html

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve