使用 ?.get 访问参数时 Kotlin 引发错误 Unresolved reference

Question

JAEIK JEONG

Asked: 2025-02-25 17:33:43 +0800 CST2025-02-25 17:33:43 +0800 CST 2025-02-25 17:33:43 +0800 CST

为什么即使给出了延迟，协程也不会转换并同步工作？

772

runBlocking {
    bookLinks.mapIndexed { ranking, bookLink ->
        val job = async { scrapeBookData(browser, bookLink, ranking) }
        val result = job.await()
        if (result != null) {
            bestsellers.add(result)
        }
    }
}

private suspend fun scrapeBookData(browser: Browser, bookUrl: String, ranking: Int): BookDTO? {
    val page = browser.newPage()

    page.navigate(bookUrl, Page.NavigateOptions().setWaitUntil(WaitUntilState.DOMCONTENTLOADED))
    printWithThread("${bookUrl}에 접근 완료")
    delay(3000)


    val data = page.evaluate(
        """ () => JSON.stringify({
        title: document.querySelector('.prod_title')?.innerText?.trim() || '',
        author: document.querySelector('.author')?.innerText?.trim() || '',
        isbn: document.querySelector('#scrollSpyProdInfo .product_detail_area.basic_info table tbody tr:nth-child(1) td')?.innerText?.trim() || '',
        description: document.querySelector('.intro_bottom')?.innerText?.trim() || '',
        image: document.querySelector('.portrait_img_box img')?.getAttribute('src') || ''
    }) """
    ).toString()

    val type = object : TypeToken<Map<String, String>>() {}.type
    val json: Map<String, String> = Gson().fromJson(data, type)

    page.close()
    printWithThread("${bookUrl}의 데이터 파싱 완료")
    if (json.values.all { it.isBlank() }) {
        return null
    }

    return BookDTO(
        id = 0L,
        title = json["title"] ?: "",
        author = json["author"] ?: "",
        description = json["description"] ?: "",
        image = json["image"] ?: "",
        isbn = json["isbn"] ?: "",
        ranking = ranking + 1,
        favoriteCount = 0
    )
}

我预期如果我将 scrapeBookData（一个挂起函数）延迟 3 秒，协程会在延迟期间切换并再次执行 scrapeBookData。我预期在重复执行 scrapeBookData 3 秒后，第一个协程将解析网络响应已完成的页面。然而，协程是同步运行的。

[http-nio-8080-exec-2 @coroutine#2] https:S000215819502에 접근 완료
[http-nio-8080-exec-2 @coroutine#2] https:S000215819502의 데이터 파싱 완료
[http-nio-8080-exec-2 @coroutine#3] https:S000215150862에 접근 완료
[http-nio-8080-exec-2 @coroutine#3] https:S000215150862의 데이터 파싱 완료
[http-nio-8080-exec-2 @coroutine#4] https:S000215787651에 접근 완료

1 个回答

Voted

tyg · Answer 1 · 2025-02-25T17:53:20+08:00

问题不太清楚，但我猜您希望scrapeBookData对中的每个条目并行执行bookLinks。

但您的代码并非如此，因为在使用启动新协程后async，您会立即通过调用暂停代码await，等待该协程完成 - 无论您在该协程中延迟多长时间。async立即调用await几乎总是一个错误，因为它会使协程变得多余，它基本上与仅调用相同

val result = scrapeBookData(browser, bookLink, ranking)

你想要的是在循环之后等待启动的协程，在所有协程启动之后 - 而不是在每个协程之后：

bookLinks
    .mapIndexed { ranking, bookLink ->
        async { scrapeBookData(browser, bookLink, ranking) }
    }
    .awaitAll()

现在，循环为每个 bookLink 启动一个协程，并立即继续处理下一个链接，而无需等待协程完成。由于 async 返回一个Deferred（而不是一个Job，正如原始代码的变量名所暗示的那样），因此在启动所有协程后，mapIndexed 将返回一个 Deferred 列表。现在您想等待所有协程，直到它们完成。幸运的是，Kotlin 为此提供了一个方便的函数，awaitAll。

awaitAll现在返回一个简单的List<BookDTO?>，您可以进一步处理。从查看代码来看，您想要过滤掉所有空值，因此您应该应用.filterNotNull()下一个。现在您可以对结果进行任何您想做的事情List<BookDTO>。如果您想将整个列表添加到另一个列表bestsellers，您可以附加.also { bestsellers.addAll(it) }。但只需这样做就足够了：

val bestsellers = bookLinks
    .mapIndexed { ranking, bookLink ->
        async { scrapeBookData(browser, bookLink, ranking) }
    }
    .awaitAll()
    .filterNotNull()

您应该删除delayscrapeBookData 中的，您希望您的协程尽快完成。如果您只想在代码的该部分添加一个暂停点，您可以yield改为调用。但我不明白为什么这里需要这样做，所以您应该完全删除它。

为什么即使给出了延迟，协程也不会转换并同步工作？

为什么 C++20 概念会导致循环约束错误，而老式的 SFINAE 不会？

VScode 自动卸载扩展的问题（Material 主题）

Vue 3：创建时出错“预期标识符但发现‘导入’”[重复]

具有指定基础类型但没有枚举器的“枚举类”的用途是什么？

如何修复未手动导入的模块的 MODULE_NOT_FOUND 错误？

`(表达式，左值) = 右值` 在 C 或 C++ 中是有效的赋值吗？为什么有些编译器会接受/拒绝它？

何时应使用 std::inplace_vector 而不是 std::vector？

在 C++ 中，一个不执行任何操作的空程序需要 204KB 的堆，但在 C 中则不需要

PowerBI 目前与 BigQuery 不兼容：Simba 驱动程序与 Windows 更新有关

AdMob：MobileAds.initialize() - 对于某些设备，“java.lang.Integer 无法转换为 java.lang.String”

为什么即使给出了延迟，协程也不会转换并同步工作？

1 个回答

相关问题