是否有一个模拟“补丁”的类？

Question

Asked: 2024-03-23 00:54:57 +0800 CST2024-03-23 00:54:57 +0800 CST 2024-03-23 00:54:57 +0800 CST

Haskell Megaparsec：如何显示导致错误的所有解析器的回溯？

772

这是我的玩具文件：

import Text.Megaparsec
import Text.Megaparsec.Char
import Data.Void (Void)

type Parser = Parsec Void String

myParser :: Parser String
myParser = do
            d <- digitChar
            c <- letterChar
            return $ replicate (read [d]) c

现在，从 ghci 开始，如果我输入，parseTest (myParser <?> "foo") "3a"我会得到"aaa"预期的结果，但如果我输入parseTest (myParser <?> "foo") "33a"，我会得到：

1:2:
  |
1 | 33a
  |  ^
unexpected '3'
expecting letter

在这个简单的情况下，错误消息是有意义的（我必须输入一个字母而不是另一个数字），但在编写更复杂的解析器时，letterChar可能会出现在任意数量的复合解析器中，因此不清楚哪个 letterChar是失败的。由于我为解析器传递了一个标签foo，因此如果错误消息显示如下内容，我会希望它：

1:2:
  |
1 | 33a
  |  ^
error while parsing foo:
  unexpected '3'
  expecting letter

更一般地说，只要我使用给解析器标签<?>，我就希望显示错误的整个回溯，例如：

error while parsing grandparent:
  error while parsing parent:
    unexpected '3'
    expecting letter

有没有办法在百万秒差距中做到这一点？

1 个回答

Voted

K. A. Buhr · Answer 1 · 2024-03-23T06:55:57+08:00

Megaparsec 没有内置支持执行此操作，但您可以使用其自定义错误机制。

我们可以定义一个自定义错误类型，将上下文标签添加到现有的ParseError，以及ShowErrorComponent在错误消息中显示它的实例。（这里奇怪的孤立Ord实例ParseError满足了一项技术要求。自定义错误需要一个Ord实例，但ParseError没有实例，因此如果我们想在自定义错误中包含嵌套的 ParseError ，我们必须派生一个实例。）

data ErrorWithLabel = ErrorWithLabel String (ParseError String ErrorWithLabel)
  deriving (Eq, Ord)

-- orphan instance needed for technical reasons
deriving instance Ord (ParseError String ErrorWithLabel)

instance ShowErrorComponent ErrorWithLabel where
  showErrorComponent (ErrorWithLabel l e) =
    "while parsing " <> l <> ",\n" <> parseErrorTextPretty e

就其本身而言，这不会执行任何操作，但我们可以修改的定义<?>及其非运算符等效项label以利用此自定义错误。具体来说，我们可以修改它们，以便它们调用原始的 Megaparsec 定义，该label定义可以正确处理解析器在不消耗输入的情况下失败的情况（通过将标签显示为“最低”错误），然后还处理解析器在消耗后失败的情况输入（通过用上下文包装错误ErrorWithLabel）：

import Text.Megaparsec hiding (label, (<?>))
import qualified Text.Megaparsec as P
import Text.Megaparsec.Internal (ParsecT(..))
import qualified Data.Set as Set

label :: String -> Parser p -> Parser p
label l p = ParsecT $ \s cok cerr eeok eerr ->
  let addLabel e = FancyError (errorOffset e) .
        Set.singleton . ErrorCustom $ ErrorWithLabel l e
  in unParser (P.label l p) s cok (cerr . addLabel) eeok eerr

infix 0 <?>
(<?>) :: Parser p -> String -> Parser p
(<?>) = flip label

这对于你的例子来说效果很好：

λ> parseTest (myParser <?> "foo") "33a"
1:2:                                                                                                     
  |                                                                                                      
1 | 33a                                                                                                  
  |  ^                                                                                                   
while parsing foo,                                                                                       
unexpected '3'                                                                                           
expecting letter

λ> parseTest ((myParser <?> "parent") <?> "grandparent") "33a"
1:2:                                                                                                     
  |                                                                                                      
1 | 33a                                                                                                  
  |  ^                                                                                                   
while parsing grandparent,                                                                               
while parsing parent,                                                                                    
unexpected '3'                                                                                           
expecting letter

完整的代码示例，带有一些稍微复杂的标签：

{-# LANGUAGE GHC2021 #-}

module Main where

import Text.Megaparsec hiding (label, (<?>))
import qualified Text.Megaparsec as P
import Text.Megaparsec.Internal (ParsecT(..))
import Text.Megaparsec.Char
import qualified Data.Set as Set

data ErrorWithLabel = ErrorWithLabel String (ParseError String ErrorWithLabel)
  deriving (Eq, Ord)

deriving instance Ord (ParseError String ErrorWithLabel)

instance ShowErrorComponent ErrorWithLabel where
  showErrorComponent (ErrorWithLabel l e) =
    "while parsing " <> l <> ",\n" <> parseErrorTextPretty e

type Parser = Parsec ErrorWithLabel String

label :: String -> Parser p -> Parser p
label l p = ParsecT $ \s cok cerr eeok eerr ->
  let addLabel e = FancyError (errorOffset e) .
        Set.singleton . ErrorCustom $ ErrorWithLabel l e
  in unParser (P.label l p) s cok (cerr . addLabel) eeok eerr

infix 0 <?>
(<?>) :: Parser p -> String -> Parser p
(<?>) = flip label

repspec :: Parser String
repspec = (do
  d <- digitChar
  c <- letterChar <?> "a character to replicate"
  return $ replicate (read [d]) c)
  <?> "replication spec"

literal :: Parser String
literal = between (char '\'') (char '\'') (takeWhileP Nothing (/= '\'')) <?> "literal string"

comment :: Parser String
comment = "" <$ char ';' <* takeRest <?> "a comment"

expr :: Parser String
expr = (repspec <|> literal <?> "expression")
  <|>  (comment <?> "comment")

main :: IO ()
main = mapM_ (parseTest (expr <* eof))
  [ "3a"   -- parses okay

  , "33a"  -- while parsing expression,
  --  ^    -- while parsing repspec,
           -- unexpected '3'
           -- expected a character to replicate

  , "?"    -- unexpected '?'
  -- ^     -- expecting comment or expression

  , "'x"   -- while parsing expression,
  --   ^   -- while parsing literal string,
           -- unexpected end of input
           -- expecting '''
  ]

Haskell Megaparsec：如何显示导致错误的所有解析器的回溯？

为什么双破折号 (--) 会导致此 MariaDB 子句评估为 true？

AdMob：MobileAds.initialize() - 对于某些设备，“java.lang.Integer 无法转换为 java.lang.String”

ELF 重定位的应用顺序在哪里指定？

为什么 GCC 生成有条件执行 SIMD 实现的代码？

Selenium urllib.error.HTTPError：HTTP 错误 404：未找到

Box::new() 会从堆栈复制到堆吗？

sizeof("string") 的正确输出是什么？

使用 <font color="#xxx"> 突出显示 html 中的代码

我正在尝试仅使用海龟随机和数学模块来制作吃豆人游戏

C++17 中 std::byte 只能按位运算？

Haskell Megaparsec：如何显示导致错误的所有解析器的回溯？

1 个回答

相关问题