Encontrei um problema em que as aspas na saída JSON de uma consulta MySQL não estavam sendo escapadas. Executei o seguinte comando para extrair dados de um banco de dados WordPress e salvá-los em um arquivo:
echo "SELECT JSON_OBJECT('id', ID, 'title', post_title, 'body', post_content) FROM wp_posts LIMIT 1;" | mysql -u root -p blog_gslin_org > blog.output
Depois de inserir a senha e verificar o conteúdo de blog.output
, percebi que as aspas dentro dos valores JSON não têm escape, o que pode levar a erros de análise quando o JSON for consumido por outros aplicativos. Aqui está um trecho da saída:
{"id": 2, "title": "關於我 (about me)", "body": "這個 Blog 主要是偏技術方面的資訊 (以及各種雜七雜八的抱怨文章),另外有幾個 Blog 是其他方面的:\\r\\n\\r\\n<ul>\\r\\n\\t<li><a href=\\"http://blog.gslin.info/\\" rel=\\"tag\\">blog.gslin.info</a>:<del datetime=\\"2007-07-14T09:49:18+00:00\\">跟課業有關的 (包括實驗室研究的東西)。</del>改放 ACG 相關的資訊。</li>\\r\\n\\t<li><a href=\\"http://blog.gslin.net/\\" rel=\\"tag\\">blog.gslin.net</a>:跟網路有關的。</li>\\r\\n</ul>\\r\\n\\r\\n除了 Blog 外,你可以在這些地方找到我:\\r\\n\\r\\n<ul>\\r\\n\\t<li><a href=\\"https://abpe.org/@gslin\\">Mastodon</a></li>\\r\\n\\t<li><a href=\\"https://twitter.com/gslin\\">Twitter</a></li>\\r\\n\\t<li><a href=\\"https://www.facebook.com/gslin\\">Facebook</a></li>\\r\\n\\t<li><a href=\\"https://www.plurk.com/gslin\\">Plurk</a></li>\\r\\n\\t<li><a href=\\"https://www.instagram.com/gslin\\">Instagram</a></li>\\r\\n\\t<li><a href=\\"https://www.flickr.com/photos/gslin\\">Flickr</a></li>\\r\\n\\t<li><a href=\\"https://www.linkedin.com/in/gslin/\\">Linkedin</a></li>\\r\\n</ul>\\r\\n\\r\\n關於我的連絡的方法:gslin at gslin.com (主要)、darkkiller at gmail.com (也是要)、gslin at gslin.org (備用)。"}
Como você pode ver, os URLs no campo body incluem aspas sem escape. Estou curioso para saber se existe uma maneira de garantir que a saída do MySQL escape corretamente desses caracteres para produzir JSON válido que possa ser analisado com segurança por qualquer analisador JSON.
Existe um sinalizador ou opção específica que devo usar com minha consulta MySQL ou existe uma abordagem recomendada para lidar com esse tipo de extração de dados e conversão para JSON?
Editar: um exemplo mínimo conforme solicitado:
$ mysql --version
mysql Ver 8.0.35-27 for Linux on x86_64 (Percona Server (GPL), Release '27', Revision '2f8eeab2'$)
$ mysql -u root -p
Enter password:
Welcome to the MySQL monitor. Commands end with ; or \g.
Your MySQL connection id is 14
Server version: 8.0.35-27 Percona Server (GPL), Release '27', Revision '2f8eeab2'$
Copyright (c) 2009-2023 Percona LLC and/or its affiliates
Copyright (c) 2000, 2023, Oracle and/or its affiliates.
Oracle is a registered trademark of Oracle Corporation and/or its
affiliates. Other names may be trademarks of their respective
owners.
Type 'help;' or '\h' for help. Type '\c' to clear the current input statement.
mysql> SELECT VERSION();
+-----------+
| VERSION() |
+-----------+
| 8.0.35-27 |
+-----------+
1 row in set (0.00 sec)
Crie uma tabela e adicione dados:
$ mysql -u root -p test
mysql> CREATE TABLE post (id INT UNSIGNED PRIMARY KEY AUTO_INCREMENT, content LONGTEXT NOT NULL);
Query OK, 0 rows affected (0.01 sec)
mysql> INSERT INTO post (content) VALUES ('<a href="https://www.example.com/">www.example.com</a>');
Query OK, 1 row affected (0.00 sec)
Então confira:
mysql> SELECT * FROM post;
+----+--------------------------------------------------------+
| id | content |
+----+--------------------------------------------------------+
| 1 | <a href="https://www.example.com/">www.example.com</a> |
+----+--------------------------------------------------------+
1 row in set (0.00 sec)
mysql> SELECT JSON_OBJECT("content", content) FROM post;
+-------------------------------------------------------------------------+
| JSON_OBJECT("content", content) |
+-------------------------------------------------------------------------+
| {"content": "<a href=\"https://www.example.com/\">www.example.com</a>"} |
+-------------------------------------------------------------------------+
1 row in set (0.00 sec)
Então, no shell ( tail -n +2
aqui é para pular a primeira linha):
$ echo "SELECT JSON_OBJECT('content', content) FROM post;" | mysql -u root -p test | tail -n +2
Enter password:
{"content": "<a href=\\"https://www.example.com/\\">www.example.com</a>"}
Valide através de jq
:
$ echo "SELECT JSON_OBJECT('content', content) FROM post;" | mysql -u root -p test | tail -n +2 | jq .
Enter password:
parse error: Invalid numeric literal at line 1, column 30
Portanto, o problema é que as aspas têm escape duplo .
A saída de JSON_OBJECT() contém uma única barra invertida antes dos caracteres de aspas literais. Em seguida, a saída do
mysql
cliente adiciona outra barra invertida na frente da única barra invertida.Você pode controlar isso com a opção
--raw
(ou-r
) para o cliente mysql.https://dev.mysql.com/doc/refman/8.0/en/mysql-command-options.html#option_mysql_raw
Primeiro eu testo sem
--raw
o que resulta no mesmo erro que você obteve:Então adiciono a
--raw
opção (usei-r
abreviadamente):