分类: 未分类

Python对json嵌套引号的处理

今天在写煎蛋的爬虫,解析吐槽返回的json发现出错:

发现引起错误的json在双引号中嵌套了双引号,如下所示:

查了下,使用Python处理json字符串中的非法双引号 似乎显示的是同样的问题,但是他的解决方法在这儿似乎行不通,因为他那儿有意义的"情况有限,直接穷举了。
于是换个思路,检测"前后有无 {}[], 来判定引号有没有意义,无意义则在其前加入\,代码如下:

结果如下:

虽然暂时能跑了,但是无法处理内部引号前有{}[],的情况,而且似乎效率有点低…不知道这个问题有没有更好的解决方法了…誒…

喵?

评论