我有一个包含一些非bmc字符的json文件(示例):
{ “ header”:“ YouTube”,
“ title”:“观看了世界记录的触摸挑战!|过载的发射器PO”,
“ titleUrl”:“ https://www.youtube.com/watch?v \ u003dY7iEpiH_9Ls”,
“ 时间“:” 2019-11-03T14:58:48.945Z“ }
因此,在打开文件python时出现错误:
UnicodeEncodeError:“ ucs-2”编解码器无法对位置69-69中的字符进行编码:Tk中不支持非BMP字符
我正在尝试从json文件中检索每个标题,而表情符号对我来说并不重要,但我无法找到一种在打开文件时忽略或替换表情符号的方法。
import json
import codecs
types_of_encoding = ["utf8","cp1252"]
for encoding_type in types_of_encoding:
with codecs.open('watch-history.json',encoding= encoding_type,errors='replace') as f:
data = json.load(f)
for dict in data:
print(dict['title'])