如何在python中打开包含非BMC字符的文件？

2024-05-19 • 问答

我有一个包含一些非bmc字符的json文件（示例）：

{     “ header”：“ YouTube”，
    “ title”：“观看了世界记录的触摸挑战！|过载的发射器PO”，
    “ titleUrl”：“ https://www.youtube.com/watch?v \ u003dY7iEpiH_9Ls”，
“   时间“：” 2019-11-03T14：58：48.945Z“   }

因此，在打开文件python时出现错误：

UnicodeEncodeError：“ ucs-2”编解码器无法对位置69-69中的字符进行编码：Tk中不支持非BMP字符

我正在尝试从json文件中检索每个标题，而表情符号对我来说并不重要，但我无法找到一种在打开文件时忽略或替换表情符号的方法。

import json
import codecs

types_of_encoding = ["utf8","cp1252"]
for encoding_type in types_of_encoding:
    with codecs.open('watch-history.json',encoding= encoding_type,errors='replace') as f:
      data = json.load(f)

    for dict in data:
        print(dict['title'])

如何在python中打开包含非BMC字符的文件？

yingzishiwo 回答：如何在python中打开包含非BMC字符的文件？

大家都在问