System.Text.Json序列化Unicode字符(如表情符号)的问题

我正在将应用程序从.NET Core 2.2升级到.NET Core 3.0,并且新的System.Text.Json序列化程序与Newtonsoft在2.2中的行为不同。在诸如不间断空格(\ u00A0)或表情符号字符之类的字符上,Newtonsoft(甚至Utf8Json)将它们序列化为实际字符,而不是Unicode代码。

我创建了一个简单的.NET Fiddle来演示这一点。

var input = new Foo { Bar = "\u00A0 Test !@#$%^&*() ?\uD83D\uDCAF 你好" };
var newtonsoft = Newtonsoft.Json.JsonConvert.SerializeObject(input);
var system = System.Text.Json.JsonSerializer.Serialize(input,new System.Text.Json.JsonSerializerOptions
    {
        Encoder = System.Text.Encodings.Web.JavaScriptEncoder.UnsafeRelaxedJsonescaping,});
var utf8Json = Utf8Json.JsonSerializer.ToJsonString(input);

Console.WriteLine($"Original: {input.Bar} - {input.Bar.Contains('\u00A0')}"); // Original
Console.WriteLine($"Newtonsoft: {newtonsoft} - {newtonsoft.Contains('\u00A0')}"); // Works
Console.WriteLine($"System.Text.Json: {system} - {system.Contains('\u00A0')}"); // Does not work
Console.WriteLine($"Utf8Json: {utf8Json} - {utf8Json.Contains('\u00A0')}"); // Works

https://dotnetfiddle.net/erCaZl

是否有像Newtonsoft一样进行序列化的Encoder或JsonSerializerOptions属性?

lvhg1985 回答:System.Text.Json序列化Unicode字符(如表情符号)的问题

这是设计使然。我们的目标是提供安全的默认值,这就是为什么我们逃避任何事实(因为事实是安全的)而无法进行的。出于实际原因,我们无法检测到所有安全字符,因为这将意味着我们要运送大表并执行可能不重要的查找。

如果您真的坚持,可以扩展JavaScriptEncoder类并自己选择编码的字符。我建议不要这样做,因为如果您不小心,人们可能会潜入可能更改JSON语义的有效负载。

本文链接:https://www.f2er.com/3149043.html

大家都在问