java – Spark Strutured Streaming自动将时间戳转换为本地时间

前端之家收集整理的这篇文章主要介绍了java – Spark Strutured Streaming自动将时间戳转换为本地时间前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
我有UTC和ISO8601的时间戳,但使用结构化流,它会自动转换为本地时间.有没有办法阻止这种转换?我想在UTC中使用它.

我正在从Kafka读取json数据,然后使用from_json Spark函数解析它们.

输入:

  1. {"Timestamp":"2015-01-01T00:00:06.222Z"}

流:

  1. SparkSession
  2. .builder()
  3. .master("local[*]")
  4. .appName("my-app")
  5. .getOrCreate()
  6. .readStream()
  7. .format("kafka")
  8. ... //some magic
  9. .writeStream()
  10. .format("console")
  11. .start()
  12. .awaitTermination();

架构:

  1. StructType schema = DataTypes.createStructType(new StructField[] {
  2. DataTypes.createStructField("Timestamp",DataTypes.TimestampType,true),});

输出

  1. +--------------------+
  2. | Timestamp|
  3. +--------------------+
  4. |2015-01-01 01:00:...|
  5. |2015-01-01 01:00:...|
  6. +--------------------+

如您所见,小时数自动增加.

PS:我试着尝试使用from_utc_timestamp Spark函数,但没有运气.

解决方法

对我来说它起作用了:
  1. spark.conf.set("spark.sql.session.timeZone","UTC")

它告诉spark sql使用UTC作为时间戳的默认时区.我在spark sql中使用它,例如:

  1. select *,cast('2017-01-01 10:10:10' as timestamp) from soMetable

我知道它在2.0.1中不起作用.但适用于Spark 2.2.我在sqlTransformer中也使用过它.

我不确定流媒体.

猜你在找的Java相关文章