因此,如今有一个重大更新,从TensorFlow 1.X迁移到2.X。
在TF 1.X中,我习惯了一条管道,该管道帮助我将keras模型推向了生产。
管道:keras (h5) model --> freeze & convert to pb --> optimize pb
该工作流程帮助我加快了推理速度,最终模型可以存储为单个(pb)文件,而不是文件夹(请参阅Savedmodel格式)。
如何在TensorFlow 2.0.0中优化模型以进行推理?
我的第一印象是我需要将tf.keras模型转换为tflite,但是由于我的GPU使用float32操作,因此这种转换会使我的生活更加艰难。
谢谢。