如何加快Tensorflow 2 keras模型的推理速度？

2024-05-01 • 问答

因此，如今有一个重大更新，从TensorFlow 1.X迁移到2.X。

在TF 1.X中，我习惯了一条管道，该管道帮助我将keras模型推向了生产。管道：keras (h5) model --> freeze & convert to pb --> optimize pb 该工作流程帮助我加快了推理速度，最终模型可以存储为单个（pb）文件，而不是文件夹（请参阅Savedmodel格式）。

如何在TensorFlow 2.0.0中优化模型以进行推理？

我的第一印象是我需要将tf.keras模型转换为tflite，但是由于我的GPU使用float32操作，因此这种转换会使我的生活更加艰难。

谢谢。

一种方法是使用 Tensorflow 和 TensorRT (TF-TRT) (https://github.com/tensorflow/tensorrt) 来优化您的模型。但是，在 Tensorflow 2 中，模型保存在文件夹中，而不是单个 .pb 文件中。 TF-TRT 优化模型也是如此，它们存储在一个文件夹中。您可以将模型转换为 TF-TRT：

from tensorflow.python.compiler.tensorrt import trt_convert as trt
converter = tf.experimental.tensorrt.Converter(input_saved_model_dir=saved_model_dir)
converter.convert() 
converter.save("trt_optimized_model") # save it to a dir

如果您要求模型需要包含在单个文件中（并且不关心 TF-TRT 提供的优化），您可以将 SavedModel 转换为 ONNX。并使用 ONNX 运行时进行推理。您甚至可以在这里更进一步，将 ONNX 文件转换为 TensorRT (https://developer.nvidia.com/Tensorrt)。这将为您提供一个可以使用 TensorRT 运行的优化文件（请注意，您不能再使用 Tensorflow 运行生成的文件）。

如何加快Tensorflow 2 keras模型的推理速度？

rayest 回答：如何加快Tensorflow 2 keras模型的推理速度？

大家都在问