目前,8核32G的配置,单条速度约400ms左右,我是转onnx模型后,使用go-onnxruntime库加载的模型
我能想到比较简单的实现也是 ONNX ,其他的方法只学习过,没有实践过。
· Sign up or log in to comment