TensorRT 多线程推理

发表于 2023-04-13 更新于 2025-02-02 分类于 2-深度学习， D-深度学习部署， TensorRT 阅读次数：本文字数： 589 阅读时长 ≈ 1 分钟

同步：就是调用某个东西是，调用方得等待这个调用返回结果才能继续往后执行
异步：和同步相反调用方不会理解得到结果，而是在调用发出后调用者可用继续执行后续操作，被调用者通过状体来通知调用者，或者通过回调函数来处理这个调用
FPS： Frames Per Second 更确切的解释是 “每秒钟处理图像的帧数（帧 / 秒）“
Host Latency (本机推断耗时)：单个推断请求的耗时
Throughput (吞吐量)：指系统在单位时间内处理请求的数量，对于无并发的应用系统而言，吞吐量与响应时间成严格的反比关系，实际上此时吞吐量就是响应时间的倒数，对于并发系统，通常需要用吞吐量作为性能指标