llama3.2-3B INT8

模型

用于端侧 AI 推理、处理简单查询的量化小模型，首 token 延迟 ~480ms

1 次提及2 个连接首次出现: 2026-06-09最近出现: 2026-06-09

关系图谱

关系 (2)

使用 (1)

知易智能知识管家

竞争 (1)

Qwen2.0-7B INT8

相关文章 (1)