Wesum AI

llama3.2-3B INT8

模型

用于端侧 AI 推理、处理简单查询的量化小模型,首 token 延迟 ~480ms

1 次提及2 个连接首次出现: 2026-06-09最近出现: 2026-06-09

关系图谱

关系 (2)

相关文章 (1)