#LLM Benchmark

共 2 篇相关文章。

LLM"瘦身"之战：14B 模型量化后性能暴跌 30%？DeepSeek V3、Qwen 3、Llama 4 实测对比

实测DeepSeek V3、Qwen 3、Llama 4在INT4/INT8量化后的性能衰减曲线，揭示"模型越大越好"的迷思，给出中小企业私有化部署的性价比最优模型组合方案。

用同一套 Agent 任务（代码生成、文档摘要、数据分析、多步推理），在 Qwen3-70B/32B/14B/7B 四个尺度上跑分，用数据回答：什么时候该省 GPU，什么时候必须上大模型。