DeepSeek V4
模型DeepSeek V4,深度求索(DeepSeek)的混合专家大语言模型,总参数量1.6万亿/激活参数490亿,支持1M超长上下文并采用CSA与HCA混合注意力架构
158 次提及132 个连接最近出现: 2026-06-28
关系图谱
关系 (157)
竞争 (43)
GPT-4GPT-5MiMo-V2.5-ProGemini-Pro-3.1Claude Opus 4.6Claude Sonnet 4.6Gemini 2.5 ProClaude Opus 4Gemini 2.0GLM-5OpenAIGoogle DeepMindAnthropicDeepSeek V3Kimi MoonshotGLM-5.1Claude Opus 4.7GPT-5.5GPT-5.4Gemini 3.1 ProKimi K2.6LLaMA 4闭源MiniMax-01Hy3 previewLongCat-2.0-PreviewGPT-4oClaudeOpusClaude Sonnet混元 Hy3字节跳动SenseNova U1MiniCPM-V 4.6Opus 4.6GLM-5GLM5.1MiMo-V2.5Step 3.7 FlashMiniMax M3Gemini 3.5 Flash智源研究院GPT-4o mini
使用 (40)
使用技术 (39)
多模态理解开源Mixture of ExpertsMoEAttention MechanismDSAFunction CallingKV CacheSFTGRPOTransformerAgentAI编程助手Supervised Fine-TuningChain-of-ThoughtMCPMuonCSAHCAmHCRAG图像理解混合注意力架构Engram强化学习蒸馏MCPFlagOSTileLangAgentic Harness EngineeringOPDHiCacheHiSparseShadow RadixNPUSGLang RBGPD 分离DSparkSpeculative Decoding
基于 (12)
相关文章 (158)
下滑加载更多...(已显示 30 / 158)