您好,欢迎访问长三角智库平台

上传文档

当前位置:首页 > 证券研报库 > 行业研报库 > 文化传媒

传媒互联网行业周报:DeepSeek降低模型成本,Kimi+进一步扩宽应用场景

  • 管理员
  • 5 次阅读
  • 1 次下载
  • 2024-06-13 11:14:38

还剩... 页未读,继续阅读

免费阅读已结束,点击付费阅读剩下 ...

¥ 1 元,已有5人购买

付费阅读

阅读已结束,您可以下载文档离线阅读

¥ 1 元,已有1人下载

付费下载
文档简介:

请务必阅读正文之后的免责条款部分守正出奇宁静致远1[Table_Title]传媒互联网DeepSeekDeepSeek降低模型成本,降低模型成本,Kimi+Kimi+进一步扩宽应用场景进一步扩宽应用场景[Table_Summary][Table_Summary]报告摘要报告摘要➢DeepSeekDeepSeek--V2V2发布,模型成本显著下降发布,模型成本显著下降DeepSeek发布开源MoE大模型DeepSeek-V2,该模型能力突出,中文和英文综合能力评测得分分别接近于GPT-4-Turbo和LLaMA3-70B。值得注意的是,DeepSeek-V2显著降低模型训练和推理成本。11)训练成本方面,)训练成本方面,其稀疏MoE架构进行了共享专家等改进,相比V1的稠密模型,节约了42.5%的训练成本。22)推理成本方面,)推理成本方面,通过创新性地运用先进的注意力机制MLA,压缩token生成中对keyvalue的缓存,极大降低了推理成本。从API的定价来看,DeepSeek-V2API每百万tokens输入1元、输出2元,显著低于海内外主流大模型,如GPT-4-Turbo每百万t

管理员
管理员
  • 77049

    文档
  • 22.4

    金币
Ta的主页 发私信

77049篇文档

评论

发表评论
< /22 > 付费下载 ¥ 1 元
Copyright © 长三角智库平台 All Rights Reserved. 沪ICP备20011950号-1
×
保存成功