安装APP,随时看

您好，欢迎访问长三角智库平台

当前位置：首页 > 证券研报库 > 行业研报库 > 文化传媒

传媒互联网行业周报：DeepSeek降低模型成本，Kimi+进一步扩宽应用场景

管理员
5 次阅读
1 次下载
2024-06-13 11:14:38

举报
收藏

还剩... 页未读，继续阅读

免费阅读已结束，点击付费阅读剩下 ... 页

¥ 1 元，已有5人购买

付费阅读

阅读已结束，您可以下载文档离线阅读

¥ 1 元，已有1人下载

付费下载

文档简介：

请务必阅读正文之后的免责条款部分守正出奇宁静致远1[Table_Title]传媒互联网DeepSeekDeepSeek降低模型成本，降低模型成本，Kimi+Kimi+进一步扩宽应用场景进一步扩宽应用场景[Table_Summary][Table_Summary]报告摘要报告摘要➢DeepSeekDeepSeek--V2V2发布，模型成本显著下降发布，模型成本显著下降DeepSeek发布开源MoE大模型DeepSeek-V2，该模型能力突出，中文和英文综合能力评测得分分别接近于GPT-4-Turbo和LLaMA3-70B。值得注意的是，DeepSeek-V2显著降低模型训练和推理成本。11）训练成本方面，）训练成本方面，其稀疏MoE架构进行了共享专家等改进，相比V1的稠密模型，节约了42.5%的训练成本。22）推理成本方面，）推理成本方面，通过创新性地运用先进的注意力机制MLA，压缩token生成中对keyvalue的缓存，极大降低了推理成本。从API的定价来看，DeepSeek-V2API每百万tokens输入1元、输出2元，显著低于海内外主流大模型，如GPT-4-Turbo每百万t

77049
文档
22.4
金币

Ta的主页发私信

共77049篇文档

相关文档

传媒互联网行业周报：DeepSeek降低模型成本，Kimi+进一步扩宽应用场景 5

传媒互联网行业4月报：海外大模型接连发布更新，建议关注端到端多模态大模型趋势 4

传媒：Sora发布有望加速AI视频技术迭代进程，持续关注AI应用的商业化落地 3

传媒互联网行业周报：Claude 3刷新大模型能力边界，Kimi Chat引领长文本AI工具应用 6

传媒互联网行业周报：24年关注AI/MR/IP，和调整后的游戏 5

传媒互联网行业周报：GPT商店发布进一步验证AI商业化路径；春节档片单陆续定档 5

传媒互联网行业周报：苹果Vision Pro开启预售；算力升级有望带动AI产业蓬勃发展 5

传媒互联网行业周报：关注高股息、高分红的出版行业；虚拟拍摄/AI引领影视行业变革 4

传媒互联网行业周报：《网络游戏管理办法》（征求意见稿）旨在促进行业健康发展，进口游戏版号发布 6

MR行业点评：苹果Vision Pro内置丰富娱乐内容，内容与硬件有望形成正向循环 4

相关搜索

传媒互联网行业周报 DeepSeek 降低模型成本 Kimi 进一步扩宽场景

评论

发表评论

< /22 > 付费下载 ¥ 1 元

Copyright © 长三角智库平台 All Rights Reserved. 沪ICP备20011950号-1

保存成功