您好,欢迎访问长三角智库平台

上传文档

当前位置:首页 > 证券研报库 > 行业研报库 > 文化传媒

传媒行业快报:GPT模型迭代更新,专注多模态与端侧应用

  • 管理员
  • 7 次阅读
  • 1 次下载
  • 2024-06-13 11:14:38

还剩... 页未读,继续阅读

免费阅读已结束,点击付费阅读剩下 ...

¥ 1 元,已有7人购买

付费阅读

阅读已结束,您可以下载文档离线阅读

¥ 1 元,已有1人下载

付费下载
文档简介:

http://www.huajinsc.cn/1/3请务必阅读正文之后的免责条款部分2024年05月14日行业研究●证券研究报告传媒传媒行业快报行业快报GPT模型迭代更新,专注多模态与端侧应用模型迭代更新,专注多模态与端侧应用投资要点投资要点事件:事件:5月14日凌晨,OpenAI发布新一代旗舰生成模型GPT-4o、桌面App,并展示新功能。GPT-4o(“o”代表“Omni”译为全能)更接近自然人机交互。接受文本、音频和图像的任意组合作为输入,并生成文本、音频和图像输出。端到端训练端到端训练,,模型实现文本模型实现文本、、图像图像、、音频跨模态整合音频跨模态整合。。根据OpenAI官网,GPT-4o音频反馈时长为232毫秒,平均反馈时长为320毫秒,已接近人类对话发应时间。早期音频模式:由三个独立模型组成(语音转文本-GPT3.5/GPT-4-文本转语音),会丢失大量信息并存在延迟GPT-3.5(2.8秒)、GPT-4(5.4秒),同时无法表达情感、唱歌等。GPT-4o模型特点:实现跨文本、视觉和音频训练,所有输入和输出由单一神经网络处理;实时反馈及情绪感知。各细分表现:语音翻

管理员
管理员
  • 77049

    文档
  • 22.4

    金币
Ta的主页 发私信

77049篇文档

评论

发表评论
< /3 > 付费下载 ¥ 1 元
Copyright © 长三角智库平台 All Rights Reserved. 沪ICP备20011950号-1
×
保存成功