多模态是啥意思(多模态包括哪些模态)
admin
2023-03-18 22:02:02
0

  人工智能板块经过短暂调整后周五再度大涨,与微软达成合作、从事AI训练数据的海天瑞声收盘20cm涨停,彩讯股份、汤姆猫和蓝色光标均涨超15%。

K图 688787_0

  消息面上,当下炙手可热的人工智能公司OpenAI于周三凌晨发布了其多模态预训练大模型GPT-4,这也是该公司大型语言模型的最新版本。根据OpenAI的公告,GPT-4是一个大型多模态模型,能接受图像和文本输入,再输出正确的文本回复。此外,当地时间3月16日,微软正式宣布,Microsoft 365服务将全面接入聊天机器人技术AI Copilot.微软表示,Copilot不仅仅是嵌入到Microsoft 365中的ChatGPT,它的背后是一个复杂的处理和编排引擎,有来自GPT-4等模型的支持

  据媒体报道称,OpenAI已把ChatGPT直接升级成GPT-4版,也已开放GPT-4的API.海通证券认为,总的来说,GPT-4相对于以前的模型(经过多次迭代和改进)已经显著减轻了幻觉问题。在OpenAI的内部对抗性真实性评估中,GPT-4的得分比最新的GPT-3.5模型高40%

image

  浙商证券刘雯蜀在3月15日研报中表示,GPT-4实现了从单模态大模型到多模态大模型的重要突破,未来有望随着模型算法的加速迭代,实现对音频、视频等多模态数据的融合,完成各类跨模态任务,充分打开AI商业化应用空间。

  东方证券浦俊懿3月15日研报中指出,基于GPT-4对话交互的特性,GPT-4将率先在教育、医疗、企业经营管理办公等领域实现落地,场景与人工智能的结合方式值得期待。未来几年是多模态大模型的快速发展窗口期,相关的大模型算法、算力基础设施、下游B端通用应用软件和垂直行业领域都有望迎来加速增长

  公开资料显示,多模态算法即融合文字、图片、音视频等多种内容形式的AI算法,多模态出世之前,AI模型只专注于单一领域,例如自然语言处理或计算机视觉等;多模态技术出现后,模型已经从早期单一的自然语言处理和机器视觉发展成自动生成图画、图像文字、音视频等多模态、跨模态图型,极大的推动了AIGC的内容多样性和通用性

image

  GPT-4在回答准确性、识图能力、歌词以及文本生成等任务能力的大幅提升,使其具备更高的商业价值和更多的应用场景。3月15日,微软副总裁兼消费者首席营销官YusufMehdi发文确认了新Bing(必应)搜索引擎已运行GPT-4,而包含摩根士丹利、duolingo在内的政府及企业已布局GPT-4技术以实现多样化的功能。

image

  国盛证券刘高畅在3月15日研报中认为,现阶段主要用于搜索及聊天机器人,1-5年内简单多模态应用,5-10年内用于复杂问题决策。多模态GPT落地应用速度将会很快,国内有望复现类似模型并快速在细分场景使用。据财联社不完全整理,目前涉及多模态GPT相关应用的上市公司包括汤姆猫、东港股份、吉宏股份、科大讯飞、三六零、万兴科技、拓维信息、天娱数科、海天瑞声等

image

  西部证券邢开允等在3月15日研报中表示,建议从两方面进行关注,首先聚焦产品销售主要在海外,可以直接接入openAI的公司。如万兴科技旗下拥有万兴喵影、亿图软件等产品,布局图文、视频剪辑等赛道,绝大部分收入来自海外;昆仑万维布局多模态,游戏收入主要来自海外,opera浏览器有望率先接入GPT-4落地

  新国都子公司布局AI内容生成、视频处理技术,在海外市场推出多款产品;福昕软件的PDF浏览器、编辑器等布局海外市场,9成收入来自海外,有望率先接入GPT-4落地

  另一方面邢开允建议关注国内多模态AI解决方案厂商,包括创维数字打造横跨国内外的多模态AI边缘算力和多模态应用平台,有望快速接入openAI、谷歌等大模型;博汇科技作为音视频监管小巨头,受益广电信创和GPT-4多模态带来的内容安全新需求;罗普特和当虹科技聚焦AI视觉应用,有望受益GPT-4多模态应用

  此外,浦俊懿指出在算法能力领域,建议关注三六零、科大讯飞等;算力基础设施领域,建议关注中科曙、海光信息、浪潮信息、寒武纪-U等;B端通用应用软件领域,建议投资者关注致远互联、ST泛微、用友网络、鼎捷软件、彩讯股份、金山办公、汉得信息、拓尔思等

(文章来源:财联社)

相关内容

热门资讯

linux入门---制作进度条 了解缓冲区 我们首先来看看下面的操作: 我们首先创建了一个文件并在这个文件里面添加了...
C++ 机房预约系统(六):学... 8、 学生模块 8.1 学生子菜单、登录和注销 实现步骤: 在Student.cpp的...
A.机器学习入门算法(三):基... 机器学习算法(三):K近邻(k-nearest neigh...
数字温湿度传感器DHT11模块... 模块实例https://blog.csdn.net/qq_38393591/article/deta...
有限元三角形单元的等效节点力 文章目录前言一、重新复习一下有限元三角形单元的理论1、三角形单元的形函数(Nÿ...
Redis 所有支持的数据结构... Redis 是一种开源的基于键值对存储的 NoSQL 数据库,支持多种数据结构。以下是...
win下pytorch安装—c... 安装目录一、cuda安装1.1、cuda版本选择1.2、下载安装二、cudnn安装三、pytorch...
MySQL基础-多表查询 文章目录MySQL基础-多表查询一、案例及引入1、基础概念2、笛卡尔积的理解二、多表查询的分类1、等...
keil调试专题篇 调试的前提是需要连接调试器比如STLINK。 然后点击菜单或者快捷图标均可进入调试模式。 如果前面...
MATLAB | 全网最详细网... 一篇超超超长,超超超全面网络图绘制教程,本篇基本能讲清楚所有绘制要点&#...
IHome主页 - 让你的浏览... 随着互联网的发展,人们越来越离不开浏览器了。每天上班、学习、娱乐,浏览器...
TCP 协议 一、TCP 协议概念 TCP即传输控制协议(Transmission Control ...
营业执照的经营范围有哪些 营业执照的经营范围有哪些 经营范围是指企业可以从事的生产经营与服务项目,是进行公司注册...
C++ 可变体(variant... 一、可变体(variant) 基础用法 Union的问题: 无法知道当前使用的类型是什...
血压计语音芯片,电子医疗设备声... 语音电子血压计是带有语音提示功能的电子血压计,测量前至测量结果全程语音播报࿰...
MySQL OCP888题解0... 文章目录1、原题1.1、英文原题1.2、答案2、题目解析2.1、题干解析2.2、选项解析3、知识点3...
【2023-Pytorch-检... (肆十二想说的一些话)Yolo这个系列我们已经更新了大概一年的时间,现在基本的流程也走走通了,包含数...
实战项目:保险行业用户分类 这里写目录标题1、项目介绍1.1 行业背景1.2 数据介绍2、代码实现导入数据探索数据处理列标签名异...
记录--我在前端干工地(thr... 这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 前段时间接触了Th...
43 openEuler搭建A... 文章目录43 openEuler搭建Apache服务器-配置文件说明和管理模块43.1 配置文件说明...