阿里达摩院开源Video-LLaMA 帮大语言模型加上“眼睛”“耳朵”_产品_产业

产品

阿里达摩院开源Video-LLaMA 帮大语言模型加上“眼睛”“耳朵”

来源：财联社
2023-06-12 18:18

阿里达摩院的研究人员提出了Video-LLaMA，一个具有综合视听能力大模型。Video-LLaMA能够感知和理解视频中的视频和音频信号，并能理解用户输入的指令，完成一系列基于音视频的复杂任务，例如音/视频描述，写作，问答等。

阿里达摩院开源Video-LLaMA 帮大语言模型加上“眼睛”“耳朵”

阿里达摩院的研究人员提出了Video-LLaMA，一个具有综合视听能力大模型。Video-LLaMA能够感知和理解视频中的视频和音频信号，并能理解用户输入的指令，完成一系列基于音视频的复杂任务，例如音/视频描述，写作，问答等。目前论文，代码，交互demo都已开放。另外，在Video-LLaMA的项目主页中，该研究团队还提供了中文版本的模型，让中文用户的体验更好。

阿里达摩院开源Video-LLaMA 帮大语言模型加上“眼睛”“耳朵”

关键词

相关阅读

讯飞星火大模型V1.5发布：综合能力三大升级，发布星火APP

AI大模型引领智能生产，工业领域迎来“兴奋时刻”

华商基金看行业之人工智能：AI大模型蓬勃发展应用与算力强势出击

又一 AI 大模型重磅发布，企商在线为其筑牢智能算力底座

Gomu获得B轮融资携手XstarClub开启NFT新模型

“腰部”大模型，活在故事里

李开复谈AI 2.0：自主创新是中国人工智能大模型必经之路

人工智能可准确识别早期癌症？英国开发AI模型提升精准度

腾讯音乐申请“文曲大模型”系列商标，已有多个AIGC应用落地

脑机接口重磅成果发布，微美全息（WIMI.US）深耕研发BCI游戏模型和范式

24快报

元宇宙技术融入诗歌打卡环节第十届鼓浪屿诗歌节丰富活动收获众

超过一半财富100强企业已采用Apple Vision Pro

“红旗渠精神云上大思政”平台即将上线数字人“青雨”再次登场

山东外事职业大学元宇宙研究院总设计师赵彬携人形机器人“钢宝”

千年古城+元宇宙青白江城厢五一潮玩会火爆开启

捷瑞数字申请元宇宙模型构建专利，可构建考虑风化因素，用于兵马

深度融合医学前沿与科技创新，《元宇宙医学》创刊

新锋艺术数字资产运营研究中心在北京成立

扎克伯格的“元宇宙”梦还能坚持多久？

“百模大战”开启，北邮教授乔秀全：全社会不能都追热点，产学研

Apple Vision Pro或将于5月初在日本市场发布

可见可感可触当中关村论坛进入“元宇宙”

中关村发展集团总经理助理苗军：元宇宙在医疗、制造等领域的创新

中关村论坛“元宇宙”引关注南中轴科技园率先培育产业基地

Meta如果继续押注元宇宙，投资者可能会“用脚投票”

把大三巴、大报恩寺搬上元宇宙 “新文旅”遇见“新科技”

北京星光影视园组建元宇宙直播基地企业集团

工体元宇宙现身2024中关村论坛年会沉浸体验点球大战

Meta首款真正AR眼镜原型将超越现有产品设定预期

网易瑶台打造2024中关村论坛元宇宙，一手参会体验来了！