C114
通信人家园
English
公众号矩阵

投稿
举报

量子大观

通信人家园

C114通信网

光通信观察

DVBCN中广5G

2024/12/18 13:50

Meta 推出 Apollo 开源模型，让 AI “看懂”视频

IT之家故渊

0

0

Meta 携手斯坦福大学，推出全新 AI 模型系列 Apollo，显著提升机器对视频的理解能力。

注：尽管人工智能在处理图像和文本方面取得了巨大进步，但让机器真正理解视频仍然是一个重大挑战。

视频包含复杂的动态信息，人工智能更难处理这些信息，不仅需要更多的计算能力，而且如何设计最佳 AI 视频解读系统，也存在诸多困难。

在视频处理方面，研究人员发现，保持每秒恒定的帧采样率能获得最佳结果。因此 Apollo 模型使用两个不同的组件，一个处理单独的视频帧，而另一个跟踪对象和场景如何随时间变化。

此外，在处理后的视频片段之间添加时间戳，有助于模型理解视觉信息与文本描述之间的关系，保持时间感知。

在模型训练方面，团队研究表明训练方法比模型大小更重要。Apollo 模型采用分阶段训练，按顺序激活模型的不同部分，比一次性训练所有部分效果更好。

此外 Meta 公司还不断优化数据组合，发现 10~14% 的文本数据，其余部分略微偏向视频内容，可以更好地平衡语言理解和视频处理能力。

Apollo 模型在不同规模上均表现出色，较小的 Apollo-3B 超越了 Qwen2-VL 等同等规模的模型，而 Apollo-7B 超过更大参数的同类模型，Meta 已开源 Apollo 的代码和模型权重，并在 Hugging Face 平台提供公开演示。

免责声明：本文仅代表作者个人观点，与C114通信网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

给作者点赞

0 VS 0

写得不太好

相关链接

AI 人工智能

对标OpenClaw，Meta被曝开发个性化AI智能体
凤凰网科技萧雨5-6
消息称Meta为撤销收购Manus做准备腾讯等投资者计划配合
凤凰网科技箫雨4-28
为训练 AI，Meta 将采集员工的鼠标与键盘操作数据
IT之家远洋4-22
欧盟初步认定Meta违反反垄断规则：要求恢复第三方AI助手访问WhatsApp
快科技建嘉4-16

特别策划

热门文章

成都电信空芯光纤集采：亨通光电中标

5/19

新华三乔剡：联接已成为算力效能的关键变量，以网络创新使能Token极致性价比

5/20

“十五五”开局启新程：中天科技发布文化、ESG、AI三项战略成果

5/17

紫光国微：未收到控股股东注入GPU、CPU的通知

5/14

中国移动22529台CPE OTN设备集采：瑞斯康达等六家中标

5/19

最新视频

三大运营商集体下场抢AI生意！Token套餐价格战开打，谁能笑到最后？

5/21

一箭18星！“千帆星座”第九批组网卫星成功发射

5/18

2026年5月15日，中国电信第六届科技节上海站启幕！

5/15

限购75000颗！美国批准10家中国企业采购英伟达H200

5/15

一飞冲天！朱雀二号改进型遥五运载火箭发射成功

5/14

为您推荐

C114简介联系我们网站地图

Copyright©1999-2025 c114 All Rights Reserved 沪ICP备12002291号-4

C114通信网版权所有举报电话：021-54451141 用户注销