
火山引擎在FORCE原动力大会上正式发布了豆包大模型1.8及音视频创作模型Seedance 1.5 pro。评测数据显示配资网站首页 配资,豆包大模型在多模态理解、生成能力及Agent能力上已跻身全球第一梯队。

火山引擎总裁谭待表示,截至今年12月,豆包大模型日均token使用量突破50万亿,较去年同期增长超过10倍。目前已有超过100家企业客户累计token使用量超过1万亿。

Seedance 1.5 pro音视频创作模型实现了毫秒级的音画同步输出,支持多人多语言对话,口型对齐精准,生成的视频展现出影视级叙事张力。谭待在接受媒体采访时进一步分享了Seedance 1.5 pro的优势,强调音画同步不仅包括声音和画面同步,还需要与语义同步。他透露,Seedance系列很快将上线“Draft样片”功能,让预览视频更快且成本更低。

豆包大模型1.8面向多模态Agent场景进行了定向优化,工具调用能力、复杂指令遵循能力及OS Agent能力均得到增强。在视觉理解方面,豆包1.8的单次视频理解帧数从640帧增加到1280帧,支持低帧率理解超长视频,并能调用工具对关键片段进行高帧率理解。该模型支持256K上下文,拥有更灵活的上下文管理,擅长处理复杂多步任务。

在多项公开评测中,豆包1.8在视觉推理、通用视觉问答、空间理解及视频理解等任务中均获得最佳或接近最佳成绩,在通用智能体测评集BrowserComp上表现全球领先。在数学与推理等基础能力维度上,整体水平已接近全球顶尖的通用模型。豆包1.8还在教育辅导、客服问答、信息处理、意图识别、信息抽取以及多步骤复杂工作流等应用场景中验证了其适用性。

此外,豆包1.8在GUI Agent能力、搜索任务、Agentic Coding相关基准测试以及金融商业相关任务中表现出色。在多模态推理任务中,豆包1.8超越了前代模型Seed1.5-VL,在大部分任务中接近目前最先进的Gemini-3-Pro。在被认为难度极高的视觉推理测试ZeroBench中,豆包1.8获得最高得分。在通用视觉问答任务中,该模型也大幅领先其他模型。

针对日益增长的视频创作需求,火山引擎推出了Seedance 1.5 pro音视频创作模型。该模型采用创新的原生音视频联合生成架构,支持环境音、背景音乐、人声等多种元素,实现了毫秒级的音画同步输出。在对白处理上,模型支持多人多语言对话,口型对齐精准,覆盖中文方言、英文及小语种,提升了视频内容的真实感与全球化创作潜力。即将上线的“Draft样片”功能可帮助创作者提升65%的整体效率,并减少60%的无效创作成本。

个人用户已可在豆包、即梦AI等平台体验该模型,企业用户则可从12月23日起通过火山引擎API接入Seedance 1.5 pro模型服务。

火山引擎全面升级了企业级AI Agent平台——AgentKit,覆盖了Agent从开发、部署到管控的全生命周期。同时,火山引擎推出了HiAgent智能体工作站,通过构建统一的企业AI任务调度中心,提供一系列开箱即用的通用智能体,帮助企业实现Agent的规模化管理与应用。为降低企业使用门槛,火山引擎还推出了业内首个“AI节省计划”,通过阶梯式折扣,帮助企业最高节省47%的成本。

火山引擎的AI云原生基础设施持续进化,推动AI应用从单一的模型调用向复杂的Agent智能体生态演进,加速AI能力在各行各业的深度落地。

配资网站首页 配资
通弘网提示:文章来自网络,不代表本站观点。