随着人工智能技术的迅猛发展,每一次技术变革都预示着行业的跃迁式进步。面对以AI为核心的新一轮技术浪潮,企业如何在技术支撑上做好准备,迎接通用人工智能时代的到来,成为了亟待解决的问题。
近日,在2024火山引擎FORCE原动力大会冬季技术主论坛上,一系列创新产品及升级方案亮相,旨在解决企业在落地大模型过程中遇到的实际难题。字节跳动基础架构负责人赵鹏伟在会上表示,为了迎接通用人工智能时代,企业需要在性价比、创新及安全等多个维度进行布局。火山引擎为此提供了AI云原生式的全链路产品服务能力,涵盖豆包大模型、大模型服务、AI基础设施、数据和安全等多个方向的新成果,致力于与企业和开发者共同推进AI的创新变革。
赵鹏伟进一步指出,过去十年中,云原生架构以其弹性、存算分离及服务化等能力,为企业构建大规模业务系统提供了有力支持。然而,随着AI时代的到来,计算模式逐渐转向以GPU为核心,传统架构难以充分发挥GPU的高算力及高带宽优势。同时,GPU在训练和推理场景中对高速互联、在线存储及隐私安全提出了更高要求。因此,火山引擎提出,下一个十年的计算范式应进入AI云原生的新时代,以GPU为核心重新优化计算、存储与网络架构,实现GPU直接访问存储和数据库,显著降低IO延迟,并提供更高规模的高速互联及端到端的安全保护。
在计算层面,火山引擎推出了新一代GPU实例,通过vRDMA网络支持大规模并行计算和P/D分离推理架构,显著提升了训练和推理效率,降低了成本。在存储方面,新推出的EIC弹性极速缓存能够实现GPU直连,使大模型推理时延降低至原来的五十分之一,成本降低20%。在安全层面,火山引擎将推出PCC私密云服务,构建大模型的可信应用体系,实现用户数据在云上推理的端到端加密,且性能优越,推理时延与明文模式相比差异在5%以内。
作为一站式大模型服务平台,火山方舟通过Cache、离线推理模式等产品升级,以及全新发布的Prompt优解,加速了大模型能力的落地。Prompt优解通过“自动+互动”的方式协助用户编写提示词,使用户在互动中表达需求,快速上手。利用机器实现类似人类的反思、类比及错误总结能力,全自动优化prompt,助力企业以低成本高效率获得高质量prompt。目前,Prompt优解已通过火山方舟全面开放公测。
火山引擎始终坚持提供更低成本、更高质量的服务。为践行“人人用得起,才是好模型”的理念,火山引擎发布了离线批量推理方案和上下文缓存,帮助用户实现更为精细化和低成本的运营。全新发布的扣子1.5和HiAgent1.5,助力企业打造AI原生应用,跨越从通用大模型到企业AI应用落地的三道鸿沟。
豆包大模型也发布了多个新版本,包括豆包·视觉理解模型、豆包·文生图模型2.1和豆包·音乐模型,这些模型可以通过扣子以插件的方式体验,有助于更多多模态AI应用的诞生。在数据智能方面,火山引擎发布了数据飞轮2.0,通过AI创新重新定义企业数据智能,全面注入大模型,带来前所未有的决策洞察。通过一体化数智研发与一站式数据智能运营,简化工作流程,快速处理结构与非结构数据资产,激发企业更多潜在数据资产,实现更大动力。
数据飞轮2.0围绕企业数据建设与数据应用的各个环节,全系产品迎来了全面实现AI创新的新阶段。同时,火山引擎发布了两大核心方案:一是Data Fabric驱动下的ChatBI智能体,使数据消费更加简单直接,通过构建完整的智能数据服务体系,打破数据“专业”壁垒,帮助企业内每个业务定制专属智能体,降低数据使用门槛,提升大模型能力下的数据反馈效率和准确率;二是多模态数据湖,拓宽数据资产的边界,实现海量结构化、半结构化及非结构化数据的统一精细化管理,全方位兼容各类数据格式,为LLM预训练、持续训练和微调提供全程支持。
在云安全方面,火山引擎围绕“让智能更安全、让安全更智能”的理念,为AI基础设施提供透明可信的安全保障。同时,通过安全智能体,将字节跳动积累的安全经验服务于每个企业,为AI应用提供坚实的安全后盾。
随着大模型应用进入快速发展阶段,企业对模型能力、价格及落地难度提出了更高要求。火山引擎本次发布的多款全新产品及升级方案,进一步降低了模型训练及推理应用的难度,以高性价比和强安全保障,为企业落地AI能力奠定了坚实基础。