12月13-14日,昇思人工智能框架峰会暨成果发布会在北京举办。AI框架作为大模型开发及产业落地的基础软件,在人工智能技术栈中起到使能算法开发、释放硬件性能的“承上启下”作用。
会上,商汤参与基于昇思AI框架的大模型原生开发成果发布;同时,商汤基于华为生态在模型和算法方面的优秀创新与实践,获得了昇思MindSpore开源社区2024年度杰出开发者称号,标志着双方在推动人工智能技术发展方面迈出了坚实的一步,通过共同构建框架新生态,为用户提供更加高效、便捷、可靠的智算服务。
图 | 商汤参与基于昇思AI框架的大模型原生开发成果发布
强强结合,取得多项联创成果
2024年,商汤依托昇腾与昇思生态,共同推进基础模型、行业大模型应用与创新,通过高效并行、通信优化及网络架构感知和任务调度等软硬优化技术,构建了大规模并行训练加速系统。在此基础上,商汤联合昇思MindSpore优化混合专家(MoE)模型高效计算架构,模型性能提升18%以上。
基于昇思MindSpore,商汤还建设长序列并行训练加速机制,与业界相比,4K序列性能提升1倍以上,32K序列性能持平,并支持处理128K长序列训练。
目前,商汤日日新大模型从底层软件栈的接入到基础框架优化、再到模型原生开发,在性能、稳定性等关键参数方面超过业界。
图 | 商汤大装置产品总监刘叶枫在会上分享了商汤与华为的联合创新成果与大模型应用的实际落地实践
多元异构,引领AI基础设施自主可控实践
商汤大装置积极开展芯片适配,推动智能算力多元化。基于自研训练框架与推理框架,联合产业链上下游企业开展多元GPU芯片适配工作,搭建能兼容多种芯片的异构算力体系。
目前,AI国产算力集群算力规模超2,000 PetaFLOPS。商汤大装置面向多元芯片打造的技术体系,为多样化计算场景下的大模型高效部署与创新应用落地提供了有力支撑。
商汤大装置多元芯片技术体系包含原生云组件、训推一体加速和多元异构算力,可提供全面的资源状态监控,打通从训练到推理的全链路操作,实现95%以上的多元异构混训效能,优化整体能耗,降低运营成本。
图 | 商汤大装置多元芯片技术体系
算力加持,稳居智算第一梯队
商汤大装置不仅算力规模达20,000 PetaFLOPS,软件和平台的创新力和服务能力亦备受各界认可。在IDC此前发布的《中国智算服务市场(2023下半年)跟踪》报告中,商汤在中国云计算基础设施厂商中脱颖而出,与火山引擎、阿里巴巴共同跻身2023年下半年中国GenAI IaaS服务厂商TOP 3,以显著的市场份额优势位居GenAI IaaS领域的第一梯队。
在IDC发布《中国模型即服务(MaaS)及AI大模型解决方案市场追踪,2024H1》报告中,商汤科技(商汤大装置万象)以14.8%的市场份额位居第二,领跑AI大模型解决方案行业第一梯队。
商汤大装置始终致力于打造高效易用的全栈大模型服务,无缝对接各类模型应用场景,提升大模型技术的落地效率,更好地赋能千行百业。
(商汤科技)