简介

Intelligence BooM AI开源基础软件栈是联合多家社区、伙伴成员一起打造的大模型全栈开源解决方案,包含异构融合平台、任务管理平台、数据管理平台、运行加速平台、智能应用平台及全栈安全平台等7大平台,20+开源组件。伙伴可以基于本次发布的参考实现进行商业场景应用,参与社区代码开发,进行技术及Agent应用创新等。

愿景

打破技术壁垒

通过全栈开源加速大模型推理技术普惠化

赋能行业转型

共建智能化应用平台支撑产业智能化升级

推动生态协同

联合社区、高校与企业统一技术标准并增强生态兼容

第二版本:敲鱼面

支持NPU抢占混部,降低微调门槛,业界首发操作系统领域模型,为构建领域模型平台打下基础

高性能

异构算力融合,支持算力切分混部,推理多快好省
多级缓存,多轮、长序列对话场景TTFT降低50%+

易开发

大模型生成昇腾算子:AIKG 在真实场景基本可用,Triton算子开发效率x5+

全功能

支持 Atlas 300等系列低成本微调,50+模型增训
开箱即用:面向Agentic AI 软件生态适配 Dify 等流行方案

易使用

快速微调:从镜像部署到首loss耗时小于15分钟
能力解耦复用:MindSpore 图模式能力解耦,支持 PyTorch

生态构建

和上游社区开发合作,联合 vLLM 发布 vLLM-omni,联合 LMCache 发布 LMCache-Ascend
OS领域首发领域模型,openEuler OS Model 业界首发,4B领域模型系统调优效果持平DeepSeek 671B,支持CPU推理

首版本:烩面

构建推理+智能体的开源解决方案,一键部署,开箱即用

全功能

Agent智能体支持:调优/运维智能体大幅进化,RAG检索增强生成能力
支持多样性硬件:CPU(x86、ARM)、NPU(昇腾910/310)、GPU(NV)

高安全

全栈安全:保证软件平台自身安全可信,保护业务数据&模型资产安全

易使用

一键式部署:结合oeDeploy工具,一个命令15分钟完成分布式部署
支持主流开源模型:累计支持50+模型,0 day适配
部署方式可扩展:单机/双机/四机及大集群部署DeepSeek V3/R1模型
CPU+xPU可协同:支持CPU+xPU协同推理,及MoE专家异构弹性扩展

易开发

面向企业应用的Agent开发平台:强化工作流结合能力
算子开发语言:基于 Triton 和 SWFT ,算子模型协同开发,降低开发门槛
AI生成算子:Multi-Agent 架构的 LLM 算子生成框架,支持多前端和后端
CPU
NPU
GPU

openEuler AI 联合工作组成员