Title

大模型推理引擎

通过编译优化实现大模型推理架构在算法、系统和芯片各层的垂直整合。

在用户无感的前提下显著提升模型推理性能。

为客户提供跨品牌、跨型号的标准化AI软件底座,可以直接将模型部署在基于国产AI芯片的硬件环境中。

支持服务器侧(数据中心场景)和端侧(个人电脑、移动设备场景)大模型推理。

降低算力成本

卓越性能提升

无缝适配国产芯片

一致用户体验

算子自动生成工具

提供自动化、高效率的CUDA兼容转译整体解决方案。

使得国产芯片能够以更低的成本、更短的周期进入市场。

为用户在开发过程中带来更高的效率和灵活性。

低开发成本

转译性能保证

转译工具组件

算子翻译服务

如何申请内测账号

1) 您需要通过电子邮件申请内测账户,在申请过程中请填写附件的申请表格,然后将填写好的表格发送至fangju@chinaskycloud.com邮箱。
2) 我们收到您的申请邮件,我们将尽快处理您的请求,为您激活相关资源,并发送“交付单”,其中包含以下信息:VPN、算力应用平台的登录详情。
附件地址: 【资源申请单.xlsx】