登录或注册

XenForo 1.5.14 中文版——支持中文搜索！现已发布！查看详情
Xenforo 爱好者讨论群：215909318 XenForo专区

XenForo 1.5.14 中文版 Xenforo 爱好者

新闻 Omni-Infer v0.4.0 发布，超大规模 MoE 模型推理加速技术下载

本帖由漂亮的石头于 2025-09-08 发布。版面名称：软件资讯

漂亮的石头版主 管理成员

注册:

2012-02-10

帖子:

488,439

赞:

48

Omni-Infer v0.4.0 已经发布，超大规模 MoE 模型推理加速技术。 v0.4.0 核心特性模型脚本重构，消除与框架的耦合，提升模型适配效率和代码可维护性支持xPyD（y<32） PD分离场景P&D支持独立TP+DP+EP 全局绑核优化支持模型列表模型硬件精度类型部署形态 DeepSeek-R1 A3 INT8 PD分离 DeepSeek-V3 A3 W4A8C16 PD分离 ...
Omni-Infer v0.4.0 发布，超大规模 MoE 模型推理加速技术下载地址

漂亮的石头, 2025-09-08

#1

(您必须注册并登陆后发表回复。)

正在加载...

论坛
论坛

快捷链接
- 最新主题
媒体相册
媒体相册

快捷链接
- 最新媒体
下载中心
下载中心

快捷链接
- 活跃作者
- 最新评论
会员
会员

快捷链接
菜单