LHW-175B 大语言模型 · 推理服务在线 · SLA 99.98%

大模型驱动
AGI 落地先行者

自主研发 175B 参数混合专家大语言模型,融合多模态感知、长链推理与边缘部署能力, 以端到端 AI 原生架构赋能工业、医疗、安全等垂直领域智能化升级。

🧠
175B
模型总参数量
<45ms
P99 端侧推理延迟
🎯
94.1%
GSM8K 数学推理准确率
🖥️
512
A100 分布式训练集群
LHW-175B 大语言模型
Multimodal · Long-Context · Edge-Deployable Foundation Model
🔬
基础架构
Transformer Decoder-Only + MoE (64 Experts, Top-8 路由)
📐
参数规模
175.4B Total · 激活参数 22B · 稀疏激活率 12.6%
🧩
注意力机制
GQA · 96 heads · d_model = 12,288 · RoPE θ=500K
🪟
上下文窗口
128K tokens · BPE 词汇表 152,064 · SwiGLU 激活
推理服务在线 · SLA 99.98%
基准测试评分
MMLU 综合推理89.2%
HumanEval 代码生成82.6%
GSM8K 数学推理94.1%
HellaSwag 常识推理95.8%

以科技创新
驱动产业发展

翎华维科技自主研发 LHW-175B 稀疏混合专家大语言模型,采用 ZeRO-3 分布式训练框架 在 512 块 A100 GPU 集群上完成 4.2T tokens 预训练,配合 RLHF 对齐与多阶段指令微调, 实现工业级推理精度与亚 50ms 端侧延迟的双重突破。

大规模预训练与数据工程
4.2T tokens 多语言语料库,经 MinHash LSH 去重 + 质量过滤,数据利用率提升 37%
RLHF 对齐优化
PPO 算法 + KL 散度约束(β=0.02),奖励模型迭代 3,200 轮,DPO 二阶段精调
多模态跨模态对齐
ViT-L/14 视觉编码器 + Q-Former 跨模态注意力,支持图文联合推理与视觉问答
边缘端量化部署
INT4/INT8 混合量化 + 4:1 知识蒸馏,边缘版 LHW-7B 支持 NPU 离线推理

全方位科技解决方案

覆盖软件开发、人工智能、工业机器人、医疗器械等多个核心领域, 为客户提供端到端的数智化转型支撑。

💻
软件开发与技术服务
提供定制化软件开发、信息技术咨询、网络技术服务及计算机系统集成, 助力企业数字化转型。
软件开发 技术咨询 网络服务
🤖
工业机器人
工业机器人制造、销售、安装与维修,提供全生命周期机器人解决方案, 助力工厂智能化。
机器人制造 安装维修 智能工厂
🧠
人工智能与智能硬件
人工智能硬件、智能机器人及可穿戴智能设备的研发与销售, 打造智慧生活与产业生态。
AI硬件 智能机器人 可穿戴设备
🏥
医疗器械
第二类医疗器械销售与租赁、第三类医疗器械租赁, 为医疗机构提供专业的设备配套服务。
二类器械 三类器械 医疗租赁
🔒
信息安全产品
计算机信息系统安全专用产品销售,为企业和政府机构提供 全方位的网络与数据安全保障。
信息安全 数据保护 安全产品
🌐
贸易代理与技术进出口
国内贸易代理、贸易代理及技术进出口业务,连接国内外市场, 推动科技产品的全球流通。
贸易代理 技术进出口 国际贸易

为何选择翎华维 LHW-175B

从模型训练到端侧推理,全链路自研,关键技术指标行业领先,覆盖 AGI 核心能力基准。

175B
模型总参数量
MoE 稀疏激活,激活参数仅 22B,算力效率比稠密模型提升 4.2×
<45ms
P99 推理延迟
TensorRT-LLM + vLLM 连续批处理,吞吐量达 1,240 tokens/s
128K
上下文窗口长度
RoPE θ=500K 位置编码外推,长文档理解无损 Recall@10 98.3%
4:1
知识蒸馏压缩比
蒸馏至 LHW-7B 端侧版本,NPU 离线部署,功耗 <15W

LHW-175B 完整技术规格

从预训练架构到推理优化,全链路核心参数公开,接受同行评审与基准复现

🧠 模型架构技术参数表 · LHW-175B v2.4
基础架构 Transformer Decoder-Only MoE 变体
总参数量 175.4B  ·  激活参数 22B  ·  稀疏率 12.6%
注意力机制 GQA · 96 heads · d_model = 12,288
前馈网络 FFN dim = 49,152 · SwiGLU 激活函数
混合专家 MoE 64 Experts · Top-8 路由 · 负载均衡辅助损失
上下文窗口 128K tokens · RoPE 位置编码 θ = 500,000
词汇表 152,064 tokens · BPE 分词 · 多语言覆盖
训练数据量 4.2T tokens · MinHash LSH 去重 · 质量过滤
训练总算力 3.14 × 10²³ FLOPS · FP16 混合精度
对齐训练 PPO + DPO 二阶段 · KL约束 β=0.02 · 3,200 轮
量化支持 FP16 / INT8 / INT4 混合量化 · GPTQ / AWQ
推理框架 vLLM 0.6.3 · TensorRT-LLM 0.12 · 连续批处理
蒸馏版本 LHW-7B · 4:1 压缩 · NPU 离线推理 <15W
🖥️ 算力基础设施 · Cluster v3.0
训练加速集群
512× NVIDIA A100 80GB SXM4
NVLink 4.0 · 全互联拓扑 · 峰值 78.1 PFLOPS
🌐
高速网络互联
InfiniBand HDR 200Gbps
Fat-Tree 拓扑 · RDMA over Converged Ethernet
🔀
并行训练策略
TP=8 · PP=4 · DP=16
ZeRO-3 优化器分片 · 激活检查点复用
💾
并行文件存储
Lustre 8PB · 聚合带宽 480GB/s
分布式检查点 · 断点续训容错
🚀
推理服务集群
128× NVIDIA H100 SXM5 (FP8)
PagedAttention · 吞吐 1,240 tokens/s/卡
🔍
向量检索数据库
HNSW 索引 · 2.3TB Embedding 库
pgvector + Faiss · ANN 召回率 99.1%
📊
可观测性平台
Prometheus + Grafana + OpenTelemetry
实时算力调度 · 自动故障转移 · P99 告警

开启合作之旅

无论您有业务咨询、合作意向还是其他需求,我们的团队将在第一时间为您响应。

联系方式
📍17324497683
公司地址
深圳市宝安区沙井街道衙边社区
巨基科技大厦725
📮
通信地址
深圳市宝安区新桥街道新桥社区
巨基科技大厦725
🕒
工作时间
周一至周五 09:00 – 18:00
发送消息
填写以下表单,我们将尽快与您联系
✅ 留言已发送,我们将尽快与您联系!