LHW-175B 大语言模型 · 推理服务在线 · SLA 99.98%

大模型驱动
AGI 落地先行者

自主研发 175B 参数混合专家大语言模型，融合多模态感知、长链推理与边缘部署能力，以端到端 AI 原生架构赋能工业、医疗、安全等垂直领域智能化升级。

探索业务 → 联系我们

🧠

175B

模型总参数量

⚡

<45ms

P99 端侧推理延迟

🎯

94.1%

GSM8K 数学推理准确率

🖥️

512卡

A100 分布式训练集群

LHW-175B 大语言模型

Multimodal · Long-Context · Edge-Deployable Foundation Model

🔬

基础架构

Transformer Decoder-Only + MoE (64 Experts, Top-8 路由)

📐

参数规模

175.4B Total · 激活参数 22B · 稀疏激活率 12.6%

🧩

注意力机制

GQA · 96 heads · d_model = 12,288 · RoPE θ=500K

🪟

上下文窗口

128K tokens · BPE 词汇表 152,064 · SwiGLU 激活

推理服务在线 · SLA 99.98%

基准测试评分

MMLU 综合推理89.2%

HumanEval 代码生成82.6%

GSM8K 数学推理94.1%

HellaSwag 常识推理95.8%

关于我们

以科技创新
驱动产业发展

翎华维科技自主研发 LHW-175B 稀疏混合专家大语言模型，采用 ZeRO-3 分布式训练框架在 512 块 A100 GPU 集群上完成 4.2T tokens 预训练，配合 RLHF 对齐与多阶段指令微调，实现工业级推理精度与亚 50ms 端侧延迟的双重突破。

大规模预训练与数据工程

4.2T tokens 多语言语料库，经 MinHash LSH 去重 + 质量过滤，数据利用率提升 37%

RLHF 对齐优化

PPO 算法 + KL 散度约束（β=0.02），奖励模型迭代 3,200 轮，DPO 二阶段精调

多模态跨模态对齐

ViT-L/14 视觉编码器 + Q-Former 跨模态注意力，支持图文联合推理与视觉问答

边缘端量化部署

INT4/INT8 混合量化 + 4:1 知识蒸馏，边缘版 LHW-7B 支持 NPU 离线推理

业务范围

全方位科技解决方案

覆盖软件开发、人工智能、工业机器人、医疗器械等多个核心领域，为客户提供端到端的数智化转型支撑。

💻

软件开发与技术服务

提供定制化软件开发、信息技术咨询、网络技术服务及计算机系统集成，助力企业数字化转型。

软件开发技术咨询网络服务

🤖

工业机器人

工业机器人制造、销售、安装与维修，提供全生命周期机器人解决方案，助力工厂智能化。

机器人制造安装维修智能工厂

🧠

人工智能与智能硬件

人工智能硬件、智能机器人及可穿戴智能设备的研发与销售，打造智慧生活与产业生态。

AI硬件智能机器人可穿戴设备

🏥

医疗器械

第二类医疗器械销售与租赁、第三类医疗器械租赁，为医疗机构提供专业的设备配套服务。

二类器械三类器械医疗租赁

🔒

信息安全产品

计算机信息系统安全专用产品销售，为企业和政府机构提供全方位的网络与数据安全保障。

信息安全数据保护安全产品

🌐

贸易代理与技术进出口

国内贸易代理、贸易代理及技术进出口业务，连接国内外市场，推动科技产品的全球流通。

贸易代理技术进出口国际贸易

核心技术指标

为何选择翎华维 LHW-175B

从模型训练到端侧推理，全链路自研，关键技术指标行业领先，覆盖 AGI 核心能力基准。

175B

模型总参数量

MoE 稀疏激活，激活参数仅 22B，算力效率比稠密模型提升 4.2×

<45ms

P99 推理延迟

TensorRT-LLM + vLLM 连续批处理，吞吐量达 1,240 tokens/s

128K

上下文窗口长度

RoPE θ=500K 位置编码外推，长文档理解无损 Recall@10 98.3%

4:1

知识蒸馏压缩比

蒸馏至 LHW-7B 端侧版本，NPU 离线部署，功耗 <15W

技术实力

LHW-175B 完整技术规格

从预训练架构到推理优化，全链路核心参数公开，接受同行评审与基准复现

🧠 模型架构技术参数表 · LHW-175B v2.4
基础架构	Transformer Decoder-Only `MoE 变体`
总参数量	175.4B · 激活参数 `22B` · 稀疏率 12.6%
注意力机制	GQA · 96 heads · `d_model = 12,288`
前馈网络	`FFN dim = 49,152` · SwiGLU 激活函数
混合专家 MoE	64 Experts · Top-8 路由 · 负载均衡辅助损失
上下文窗口	`128K tokens` · RoPE 位置编码 θ = 500,000
词汇表	152,064 tokens · BPE 分词 · 多语言覆盖
训练数据量	4.2T tokens · MinHash LSH 去重 · 质量过滤
训练总算力	`3.14 × 10²³ FLOPS` · FP16 混合精度
对齐训练	PPO + DPO 二阶段 · KL约束 `β=0.02` · 3,200 轮
量化支持	FP16 / INT8 / `INT4 混合量化` · GPTQ / AWQ
推理框架	vLLM 0.6.3 · TensorRT-LLM 0.12 · 连续批处理
蒸馏版本	LHW-7B · 4:1 压缩 · NPU 离线推理 <15W

🖥️ 算力基础设施 · Cluster v3.0

⚡

训练加速集群

512× NVIDIA A100 80GB SXM4

NVLink 4.0 · 全互联拓扑 · 峰值 78.1 PFLOPS

🌐

高速网络互联

InfiniBand HDR 200Gbps

Fat-Tree 拓扑 · RDMA over Converged Ethernet

🔀

并行训练策略

TP=8 · PP=4 · DP=16

ZeRO-3 优化器分片 · 激活检查点复用

💾

并行文件存储

Lustre 8PB · 聚合带宽 480GB/s

分布式检查点 · 断点续训容错

🚀

推理服务集群

128× NVIDIA H100 SXM5 (FP8)

PagedAttention · 吞吐 1,240 tokens/s/卡

🔍

向量检索数据库

HNSW 索引 · 2.3TB Embedding 库

pgvector + Faiss · ANN 召回率 99.1%

📊

可观测性平台

Prometheus + Grafana + OpenTelemetry

实时算力调度 · 自动故障转移 · P99 告警

联系我们

开启合作之旅

无论您有业务咨询、合作意向还是其他需求，我们的团队将在第一时间为您响应。

联系方式

📍17324497683

公司地址

深圳市宝安区沙井街道衙边社区
巨基科技大厦725

📮

通信地址

深圳市宝安区新桥街道新桥社区
巨基科技大厦725

🕒

工作时间

周一至周五 09:00 – 18:00

发送消息

填写以下表单，我们将尽快与您联系