现在主流的LLM（大语言模型）

当前市面上的大型语言模型（LLM）产品已形成多元化格局，涵盖开源模型、商业化 API、企业级解决方案及垂直领域专用模型。以下是 2025 年的主要产品分类及代表：

一、国际主流商业化模型

OpenAI GPT-5 系列
作为行业标杆，GPT-5 系列包含多个版本：
- GPT-5：支持 400K tokens 超长上下文，集成多模态能力（文本 + 视觉），擅长复杂推理与代码生成，适用于企业级 Agent 开发。
- GPT-5-mini：平衡速度与成本，适合轻量级应用如实时客服。
- GPT-5-nano：最低延迟，用于移动端或边缘计算场景。
  通过 Azure OpenAI 服务提供 API 接入，支持自定义工具调用和强化学习微调。
Google PaLM 2
新一代多语言模型，在数学推理、代码生成和多语言任务中表现突出，支持 100 + 语言，预训练数据包含网页、代码和学术文献。其 API 通过 Google Cloud Vertex AI 开放，可处理长文档分析和跨语言协作developers.google.cn。
Anthropic Claude Sonnet 4
混合推理架构模型，支持 200K 上下文窗口，在编码、数据分析和复杂规划任务中领先。新增 “扩展思维模式”，可迭代优化推理路径，适合企业级工作流自动化和软件开发全流程Anthropic。通过 AWS Bedrock 和 Google Cloud 提供服务。
Meta Llama 3 系列
- Llama 3.1：405B 参数开源模型，性能超越 GPT-4o 和 Claude 3.5，在数学、编码和多语言任务中表现优异，支持商用许可。
- Llama 3.2 Vision：多模态模型，结合文本与图像分析，可解读图表、地图并生成响应，通过 Oracle OCI 和 AWS Bedrock 部署。
DeepSeek-R1
671B 参数混合专家模型，数学推理和代码生成能力突出，成本比 GPT-4o 低 30 倍。通过 AWS Bedrock 提供全托管服务，支持企业级数据集成和 RAG（检索增强生成）应用。

二、开源模型生态

Llama 3 系列
开源领域标杆，包含 8B、70B、405B 等版本，支持长上下文和多语言，在 MMLU、GSM8K 等基准测试中表现优异，适合学术研究和企业私有化部署。
Mistral 7B
号称 “最强 7B 开源模型”，性能超越 Llama 2 13B，支持高效推理和低资源设备运行，适用于轻量级应用和边缘计算。
GROK
3140 亿参数混合专家模型，目前参数量最大的开源 LLM，专注于复杂模式识别和长文本处理，可处理基因组数据分析和科学模拟。
Mixtral
Mistral AI 突破性模型，性能超越 GPT-3.5，支持多任务并行处理，适合代码生成和跨领域知识融合。
MiniMax-Text-01
中国开源模型，采用线性注意力机制，支持 400 万 token 上下文，在 LongBench V2 测试中领先，适合长文档分析和多轮对话。

三、中国主流模型

阿里通义千问（Qwen）
- Qwen2.5-Max：2000 亿 token 预训练，混合专家架构，支持 32K 上下文窗口，适用于电商和游戏行业。
- Qwen3-Coder：代码生成专项模型，通过阿里云百炼平台提供服务，支持低代码构建 AI 助手阿里云。
百度文心一言（ERNIE）
多模态大模型，集成知识图谱和行业数据，在智能办公、内容创作领域应用广泛，支持私有化部署和行业定制。
华为盘古大模型
聚焦工业、能源等垂直领域，结合昇腾芯片优化推理效率，通过华为云 Tokens 服务提供高吞吐、低时延支持。
字节跳动 Seed1.5-VL
视觉 - 语言多模态模型，532M 视觉编码器 + 200 亿参数 LLM，支持动态分辨率处理，在 GUI 交互和游戏推理中优于 OpenAI Cuau，通过火山引擎开放 API。

四、云服务与企业级解决方案

微软 Azure OpenAI
整合 GPT-5 系列、Claude 和 Llama 3，提供企业级安全合规框架，支持自定义工具链和实时监控，适合金融、医疗等高风险领域。
亚马逊 AWS Bedrock
全托管 LLM 平台，支持 DeepSeek-R1、Claude Sonnet 4 和 Llama 3，提供预训练模型和自定义微调选项，适合快速构建 AI 应用。
阿里云百炼
一站式大模型开发平台，支持 Qwen3、DeepSeek-R1 等主流模型，提供低代码 Agent 构建工具和离线推理服务，成本降低 50%阿里云。
华为云 Tokens 服务
接入 DeepSeek、Qwen、Pangu 等模型，通过 CloudMatrix384 超节点实现 2400TPS 高吞吐，适合大规模 AI 应用部署。

五、垂直领域专用模型

Baichuan-M1
医学专用模型，20T tokens 训练，覆盖临床指南、真实病例和学术论文，在 USMLE、CMExam 等医学考试中表现优异，支持诊断支持和治疗方案生成。
Coze
字节跳动低代码 AI Agent 平台，内置上千款工具，支持多平台发布（抖音、飞书），适合快速构建对话式 AI 和自动化流程。
RAGFlow
专注文档理解的开源 RAG 平台，支持 10 + 数据预处理类型和知识图谱组件，适用于法律、医疗等复杂文档密集场景。

六、新兴趋势与技术突破

长上下文竞争
模型支持从 100K 向 1M tokens 扩展，如 MiniMax-Text-01 支持 400 万 token，可处理整本书籍或长期对话历史。
多模态融合
如 Llama 3.2 Vision 和 Seed1.5-VL，结合文本、图像和视频分析，推动工业质检、医疗影像等场景落地。
成本优化
开源模型（如 Llama 3）和混合专家架构（如 DeepSeek-R1）显著降低推理成本，使企业级应用更具可行性。
垂直领域深耕
医疗、法律、金融等领域专用模型兴起，如 Baichuan-M1 和 DeepSeek-V3，结合行业数据提升专业性和安全性。

以上产品覆盖从基础研究到企业应用的全链条，用户可根据需求选择开源、云服务或定制化解决方案。随着技术迭代，LLM 正从通用工具向行业深度渗透，推动 AI 应用进入新阶段。

菜单

分享

一、国际主流商业化模型

二、开源模型生态

三、中国主流模型

四、云服务与企业级解决方案

五、垂直领域专用模型

六、新兴趋势与技术突破

现在主流的LLM（大语言模型）

海之云教会您怎么自己部署自己的ai agent智能体客服

博物馆类小程序：联动线上线下的引流功能设计

海之云科技教会您怎么调用百度地图

AI 在传统行业中的应用：变革与突破-海之云提供智能ai方案

海之云助力工厂配方在流水线上的自动化调配方案

怎么用自己的小程序对接第三方平台美团、饿了么等-海之云告诉你

海之云科技怎么理解餐饮行业解决方案

重庆市人民小学云上平台

公司资质