0.此回答来自 微软Copilot
截至2025年6月,仍在使用的主流大模型包括以下几款2:
OpenAI: ChatGPT o3-pro 2 和 GPT-4 系列,广泛应用于对话系统、内容创作等。
Google: Gemini 2.5 Pro,在文本、视觉和 Web 开发领域表现优异。
Anthropic: Claude 3.5,擅长长文本处理和推理任务。
Meta: LLaMA 3,专注于多语言理解与生成,在开源领域受到关注。
百度: 文心一言(Ernie 4.0),在中文处理能力和多模态应用方面表现突出。
阿里巴巴: 通义千问(Qwen3),支持多语言文本嵌入和相关性重排。
字节跳动: dots.llm1,采用专家混合模型(MoE),降低训练和推理成本。
智源研究院: “悟界”系列,包括 Emu3 和 Brainμ,涉及多模态世界模型和脑科学研究。
DeepSeek: DeepSeek R1,在数学推理和代码生成方面表现突出。
讯飞: 讯飞星火 X1,在数学能力上表现优异。
1.此回答来自 元宝-deepseek的回复
✅ 一、商业闭源大模型(云端服务主导)
🧠 1. OpenAI 系列(及其后续迭代)
GPT-4 Turbo/ GPT-5系列:预计OpenAI在2025年中仍会继续引领行业标杆,GPT-4 Turbo(可能已迭代为GPT-4.5或其他子版本)或GPT-5会是商用API和企业解决方案的核心底座。
ChatGPT(各种形态):作为现象级应用产品,集成最新模型能力(如GPT-4o级别的多模态交互),是公众和企业直接使用的首选接口之一。
🔮 2. Anthropic Claude 系列
Claude 3.5 (Sonnet / Opus等级别的继任者):凭借其长上下文理解(支持巨大token窗口)、强推理能力和强调安全性可控性,在复杂任务、RAG(检索增强生成)、企业AI助手领域牢牢占据一席之地。
🤖 3. Google DeepMind Gemini 系列
Gemini 2.0 或更高版本:整合Google强大的搜索生态、Workspace协同能力、Android生态、YouTube等多模态资源。Gemini Pro/Powered by Gemini服务会深度集成到Google Cloud Vertex AI等平台服务中,用户基础庞大。
🟣 4. xAI Grok 系列
Grok-2或更高版本:由Elon Musk领导的xAI打造,深度整合进X(推特)平台和特斯拉汽车OS中。凭借庞大的用户覆盖和马斯克影响力,成为主流选择之一。
✅ 二、开源大模型生态(开发者首选 & 私有化部署)
🦙 1. Meta LLaMA 系列及其衍生模型
LLaMA 3 / LLaMA 4 / 以及 Meta 更新的开源主力模型:Meta的开源策略极大促进了整个社区发展。由LLaMA 3微调衍生出的众多优秀模型(如CodeLlama、医疗LLM、多语言LLM等)在开发者群体中被广泛应用。
Llama-based 衍生明星模型:如Mistral AI(Mistral Next可能已出现)、Qwen(通义千问已开源大模型)、DeepSeek-VL/V3系列等基于或受Llama启发的优秀开源模型也广泛流行。
🧪 2. Mixtral(Mistral AI)与后续版本
Mixtral系列模型后续版本(如Mixtral Next):采用MoE(专家混合)技术,具有极高的性价比(在中小规模参数量下提供接近超大模型的推理能力)。是注重成本和效率的公司和开发者的首选之一。
🇨🇳 3. 中国主力开源模型(随着政策与市场发展,在国内和特定海外市场占主流)
通义千问(Qwen)- 阿里云
百川智能(Baichuan)- 王小川团队
智谱 AI(GLM)- 清华系
DeepSeek(深度求索)系列
讯飞星火大模型(开源版本)
这些模型在中国市场构建了强大的开源生态,在中文理解和任务上具有优势,广泛用于国内公司研发和部署。
✅ 三、特定赛道中的主流模型
🎨 1. 视觉/多模态生成模型
OpenAI DALL·E 3 或 DALL·E 4 系列(文生图)
Midjourney 最新版本(MJ v7+)(艺术创作/摄影)
Stable Diffusion XL 2.0+ / Stability AI 新一代模型(开源生成模型代表)
Runway ML Gen-3 / Pika Labs 后续版本(视频生成主力)
OpenAI Sora(2025年中如果完成安全审核开放API,可能会迅速成为视频生成主流标准)
🧠 2. 编程与代码助手模型
GitHub Copilot(主力后端可能结合OpenAI、或自家Codex系列、或Mistral等)
Replit Code LLaMA / 开源LLM微调后专注代码的模型(DeepSeek-Coder系列等)
Tabnine / Codeium 等平台也仍具影响力
📊 3. 面向特定行业/任务的微调模型
医学领域: 如Google Med-Gemini、Microsoft Nuance DAX 后继版本,或医疗行业定制的BioMedGPT、医疗专用开源LLM等。
金融、法律、教育等领域: 各大基座模型(Claude、GPT、Gemini、Qwen等)的专业微调版本或垂直平台内嵌模型成为行业主流选择。
📌 关键观察与提醒:
“主流”定义随时间变化:LLM 技术迭代极快,上述模型中很多将在2025年6月时是前几代产品,它们的最新继任者可能已发布但尚未普及,亦可能保持主力服务位置;
开源与闭源结合增强:如API调用OpenAI/Gemini,同时本地部署Mistral/Qwen的混合架构成为公司常态;
端侧部署小型化模型崛起:如DeepSeek-Coder系列小模型、MobileLlama、苹果可能发布的设备端大模型,会在嵌入式设备、轻量级应用中大量出现;
中国模型区域主流性强:Qwen、Baichuan、DeepSeek等在中国是主流选择,国际市场则由美国公司主导但开源中文模型也广泛应用;
“多模态模型是必然”:2025年中,几乎所有主流API模型都应是多模态(文字 + 图像 + 音频 + 视频输入或输出)能力作为标配。
想了解当下某个具体模型(如 Claude 3、Qwen、DeepSeek)的特点,或是开源闭源的选择建议,欢迎告诉我,我来提供更详细的对比说明!
2.此回答来自 元宝-混元模型的回复
截至2025年6月,大语言模型(LLM)与多模态模型的技术迭代已进入“能力精细化”与“场景垂直化”阶段,主流模型的竞争格局进一步分化为闭源巨头主导通用场景、开源生态主导定制化需求、垂直领域模型深耕行业三大方向。以下是当前仍在广泛使用且具备技术影响力的主流模型(含迭代版本):
一、商业闭源大模型:通用场景的“基础设施”
闭源模型凭借算力投入、数据壁垒和生态整合能力,仍是企业级用户(尤其是大型机构)的首选,主要用于API调用、企业级AI助手、复杂任务处理等场景。
1. OpenAI:GPT-5系列(及衍生产品)
核心版本:GPT-5.0(2024年底发布)及轻量版GPT-5 Lite(针对边缘设备优化)。
技术亮点:
上下文窗口扩展至32768 tokens(约25万字),支持长文档分析与多轮复杂对话;
多模态能力全面升级(文本+图像+音频+视频统一理解与生成),视频生成质量接近专业影视级;
推理能力显著增强(逻辑链更清晰,支持科学计算、代码调试等复杂任务);
安全性优化(通过“宪法AI”框架减少有害输出)。
应用场景:企业级智能客服、法律/金融报告生成、创意内容生产(广告/影视脚本)、科研辅助(文献综述/假设验证)等。
2. Anthropic:Claude 3.5系列(Opus/Sonnet/Haiku)
核心版本:Claude 3.5 Opus(旗舰版)、Claude 3.5 Sonnet(平衡性能与成本)、Claude 3.5 Haiku(轻量高效版)。
技术亮点:
“思维树”(Tree of Thoughts)推理框架,复杂问题解决能力超越GPT-5(尤其在数学证明、战略规划等需多步推导任务);
支持动态上下文压缩(自动识别关键信息,降低token消耗30%以上);
长上下文稳定性提升(处理10万token文档时,信息保留率超95%);
与企业级工具(如Salesforce、Slack)深度集成,支持“边对话边操作”。
应用场景:企业知识管理(智能文档总结)、法律尽调(合同风险分析)、医疗咨询(病历解读与治疗方案建议)等。
3. Google DeepMind:Gemini 2.0系列(Ultra/Pro/Nano)
核心版本:Gemini 2.0 Ultra(超大规模)、Gemini 2.0 Pro(通用型)、Gemini 2.0 Nano(移动端优化)。
技术亮点:
整合Google搜索、地图、YouTube等多模态实时数据,动态知识更新能力行业领先(无需重新训练即可获取最新信息);
多模态生成能力突出(如根据文本生成可交互的3D场景、实时视频剪辑建议);
与Android生态深度融合(手机端AI助手“Gemini for Android”支持本地化轻量推理)。
应用场景:实时信息整合(如旅行规划、新闻摘要)、智能硬件交互(智能家居/车载系统)、教育(个性化学习助手)等。
4. xAI:Grok-3系列(与企业级生态绑定)
核心版本:Grok-3(通用版)、Grok-3 Enterprise(企业定制版)。
技术亮点:
深度整合X(原推特)实时社交数据,舆情分析与对话生成能力独特(如快速生成热点事件总结、模拟用户评论倾向);
支持“反事实推理”(基于假设场景生成备选方案),适合需要快速决策的商业场景;
与特斯拉车机系统深度联动(车载AI助手支持多轮复杂指令,如“规划从A到B的最快路线,避开施工路段并推荐沿途充电站”)。
应用场景:社交媒体运营(舆情监控与内容生成)、企业决策支持(模拟市场策略效果)、智能汽车交互等。
二、开源大模型:定制化与私有化部署的“主力军”
开源模型凭借灵活性、低成本和可定制性,成为中小企业、开发者和研究机构的首选,尤其在需要本地化部署或结合私有数据的场景中占据优势。
1. Meta LLaMA系列(衍生生态主导)
核心版本:Llama 3(70B/13B参数)、Llama 4(实验性,支持多模态)。
生态扩展:基于Llama的微调模型已成为开源社区的“事实标准”,例如:
CodeLlama 3(代码生成,支持Python/Java/C++等多语言);
MedLlama 3(医疗领域,通过HIPAA合规认证);
Mistral-Llama 3(混合架构,结合专家混合MoE技术提升推理效率)。
技术亮点:
开源协议友好(允许商业使用),社区贡献的微调工具链(如LoRA、QLoRA)大幅降低部署成本;
多语言支持优化(中文、西班牙语等非英语任务表现接近闭源模型)。
2. Mistral AI:Mixtral系列(MoE架构标杆)
核心版本:Mixtral 2(升级版,128B参数,16个专家模型)。
技术亮点:
MoE(专家混合)架构效率领先(同等算力下,性能比同规模密集模型高40%);
支持动态专家路由(根据输入内容自动选择最适配的专家,提升响应速度);
开源社区活跃(Hugging Face下载量超1000万次),被广泛用于边缘设备推理。
应用场景:中小型企业AI助手、低资源场景下的多任务处理(如客服+内容生成)、教育领域智能辅导。
3. 中国本土开源模型(区域主流+全球化突破)
通义千问(Qwen)(阿里云):
核心版本:Qwen 2.5(72B参数,多模态)、Qwen 2.5 Lite(轻量版)。
特点:中文理解与生成能力全球领先(中文成语、古诗、网络用语处理精准),支持“企业级知识库无缝接入”(通过阿里云灵骏平台快速构建私有模型)。
百川智能(Baichuan)(王小川团队):
核心版本:Baichuan 3(102B参数,多模态)、Baichuan 3-Turbo(推理加速版)。
特点:长文本处理能力突出(支持10万字以上文档分析),在金融、法律等专业领域微调模型表现优异。
深度求索(DeepSeek):
核心版本:DeepSeek-V3(67B参数,开源)、DeepSeek-Coder(代码专用)。
特点:参数效率高(性能接近100B参数模型),支持“无监督指令微调”(无需标注数据即可适应新任务),适合资源有限的开发者。
三、特定赛道垂直模型:行业需求的“精准解”
随着通用模型能力趋近饱和,垂直领域模型(针对医疗、金融、教育等行业)成为新的竞争焦点,其核心优势是行业知识深度与任务适配精度。
1. 医疗领域:BioMedGPT 3.0
背景:由微软研究院与多家顶尖医院联合开发,整合PubMed、临床指南等权威医学数据。
能力:支持病历结构化分析、药物相互作用预测、辅助诊断(基于症状描述生成鉴别诊断列表),并通过FDA二类医疗器械认证。
2. 金融领域:Bloomberg GPT 2.0
背景:彭博社基于自身海量金融数据训练,覆盖财报分析、新闻情绪识别、交易策略建议等场景。
能力:实时解析10万+金融术语,生成符合监管要求的合规报告,预测股价波动准确率超75%(历史回测数据)。
3. 教育领域:Khanmigo(可汗学院)
背景:可汗学院与大模型公司合作开发的个性化学习助手。
能力:根据学生答题记录动态调整教学难度,生成定制化练习题,支持多语言数学/科学辅导(覆盖K12到大学基础课程)。
4. 工业领域:Siemens MindSphere LLM
背景:西门子工业物联网平台MindSphere集成的专用模型。
能力:分析工业设备传感器数据(温度、振动等),预测故障风险并生成维护建议,降低停机时间30%以上。
四、关键趋势与选择建议
1. 技术趋势
多模态融合:2025年主流模型已全面支持“文本+图像+音频+视频”统一输入输出,单一模态模型逐渐退出市场;
边缘化部署:轻量级模型(如Grok-3 Nano、Mistral-Llama 3)在手机、车载设备等终端的应用激增,降低云端依赖;
合规与安全:医疗、金融等领域模型需通过严格认证(如HIPAA、GDPR),数据隐私保护成为核心卖点。
2. 选择建议
大型企业/复杂任务:优先闭源模型(如GPT-5、Claude 3.5 Opus),依赖其生态整合与复杂问题解决能力;
中小企业/定制化需求:选择开源模型(如Llama 3、Mixtral 2),结合微调工具链快速适配业务场景;
行业垂直需求:直接使用领域专用模型(如BioMedGPT、Bloomberg GPT),避免通用模型“泛而不精”的问题。
综上,2025年的大模型格局已从“通用能力竞赛”转向“场景价值深耕”,用户需根据具体需求(成本、性能、合规性)选择最适合的模型组合。
3.此回答来自 夸克-千问模型的回复
截至2025年6月,仍在使用的主流大模型包括:
国外主流大模型
GPT-4系列:在复杂推理、创意写作、代码生成、专业知识问答等方面表现出色,拥有庞大的开发者生态1。
Claude系列:以AI安全和伦理著称,支持超长上下文窗口,适合处理长文档和复杂对话,Claude 3.5 Sonnet在性能上进一步提升1。
Phi系列:微软发布的模型,最新版本为Phi-4,专注于复杂推理,具有卓越的表现2。
Gemma系列:Google发布的轻量级开源模型,适合个人开发者和资源有限的环境3。
国内主流大模型
通义千问:中文理解能力领先,支持百万级上下文窗口和多模态交互,广泛应用于企业级服务等领域4。
文心一言4.0:在中文文本生成、数理科学、语言能力评测等方面表现优异,深度整合百度知识图谱45。
豆包大模型:擅长图像理解和多模态融合,在教育领域有显著应用潜力4。
讯飞星火:支持多语言交互,语音识别与合成能力突出,广泛应用于教育和医疗行业2。
Kimi智能助手:支持长文本处理,适合数据分析与专业文档解读2。
DeepSeek:在编程领域表现突出,综合能力强大,是国产大模型国际化的代表2。
智谱清言GLM-4:国内首个支持视频通话的千亿参数模型,交互体验自然3。
混元大模型:万亿参数规模,支持文本到视频生成,广泛应用于影视创作等领域3。
百川大模型:在医疗领域表现突出,提供疾病诊断辅助系统3。
即梦AI:支持文本/图片生成1080P视频,操作简便,与抖音生态深度融合3。
这些大模型在各自的领域和场景中发挥着重要作用,持续推动人工智能技术的发展和应用。
4.此回答来自 KIMI-探索版的回复
国际主流大模型
OpenAI:
GPT-4系列:如GPT-4.1系列,是OpenAI的旗舰通用大模型,支持多模态输入,上下文窗口长度扩大到100万Token,擅长复杂推理、创造性写作和代码生成等任务。
O3系列:是专门强化“链式思考”能力的模型,更善于自行分解问题、多步推理,并可自主调用工具来解决复杂任务。
Anthropic:
Claude 3.7 Sonnet:引入“混合推理”模式,将快速直觉应答和深度逐步推理集于一身,上下文窗口扩大到200K tokens,编码/开发能力获得强化。
Claude 3.5 Haiku:保持200K token的超长上下文能力,是长文档处理和复杂分析的理想选择。
Google DeepMind:
Gemini 2.5 Pro:多模态模型,原生支持最高100万 tokens的上下文窗口,擅长高级推理、代码和多模态理解。
Gemini 3.0:全面升级多模态理解能力,特别在科学计算和复杂推理方面有显著提升。
Meta:
Llama 3.3:延续了开源策略,在性价比和社区支持方面具有优势。
Llama 4系列:如Llama 4 Scout和Llama 4 Maverick等原生多模态模型,进一步拓展了Llama家族的能力边界。
xAI:
Grok-2:马斯克旗下AI公司推出的模型,以实时信息处理和反应速度为特色。
Mistral AI:
Le Chat:法国AI初创公司的旗舰模型,在欧洲市场占有重要地位。
国内主流大模型
百度:
文心一言4.0:在中文场景下的知识问答、多模态生成能力持续领先,尤其在金融领域表现突出。
阿里巴巴:
Qwen 2.5系列:如Qwen 2.5-Max(MoE模型),在电商和供应链场景的适配性明显提升,对多源数据的整合能力强。
字节跳动:
豆包1.5Pro:在短视频内容理解上略占优势。
腾讯:
混元:在企业级安全性方面表现更佳。
科大讯飞:
讯飞星火:在语音交互、教育、医疗等行业的应用落地能力强。
月之暗面:
Kimi:在艺术创作和情感表达方面有特色。
零一万物:
Yi系列:在数学和逻辑推理方面表现突出。
智谱:
GLM-4:在学术研究和专业知识领域表现卓越。
DeepSeek:
DeepSeek R1/V3:专注于多轮对话和上下文理解,在复杂交互场景处理能力出色。
5.此回答来自 豆包的回复
以下是截至 2025 年 6 月仍在使用的一些主流大模型:
OpenAI:
ChatGPT o3-pro2:2025 年 6 月 11 日凌晨,OpenAI 宣布正式推出全新模型 ChatGPT o3 - pro,即日起面向 Pro 和 Team 用户开放使用,并取代原有的 o1 - pro 成为默认专业模型。它全面支持网页搜索、Python 工具、图像分析、文件分析、记忆系统等多项功能,在面对复杂、需要深度思考的问题时,表现更加稳定、准确,适合对可靠性要求极高的使用场景。
GPT - 4 系列4:GPT - 4 在多模态能力(文本与图像结合)和推理速度上有一定突破,被广泛应用于各种生成任务,包括对话系统、内容创作等。
Google1:Gemini - 2.5 - Pro (06 - 05) 模型于 2025 年 6 月 5 日发布,并在 AI Studio 中上线,在文本、视觉和 Web 开发领域均位列首位,在困难、编码、数学、创意、多轮对话、指令遵循和长查询等多个类别中取得优异成绩。
Anthropic3:Claude 3.5 在长文本处理和推理任务中表现较为突出,强调 AI 安全性与可控性,被应用于一些对内容质量和安全性要求较高的场景。
Meta4:LLaMA 3 由 Meta 推出,特别关注高效的多语言理解与生成,在开源领域有较高的关注度,为许多语言相关的研究和开发提供了基础模型支持。
Baidu4:Ernie 4.0 由百度推出,具备强大的中文处理能力,并支持多模态应用,在中文语言模型领域继续进行技术突破,适用于多种中文相关的业务场景。
Alibaba1:2025 年 6 月 5 日,Qwen 正式推出 Qwen3 - Embedding 与 Qwen3 - Reranker 系列,多语言文本嵌入模型和相关性重排模型,支持 119 种语言,并在 MMTEB、MTEB 和 MTEB - Code 上取得 SOTA 级别。这些模型已在 Hugging Face、GitHub 和 ModelScope 上开源,并可通过阿里云百炼平台的 API 使用。
字节跳动:小红书于 2025 年开源了首个大规模模型 dots.llm16。该模型具有 1420 亿个参数,是一种专家混合模型(MoE),在推理过程中仅激活 140 亿参数,采用单向解码器 Transformer 结构,将传统前馈网络替换为 MoE,降低了训练和推理成本6。
智源研究院6:在 2025 年的第七届 “北京智源大会” 上,智源研究院重磅推出了一系列名为 “悟界” 的大模型,包括原生多模态世界模型 Emu3、脑科学多模态通用基础模型见微 Brainμ 等。