Skip to main content

AI 模型比较

在 副驾驶聊天 中比较可用的 AI 模型,并为你的任务选择最佳模型。

AI 模型的比较用于 GitHub Copilot

          GitHub Copilot 支持具有不同功能的多个 AI 模型。 你选择的模型会影响 副驾驶聊天 和 Copilot 内联建议的响应质量和相关性。 某些模型提供较低的延迟,而另一些模型则提供更少的幻觉现象或在特定任务上表现更佳。 本指南可帮助你根据任务(而不仅仅是模型名称)选择最佳模型。

注意

使用下表快速查找合适的模型,请在以下部分中查看更多详细信息。

型号任务领域在(主要用例)方面表现出色其他阅读材料
GPT-4.1General-purpose coding and writingFast, accurate code completions and explanationsGPT-4.1 model card
GPT-5 miniGeneral-purpose coding and writingFast, accurate code completions and explanationsGPT-5 mini model card
GPT-5.2Deep reasoning and debuggingMulti-step problem solving and architecture-level code analysisGPT-5.2 model card
GPT-5.2-CodexAgentic software developmentAgentic tasksGPT-5.2-Codex model card
GPT-5.3-CodexAgentic software developmentAgentic tasksGPT-5.3-Codex model card
GPT-5.4Deep reasoning and debuggingMulti-step problem solving and architecture-level code analysisGPT-5.4 model card
GPT-5.4 miniAgentic software developmentCodebase exploration and is especially effective when using grep-style toolsNot available
GPT-5.5Deep reasoning and debuggingMulti-step problem solving and architecture-level code analysisNot available
Claude Haiku 4.5Fast help with simple or repetitive tasksFast, reliable answers to lightweight coding questionsClaude Haiku 4.5 model card
Claude Opus 4.6 (fast mode) (preview)Deep reasoning and debuggingComplex problem-solving challenges, sophisticated reasoningNot available
Claude Opus 4.7Deep reasoning and debuggingComplex problem-solving challenges, sophisticated reasoningClaude Opus 4.7 model card
Claude Sonnet 4.0Deep reasoning and debuggingPerformance and practicality, perfectly balanced for coding workflowsClaude Sonnet 4.0 model card
Claude Sonnet 4.5General-purpose coding and agent tasksComplex problem-solving challenges, sophisticated reasoningClaude Sonnet 4.5 model card
Claude Sonnet 4.6General-purpose coding and agent tasksComplex problem-solving challenges, sophisticated reasoningClaude Sonnet 4.6 model card
Gemini 2.5 ProDeep reasoning and debuggingComplex code generation, debugging, and research workflowsGemini 2.5 Pro model card
Gemini 3 FlashFast help with simple or repetitive tasksFast, reliable answers to lightweight coding questionsGemini 3 Flash model card
Gemini 3.1 ProDeep reasoning and debuggingEffective and efficient edit-then-test loops with high tool precisionnot applicable
Grok Code Fast 1General-purpose coding and writingFast, accurate code completions and explanationsGrok Code Fast 1 model card
Qwen2.5General-purpose coding and writingCode generation, reasoning, and code repair / debuggingQwen2.5 model card
Raptor miniGeneral-purpose coding and writingFast, accurate code completions and explanationsComing soon

任务:常规用途的编码和编写

将这些模型用于需要平衡质量、速度和成本效益的常见开发任务。 如果没有特定要求,这些模型是不错的默认方案。

型号为什么它很合适
GPT-5.3-Codex在复杂的工程任务(如功能、测试、调试、重构和评审)中,无需冗长指令即可交付更高质量的代码。
GPT-5 微型这是适合大多数编码和编写任务的可靠默认方案。 快速、准确且跨语言和框架工作良好。
Grok Code Fast 1专用于编码任务。 在生成代码和跨多种语言调试方面表现出色。
猛龙迷你专门用于提供快速而准确的内联建议和解释。

何时使用这些模型

如果要执行以下操作,请使用这些模型之一:

  • 编写或查看函数、短文件或代码变更。
  • 生成文档、注释或摘要。
  • 快速解释错误或意外行为。
  • 在非英语编程环境中工作。

何时使用其他模型

如果要处理复杂的重构、体系结构决策或多步骤逻辑,请考虑使用深层推理和调试中的模型。 若要完成更快、更简单的任务(如重复编辑或一次性代码建议),请参阅快速帮助完成简单或重复的任务

任务:快速帮助完成简单或重复的任务

这些模型针对速度和响应能力进行了优化。 它们非常适合快速编辑、实用工具函数、语法帮助和轻型原型制作。 你将获得快速答案,而无需等待不必要的深度或较长的推理链。

型号为什么它很合适
克劳德·海库 4.5平衡快速响应与高质量输出。 非常适合小型任务和轻型代码解释。

何时使用这些模型

如果要执行以下操作,请使用这些模型之一:

  • 编写或编辑小型函数或实用工具代码。
  • 询问快速语法或语言问题。
  • 以最少的设置建立创意原型。
  • 获取有关简单提示或编辑的快速反馈。

何时使用其他模型

如果要处理复杂的重构、体系结构决策或多步骤逻辑,请参阅深层推理和调试。 有关需要更强常规用途的推理或更结构化输出的任务,请参阅常规用途的编码和编写

任务:深层推理和调试

这些模型专为需要分步推理、复杂决策或高上下文感知的任务而设计。 当你需要结构化分析、深思熟虑的代码生成或多文件理解时,它们就很合适。

型号为什么它很合适
GPT-5 微型提供深度推理和调试能力,与 GPT-5 相比,响应速度更快,资源使用率更低。 非常适合交互式会话和分步代码分析。
GPT-5.5擅长复杂的推理、代码分析和技术决策。
克洛德十四行诗 4.6对 Sonnet 4.5 版本进行了改进,在压力下能够更可靠地完成任务并进行更智能的推理。
克劳德·奥普斯 4.7Anthropic 的最强模型。 改进克洛德作品4.6。
双子座 3.1 专业版长篇语境中的高级推理和科学或技术分析。
Goldeneye复杂的解决问题挑战和复杂的推理。

何时使用这些模型

如果要执行以下操作,请使用这些模型之一:

  • 在跨多个文件的上下文中调试复杂问题。
  • 重构大型或互连的代码库。
  • 跨层规划功能或架构。
  • 在库、模式或工作流之间进行权衡。
  • 分析日志、性能数据或系统行为。

何时使用其他模型

若要完成快速迭代或轻型任务,请参阅快速帮助完成简单或重复的任务。 有关常规开发工作流或内容生成,请参阅常规用途的编码和编写

任务:使用视觉对象(图表、屏幕截图)

如果要询问有关屏幕截图、图表、UI 组件或其他视觉输入的问题,请使用这些模型。 这些模型支持多模态输入,非常适合前端工作或视觉对象调试。

型号为什么它很合适
GPT-5 微型这是适合大多数编码和编写任务的可靠默认方案。 快速、准确,并支持视觉推理任务的多模式输入。 在不同的语言和框架中都能良好运作。
克洛德十四行诗 4.6对 Sonnet 4.5 版本进行了改进,在压力下能够更可靠地完成任务并进行更智能的推理。
双子座 3.1 专业版深度推理和调试,非常适合复杂的代码生成、调试和研究工作流。

何时使用这些模型

如果要执行以下操作,请使用这些模型之一:

  • 询问有关图表、屏幕截图或 UI 组件的问题。
  • 获取有关视觉草稿或工作流的反馈。
  • 通过视觉上下文了解前端行为。

提示

如果在不支持图像输入(如代码编辑器)的上下文中使用模型,则看不到视觉推理的优势。 可以使用 MCP 服务器间接访问视觉输入。 请参阅“使用 MCP(模型上下文协议)服务器扩展 GitHub Copilot 对话助手”。

何时使用其他模型

如果任务涉及深层推理或大规模重构,请考虑使用深层推理和调试中的模型。 若要完成纯文本任务或更简单的代码编辑,请参阅快速帮助完成简单或重复的任务

后续步骤

选择正确的模型可帮助你充分利用 Copilot。 如果不确定要使用哪种模型,请从常规用途选项开始 GPT-4.1,然后根据需求进行调整。