模型与计费

了解各模型特点与计费方式

模型与计费

常用模型推荐

模型	特点	推荐用途
Claude Sonnet 4.5	性价比高，速度快	日常编程任务
Claude Opus 4.5	最强智能，深度思考	复杂问题、架构设计
GPT-5.2	细致靠谱，稳定输出	代码生成、文档编写
Gemini 3 Pro	前端能力强	前端开发、UI 设计
Gemini 3 Flash	速度快、价格低	简单任务、文件读取

分组说明

Claude Max 号池：由 Claude Max 账号组成，稳定性高
Codex 分组：支持 OpenAI 系模型
Gemini 分组：支持 Google 系模型
AWS Bedrock 分组：使用 AWS 官方服务，响应快

什么是缓存？

缓存是一种优化机制：

首次请求：发送内容时会创建缓存（有额外费用）
命中缓存：后续相似请求从缓存读取，价格极低
缓存时长：5 分钟适合频繁切换，1 小时适合专注同一项目

什么是上下文？

上下文是模型能处理的内容长度：

默认上下文：200K-256K tokens
特价分组：上下文可能更短
1M 上下文：适合处理超长内容

常见问题

使用过程中的常见问题及解决方案

On this page

模型与计费常用模型推荐分组说明什么是缓存？什么是上下文？