模型与计费
了解各模型特点与计费方式
模型与计费
常用模型推荐
| 模型 | 特点 | 推荐用途 |
|---|---|---|
| Claude Sonnet 4.5 | 性价比高,速度快 | 日常编程任务 |
| Claude Opus 4.5 | 最强智能,深度思考 | 复杂问题、架构设计 |
| GPT-5.2 | 细致靠谱,稳定输出 | 代码生成、文档编写 |
| Gemini 3 Pro | 前端能力强 | 前端开发、UI 设计 |
| Gemini 3 Flash | 速度快、价格低 | 简单任务、文件读取 |
分组说明
- Claude Max 号池:由 Claude Max 账号组成,稳定性高
- Codex 分组:支持 OpenAI 系模型
- Gemini 分组:支持 Google 系模型
- AWS Bedrock 分组:使用 AWS 官方服务,响应快
什么是缓存?
缓存是一种优化机制:
- 首次请求:发送内容时会创建缓存(有额外费用)
- 命中缓存:后续相似请求从缓存读取,价格极低
- 缓存时长:5 分钟适合频繁切换,1 小时适合专注同一项目
什么是上下文?
上下文是模型能处理的内容长度:
- 默认上下文:200K-256K tokens
- 特价分组:上下文可能更短
- 1M 上下文:适合处理超长内容