All checks were successful
构建并部署到测试环境(无 SSH) / build-and-deploy (push) Successful in 6m33s
**变更说明**: - 删除所有 *_test.go 文件(单元测试、集成测试、验收测试、流程测试) - 删除整个 tests/ 目录 - 更新 CLAUDE.md:用"测试禁令"章节替换所有测试要求 - 删除测试生成 Skill (openspec-generate-acceptance-tests) - 删除测试生成命令 (opsx:gen-tests) - 更新 tasks.md:删除所有测试相关任务 **新规范**: - ❌ 禁止编写任何形式的自动化测试 - ❌ 禁止创建 *_test.go 文件 - ❌ 禁止在任务中包含测试相关工作 - ✅ 仅当用户明确要求时才编写测试 **原因**: 业务系统的正确性通过人工验证和生产环境监控保证,测试代码维护成本高于价值。 Co-Authored-By: Claude Sonnet 4.5 <noreply@anthropic.com>
11 KiB
11 KiB
Spec: 自动停复机机制
业务背景
为什么需要自动停复机
现状问题:
- 当前系统流量耗尽后手动停机,用户购买加油包后需手动复机
- 停复机时机不精确,可能出现流量已耗尽但仍可上网的情况
- 用户购买加油包后不知道需要复机,导致流量无法使用
业务目标:
- 所有套餐流量耗尽时自动停机,避免超额使用
- 购买新套餐(正式/加油包)后自动复机,提升用户体验
- 停复机延迟 < 2分钟,确保及时性
业务规则
1. 停机触发条件
停机条件 = (所有生效套餐流量 = 0) AND (卡当前状态 = active)
详细逻辑:
-- 检查是否有剩余流量
SELECT COUNT(*) FROM tb_package_usage
WHERE iot_card_id = ?
AND status = 1 -- 生效中
AND data_usage_mb < data_limit_mb;
-- 如果 COUNT = 0,触发停机
2. 复机触发条件
复机条件 = (存在可用流量套餐) AND (卡当前状态 = stopped)
可用流量套餐定义:
status='active' AND remaining_data_amount > 0
3. 停复机延迟要求
- 目标延迟:< 2分钟(从触发条件到完成停复机)
- 实现方式:流量检查后同步调用停复机接口(不走异步队列)
4. 运营商接口容错
- 停机/复机失败时:
- 重试3次(间隔 1s, 2s, 4s)
- 仍失败:记录错误日志,人工介入
- 不阻塞套餐激活流程
ADDED Requirements
Requirement: 流量耗尽自动停机
系统 SHALL 在主套餐和所有加油包流量都用完时,调用运营商接口停机。
Scenario: 所有套餐流量耗尽触发停机
- GIVEN 卡 C1 有主套餐(剩余0MB)和加油包(剩余0MB),卡状态为 active
- WHEN 轮询系统检查停机条件
- THEN 系统执行停机操作:
- 调用运营商停机接口
- 更新 IotCard.network_status=0(已停机)
- 记录 stopped_at 时间
- 记录 stop_reason="traffic_exhausted"
- 记录操作日志
Scenario: 有剩余流量时不停机
- GIVEN 主套餐流量用完,但加油包剩余1GB
- WHEN 轮询系统检查停机条件
- THEN 系统查询到有剩余流量,不触发停机
Scenario: 停机接口调用失败重试
- GIVEN 所有套餐流量用完,需要停机
- WHEN 调用运营商停机接口失败(网络超时)
- THEN 系统重试3次(间隔1s/2s/4s)
- AND 3次都失败后记录 Error 日志,告警通知运维
Scenario: 停机幂等性
- GIVEN 卡已停机(network_status=0)
- WHEN 轮询系统再次检测到流量用完
- THEN 系统检测到已停机,跳过停机调用
Requirement: 购买套餐自动复机
系统 SHALL 在购买新套餐(正式/加油包)激活后,自动调用运营商接口复机。
Scenario: 购买加油包自动复机
- GIVEN 卡 C1 已停机(network_status=0,stopped_at=2026-02-10 10:00)
- WHEN 用户购买加油包,激活成功(status=active)
- THEN 系统执行复机操作:
- 调用运营商复机接口
- 更新 IotCard.network_status=1(正常)
- 记录 resumed_at 时间
- 清空 stopped_at
- 记录操作日志
Scenario: 复机幂等性
- GIVEN 卡 C1 已停机
- WHEN 用户快速购买2个加油包
- THEN 第1个加油包激活 → 触发复机成功
- AND 第2个加油包激活 → 检测到已是 active 状态,跳过复机
- AND 运营商复机接口调用仅1次
Scenario: 购买主套餐自动复机
- GIVEN 卡 C1 已停机,主套餐过期
- WHEN 用户购买新主套餐,激活成功
- THEN 系统自动触发复机
Scenario: 复机失败容错
- GIVEN 卡已停机
- WHEN 购买加油包激活,但运营商复机接口返回失败
- THEN 系统重试3次
- AND 仍失败后:
- 套餐激活成功(status=active)
- 卡状态仍为 stopped
- 错误日志已记录
- 告警通知运维
Requirement: 复机延迟 < 2分钟
系统 SHALL 确保从套餐激活到卡复机完成的延迟 < 2分钟。
Scenario: 复机延迟达标
- GIVEN 加油包在 2026-02-10 10:00:00 激活成功
- WHEN 系统同步调用复机接口
- THEN 复机完成时间 < 2026-02-10 10:02:00(延迟 < 2分钟)
Scenario: 复机失败后重试延迟
- GIVEN 加油包激活,第1次复机调用失败
- WHEN 系统重试3次(间隔1s/2s/4s)
- THEN 复机在第3次重试成功,总延迟约7秒
数据模型变更
tb_iot_card 新增字段
| 字段 | 类型 | 说明 |
|---|---|---|
| stopped_at | timestamp | 停机时间,NULL=未停机 |
| resumed_at | timestamp | 最近复机时间 |
| stop_reason | varchar(50) | 停机原因:traffic_exhausted, manual, arrears |
索引:
- 无需索引(非查询字段,仅用于审计)
业务流程
流程1:流量耗尽停机
graph TD
A[流量上报] --> B{所有套餐流量=0?}
B -->|是| C{卡状态=active?}
B -->|否| Z[结束]
C -->|是| D[调用运营商停机接口]
C -->|否| Z
D --> E{停机成功?}
E -->|是| F[更新卡状态=stopped]
E -->|否| G[重试3次]
F --> H[记录stopped_at]
G --> E
流程2:购买加油包复机
graph TD
A[加油包激活成功] --> B{卡状态=stopped?}
B -->|是| C[调用运营商复机接口]
B -->|否| Z[跳过复机]
C --> D{复机成功?}
D -->|是| E[更新卡状态=active]
D -->|否| F[重试3次]
E --> G[清空stopped_at]
F --> D
F -->|3次失败| H[记录错误日志]
并发场景
Scenario: 并发停复机
- GIVEN 卡流量刚好用完,同时用户购买加油包
- WHEN 停机任务和复机任务并发执行
- THEN 使用数据库行锁:
SELECT * FROM iot_card WHERE id=? FOR UPDATE - AND 后执行的操作覆盖前一个操作的状态
Scenario: 复机任务重复执行
- GIVEN 用户购买2个加油包,触发2次复机
- WHEN 第1次复机成功,卡状态=active
- THEN 第2次复机检测到卡状态=active,跳过调用
异常处理
1. 停机接口超时
- 场景:运营商停机接口响应超时(>5秒)
- 处理:
- 记录 Error 日志(包含卡号、超时时间)
- 重试3次,间隔1s/2s/4s
- 3次都失败:记录到死信队列,告警通知
- 用户影响:卡可能仍可上网(停机未成功)
2. 复机接口失败
- 场景:运营商复机接口返回业务错误(如卡状态异常)
- 处理:
- 记录 Error 日志(包含卡号、错误码、错误消息)
- 重试3次
- 3次都失败:套餐激活成功,但卡保持停机状态
- 告警通知运维人工介入
- 用户影响:购买加油包后仍无法上网
3. 停复机状态不一致
- 场景:系统记录已停机,但运营商侧仍正常
- 处理:
- 轮询系统定期同步卡状态
- 检测到不一致时记录 Warning 日志
- 自动修正系统状态(以运营商侧为准)
- 修正频率:每小时同步一次
性能指标
| 操作 | 目标响应时间 | 监控指标 |
|---|---|---|
| 停机接口调用 | < 5秒 | 运营商API耗时 |
| 复机接口调用 | < 5秒 | 运营商API耗时 |
| 停机条件检查 | < 50ms | SELECT COUNT查询耗时 |
| 端到端停机延迟 | < 2分钟 | 流量用完到停机完成 |
| 端到端复机延迟 | < 2分钟 | 套餐激活到复机完成 |
错误码定义
| 错误码 | HTTP 状态码 | 错误消息 | 场景 |
|---|---|---|---|
| CodeInternal | 500 | 停机操作失败,请重试 | 运营商停机接口失败 |
| CodeInternal | 500 | 复机操作失败,请重试 | 运营商复机接口失败 |
测试场景矩阵
| 维度 | 场景 | 预期结果 |
|---|---|---|
| 停机 | 所有套餐流量用完 | 自动停机 |
| 主套餐用完+加油包剩余 | 不停机 | |
| 停机接口失败 | 重试3次,失败告警 | |
| 已停机重复检测 | 跳过停机 | |
| 复机 | 购买加油包 | 自动复机 |
| 购买主套餐 | 自动复机 | |
| 复机接口失败 | 重试3次,套餐激活成功,卡保持停机 | |
| 并发购买2个加油包 | 复机接口调用1次 | |
| 延迟 | 复机延迟 | < 2分钟 |
| 停机延迟 | < 2分钟 | |
| 异常 | 停机超时 | 重试后告警 |
| 状态不一致 | 轮询同步修正 |
实现参考
Service 层:CheckAndStop
func (s *Service) CheckAndStopCard(ctx context.Context, cardID uint) error {
// 1. 查询卡信息
card, err := s.iotCardStore.GetByID(ctx, cardID)
if err != nil {
return err
}
// 2. 检查卡状态
if card.NetworkStatus != constants.NetworkStatusActive {
return nil // 已停机,跳过
}
// 3. 检查是否有剩余流量
hasAvailableData, err := s.packageUsageStore.HasAvailableData(ctx, cardID)
if err != nil {
return err
}
if hasAvailableData {
return nil // 有剩余流量,不停机
}
// 4. 调用运营商停机接口(带重试)
err = s.carrierClient.StopCard(ctx, card.ICCID, 3)
if err != nil {
s.logger.Error("停机失败",
zap.Uint("card_id", cardID),
zap.Error(err))
return err
}
// 5. 更新卡状态
err = s.iotCardStore.UpdateStopStatus(ctx, cardID, time.Now(), "traffic_exhausted")
if err != nil {
return err
}
// 6. 记录审计日志
s.auditService.LogOperation(ctx, &model.OperationLog{
OperationType: "card_stop",
OperationDesc: "流量耗尽自动停机",
TargetID: cardID,
})
return nil
}
Service 层:ResumeCard
func (s *Service) ResumeCardIfStopped(ctx context.Context, cardID uint) error {
// 1. 查询卡信息
card, err := s.iotCardStore.GetByID(ctx, cardID)
if err != nil {
return err
}
// 2. 检查卡状态
if card.NetworkStatus != constants.NetworkStatusStopped {
return nil // 未停机,跳过
}
// 3. 调用运营商复机接口(带重试)
err = s.carrierClient.ResumeCard(ctx, card.ICCID, 3)
if err != nil {
s.logger.Error("复机失败",
zap.Uint("card_id", cardID),
zap.Error(err))
// 复机失败不阻塞套餐激活
return nil
}
// 4. 更新卡状态
err = s.iotCardStore.UpdateResumeStatus(ctx, cardID, time.Now())
if err != nil {
return err
}
// 5. 记录审计日志
s.auditService.LogOperation(ctx, &model.OperationLog{
OperationType: "card_resume",
OperationDesc: "购买套餐自动复机",
TargetID: cardID,
})
return nil
}
本 Spec 完成,包含:
- ✅ 业务背景和业务规则
- ✅ 详细场景(停机、复机、幂等性、容错)
- ✅ 数据模型变更
- ✅ 业务流程图
- ✅ 并发场景和异常处理
- ✅ 性能指标和错误码定义
- ✅ 测试场景矩阵和实现参考