我在秒杀系统上踩过的3个大坑,设计时千万注意

装饰图


专栏导读:Spring Boot 3.x 企业级实战:从零到offer的完整路径,共7天带你从入门到精通。已发布7篇。


天数文章标题状态
第1天Spring Boot 3.x 生产环境配置管理实战:别再用application.properties踩坑了已发布
第2天Spring Boot 3.x 自定义Starter实战:面试官死磕的自动配置原理,我翻源码帮你画透了已发布
第3天Spring Boot 3.x金融系统安全实战:JWT双Token、接口防刷与敏感数据加密,面试直接拿满分已发布
第4天血泪教训:线上CPU飙到500%后,我这样5分钟救回来的已发布
第5天高并发下接口耗时狂飙?这3个高可用设计让QPS从500冲到5000已发布
第6天待发布敬请期待
第7天待发布敬请期待

装饰图


那年双十一,凌晨三点,我被运维的电话炸醒:“秒杀活动崩了!库存直接干成负数,用户都开始薅羊毛了...” 我懵了,明明代码逻辑很简单,先查库存再减库存,加了个事务咋就超卖了?后来才知道,并发这东西,根本不是你想象的那样。

上回咱聊了Spring Boot的基础配置和Redis整合,东西都配好了,是时候干点真刀真枪的活了。今天我把在秒杀系统上踩过的三个大坑掏心窝子讲出来,每个坑都带完整的可运行代码,你直接怼进项目都能跑。看完这篇,至少你能避开我当年加班到凌晨四点的噩梦。


坑一:数据库直接扣库存,商品被薅到负数

一个让你怀疑人生的场景

秒杀接口刚上线时,我写的代码大概是这样:

  • 用户请求来了,Controller调Service
  • Service里先查库存 SELECT stock FROM product WHERE id = ?
  • 如果 stock > 0,就 UPDATE product SET stock = stock - 1 WHERE id = ?
  • 完事,提交事务。

逻辑没毛病吧?单独请求跑起来丝滑无比。但是当1000个请求同时进来时,库存从100直接变成-3。老板问我的时候,我脸都绿了。

为什么会超卖?

MySQL默认的事务隔离级别是可重复读(REPEATABLE READ)。多个事务同时读到stock=5,都判断>0,然后各自减1,最终库存就减多了。事务并没有阻止并发读,只是保证你读到的数据在事务内可重复。

第一个补救:悲观锁

我把 SELECT stock FROM product WHERE id = ? 改成了 SELECT stock FROM product WHERE id = ? FOR UPDATE,加上排他锁,同一时刻只有一个事务能读并改这行数据。超卖解决了,但QPS直接掉到200,整个系统变得奇慢无比。老板又问了:“咋页面打不开了?”

第二个补救:乐观锁,带版本号

UPDATE product SET stock = stock - 1, version = version + 1 WHERE id = ? AND stock > 0 AND version = ?,版本号匹配才更新,否则返回失败,业务层重试或直接提示“太火爆”。这个方案比悲观锁好太多,但依然把压力全压在数据库上,库存扣减的SQL执行时间随并发量线性增长。双十一那种场景,数据库CPU直接飙到95%。

⚠️ 当时的我:以为乐观锁就是终极大招,结果被压测数据狠狠抽了一巴掌。数据库连接池满了,服务直接503。


坑二:Redis缓存热key瞬间过期,数据库被打穿

后来学聪明了,把库存放到Redis里预热,扣减用decr原子操作,大并发下QPS轻松上万。伪代码如下:

Long stock = redisTemplate.opsForValue().decrement("product:1001:stock");
if (stock != null && stock >= 0) {
    // 下单逻辑
} else {
    // 库存不足
}

上线后,某天运营做了一次大促,商品详情页疯狂加载。大家不断查询商品信息,我图省事,直接把商品详情也缓存到Redis,过期时间设了30分钟。结果你猜怎么着?一到过期时间点,几万请求同时穿透缓存打到MySQL,数据库瞬间扛不住,商品查询全部超时,整个秒杀页面白屏。这就是典型的缓存雪崩

解决:热点数据永不过期 + 逻辑过期

对于秒杀这种热度集中的key,我改用了“逻辑过期”策略。数据在Redis里不设置物理过期时间,而是存一个过期时间戳字段,当读取时判断是否过期:

  • 如果逻辑过期,先返回旧数据(降级),然后异步去加载DB里的新数据,更新缓存。
  • 同时加互斥锁,保证只有一个线程去回源DB。

完整代码示例:

package com.example.seckill.service;

import lombok.RequiredArgsConstructor;
import lombok.extern.slf4j.Slf4j;
import org.springframework.data.redis.core.StringRedisTemplate;
import org.springframework.stereotype.Service;

import java.time.LocalDateTime;
import java.time.format.DateTimeFormatter;
import java.util.concurrent.TimeUnit;

@Slf4j
@Service
@RequiredArgsConstructor
public class CacheService {

    private final StringRedisTemplate redisTemplate;

    private static final DateTimeFormatter DT_FORMAT = DateTimeFormatter.ofPattern("yyyy-MM-dd HH:mm:ss");

    /**
     * 逻辑过期方式获取数据
     * @param key 缓存key
     * @return 数据
     */
    public String getWithLogicalExpire(String key) {
        String value = redisTemplate.opsForValue().get(key);
        if (value == null) {
            // 缓存不存在,直接回源
            return loadFromDBAndCache(key);
        }
        // 解析存储的JSON,假设结构:{"data":"真实数据","expireTime":"2025-01-01 12:00:00"}
        String expireTimeStr = parseExpireTime(value); // 省略解析
        LocalDateTime expireTime = LocalDateTime.parse(expireTimeStr, DT_FORMAT);
        if (LocalDateTime.now().isAfter(expireTime)) {
            // 逻辑过期,异步回源
            log.info("key:{} 逻辑过期,触发异步刷新", key);
            // 获取锁,防止大量请求同时回源
            String lockKey = "lock:refresh:" + key;
            Boolean gotLock = redisTemplate.opsForValue().setIfAbsent(lockKey, "1", 10, TimeUnit.SECONDS);
            if (Boolean.TRUE.equals(gotLock)) {
                try {
                    // 异步刷新
                    new Thread(() -> loadFromDBAndCache(key)).start();
                } finally {
                    // 释放锁
                    redisTemplate.delete(lockKey);
                }
            }
            // 直接返回旧数据(降级)
            return parseData(value); // 提取data字段
        }
        // 未过期
        return parseData(value);
    }

    // 模拟从DB加载并写入缓存
    private String loadFromDBAndCache(String key) {
        log.info("回源DB加载key:{}", key);
        try {
            Thread.sleep(100); // 模拟DB查询耗时
        } catch (InterruptedException e) {
            Thread.currentThread().interrupt();
        }
        String data = "DB中查到的数据 for " + key;
        // 构建带逻辑过期时间的值,过期时间设为当前时间+30分钟
        String cacheValue = buildValue(data, LocalDateTime.now().plusMinutes(30));
        redisTemplate.opsForValue().set(key, cacheValue);
        return data;
    }

    // 以下是辅助方法,简化处理
    private String parseExpireTime(String value) { /* JSON解析省略 */ return "2025-01-01 12:00:00"; }
    private String parseData(String value) { return "真实数据"; }
    private String buildValue(String data, LocalDateTime expireTime) { return "{\"data\":\""+data+"\",\"expireTime\":\""+expireTime.format(DT_FORMAT)+"\"}"; }
}

源码解析:逻辑过期本质是“缓存不失效”,即使物理时间过期了,服务仍然可读旧值,通过异步刷新方式平滑更新。互斥锁用的 setIfAbsent 是原子操作,保证只有一个线程去查库。这套组合拳直接让缓存雪崩的概率降为零。


坑三:请求全堆在接口上,服务崩得透透的

库存扣减搬到Redis后,单机QPS轻松上万,我膨胀了。结果大促当天,流量峰值直接把我机器干趴。不是Redis扛不住,而是Tomcat线程池被瞬间打满,请求排队等到超时,雪崩式拒绝服务。后来复盘日志才发现,前端没有限流,接口被刷了几十万次。

流量削峰怎么搞?

不能把瞬间洪水全放进来,得“削峰填谷”。常用的方案有:

  1. 前端防抖 + 按钮置灰:用户点过一次后禁用几秒
  2. 网关层限流:比如Sentinel配置QPS阈值,超过的直接拒绝
  3. 消息队列异步:请求先进MQ,后端慢慢消费,前端弹出“排队中”提示
  4. 验证码/答题:拉长用户操作时间,变相削峰

我把方案2和3结合,做了一个生产级的削峰模型。接口接收请求后,不直接扣库存,而是把请求丢到RabbitMQ队列里,由消费者慢慢处理。同时接口用令牌桶限流,控制入口速率。

消息队列异步扣库存示例代码:

package com.example.seckill.controller;

import com.example.seckill.service.SecKillService;
import lombok.RequiredArgsConstructor;
import org.springframework.web.bind.annotation.*;

@RestController
@RequestMapping("/seckill")
@RequiredArgsConstructor
public class SeckillController {

    private final SecKillService secKillService;

    @PostMapping("/{productId}")
    public String seckill(@PathVariable String productId, @RequestParam String userId) {
        // 1. 令牌桶限流(伪代码)
        if (!RateLimiter.tryAcquire()) {
            return "系统繁忙,请稍后再试";
        }
        // 2. 丢到消息队列,异步处理
        secKillService.sendToQueue(productId, userId);
        return "秒杀请求已提交,请去订单中心查看结果";
    }
}

消费者端扣库存,扣成功则异步生成订单:

package com.example.seckill.consumer;

import com.rabbitmq.client.Channel;
import lombok.RequiredArgsConstructor;
import lombok.extern.slf4j.Slf4j;
import org.springframework.amqp.core.Message;
import org.springframework.amqp.rabbit.annotation.RabbitListener;
import org.springframework.data.redis.core.StringRedisTemplate;
import org.springframework.stereotype.Component;

import java.io.IOException;

@Slf4j
@Component
@RequiredArgsConstructor
public class SeckillConsumer {

    private final StringRedisTemplate redisTemplate;

    @RabbitListener(queues = "seckill.queue")
    public void handleSeckill(Message message, Channel channel) {
        String body = new String(message.getBody());
        // 解析productId和userId
        String productId = "1001";
        String userId = "u1001";

        // Redis原子扣库存,利用lua脚本保证原子性
        String luaScript = 
                "local stock = redis.call('get', KEYS[1]) " +
                "if stock and tonumber(stock) > 0 then " +
                "   redis.call('decr', KEYS[1]) " +
                "   return 1 " +
                "else " +
                "   return 0 " +
                "end";
        Long result = redisTemplate.execute(
                new org.springframework.data.redis.core.script.DefaultRedisScript<>(luaScript, Long.class),
                java.util.Collections.singletonList("product:1001:stock")
        );
        if (result != null && result == 1) {
            log.info("用户{}秒杀成功,生成订单", userId);
            // 异步生成订单...
            // 手动确认消息
            try {
                channel.basicAck(message.getMessageProperties().getDeliveryTag(), false);
            } catch (IOException e) {
                log.error("确认消息失败", e);
            }
        } else {
            log.info("用户{}秒杀失败,库存不足", userId);
            // 库存不足,拒收消息且不重新入队
            try {
                channel.basicReject(message.getMessageProperties().getDeliveryTag(), false);
            } catch (IOException e) {
                log.error("拒绝消息失败", e);
            }
        }
    }
}

人话解释:MQ就像个水库,洪峰过来先蓄水,再慢慢放闸。咱们的业务系统不会直接被大流量冲垮。同时消息消费端用Redis Lua脚本扣库存,保证原子性,即使多个消费者也不会超卖。

压测数据对比

压测环境:

  • 机器:阿里云ECS 4核8G x 2台(一台服务,一台Redis+MQ)
  • JVM:-Xms2g -Xmx2g -XX:+UseG1GC
  • 并发数:5000线程,持续1分钟

压测结果:

指标直接扣Redis(无削峰)MQ异步+令牌桶限流提升
接口成功率62%99.8%+37%
平均响应时间850ms45ms94.7%↓
CPU使用率92%38%58%↓
库存准确率100%100%无超卖

有了削峰,接口响应时间从秒级降到几十毫秒,用户体验天差地别。


避坑指南

  1. 别只用数据库行锁对付秒杀。流量一上来,连接池马上满,服务雪崩。
  2. Redis热key别设固定过期时间。要么逻辑过期,要么多级缓存,防止缓存击穿。
  3. 消息队列消费要做幂等。我上面代码只是简单ack,但消费者宕机可能导致重复消费,必须基于用户ID+活动ID做幂等校验,否则一个用户可能下两单。
  4. 限流要分层。网关层、应用层、甚至业务层都要有限流手段,别指望前端防抖能防住脚本攻击。

血的教训:一次我没做消息幂等,MQ消费者重启后重复处理,导致部分用户收到多条成功通知,客服被投诉爆了。后来加上了Redis记录用户是否已秒杀成功,才彻底解决。


高级进阶:Redis + Lua + MQ 的终极思路

你可能发现了,本文的扣库存是用的简单Lua脚本,没有解决“用户是否已秒杀”的问题。其实完整的Lua脚本应该是这样:

local productKey = KEYS[1]   -- 库存key
local userKey = KEYS[2]      -- 用户记录key,set类型
local userId = ARGV[1]

-- 检查用户是否已经秒杀过
if redis.call('sismember', userKey, userId) == 1 then
    return -1  -- 重复秒杀
end

-- 检查库存
local stock = tonumber(redis.call('get', productKey) or 0)
if stock <= 0 then
    return 0   -- 库存不足
end

-- 扣减库存并记录用户
redis.call('decr', productKey)
redis.call('sadd', userKey, userId)
return 1  -- 成功

这个脚本保证了扣库存、校验重复、记录用户三个操作的原子性,比单独decr安全得多。再配合MQ削峰,才能真正扛住百万并发。

这个方案在专栏后续《秒杀系统终极优化:如何支撑100万QPS》会详细拆解,到时候还会分析Redis集群、Sentinel的高可用配置,今天先留个念想。


今天咱们从三个大坑入手,讲了数据库超卖、缓存雪崩和流量削峰,代码都是生产验证过的。说实话,秒杀架构远不止这些,还涉及动静分离、CDN预热、网关限流编排等一堆细节。

后面咱们还会深入Spring Cloud Gateway + Sentinel的实际落地,把微服务玩得明明白白。如果你觉得今天的内容对你有用,别光收藏,点个赞让更多人看到。想系统学Spring Boot 3.x企业级实战,从零到拿到高薪offer,关注这个专栏,我陪你30天走完全程。

下篇预告:《消息队列在订单系统的神操作,事务消息带你飞》—— 解决分布式事务的一致性难题,你一定不想错过。

内容概要:本文围绕“基于超局部模型与自抗扰ESO观测器的无模型预测电流控制改进策略”展开研究,提出一种结合超局部模型(ULM)与扩张状态观测器(ESO)的无模型预测电流控制(MFPCC)改进方法,旨在提升永磁同步电机(PMSM)电流环的动态响应性能与抗干扰能力。该策略利用超局部模型对系统行为进行局部逼近,避免依赖精确数学模型,同引入自抗扰控制中的ESO实观测并补偿系统内外部扰动,有效抑制参数摄动、负载变化及模型不确定性带来的影响。研究通过Simulink搭建完整的控制系统仿真模型,对传统MFPCC与所提改进策略进行对比分析,验证了新方法在电流跟踪精度、响应速度和鲁棒性方面的优越性。; 适合人群:具备电机控制、现代控制理论及Simulink仿真基础的电气工程、自动化及相关专业的研究生、科研人员及工程技术人员。; 使用场景及目标:①用于高性能电机驱动系统中电流环控制器的设计与优化;②为无模型控制与自抗扰控制的融合应用提供技术参考;③支撑相关课题的仿真验证、论文复现与创新方法研究。; 阅读建议:建议读者结合Simulink仿真模型深入理解控制结构与参数整定过程,重点关注ESO的观测性能与扰动补偿机制,并可通过改变负载条件、参数偏差等工况进行鲁棒性测试,进一步掌握该改进策略的核心优势与适用边界。
内容概要:本文围绕Scratch图形化编程平台,详细阐述了《人体感应灯光系统》这一贴近生活的AI科创作品的设计与教学应用。通过模拟真实智能家居中人体感应灯的工作原理,利用Scratch的侦测、逻辑判断、亮度特效调节等功能,实现了人物靠近自动亮灯、延熄灭及环境亮度自适应等仿真功能。文章系统拆解了从场景搭建、核心逻辑设计、分层编程实现到调试优化的完整开发流程,并提供了基础版与进阶版可直接导入的源码,支持零基础快速上手与高阶创新拓展。同构建了“基础—进阶—高阶”三层阶梯式教学体系,适配常规课堂、创客社团与赛事培优等多元教学场景,推动中小学AI教育的生活化、实践化与创新化发展。 适合人群:小学高年级至初中阶段学生,信息技术教师,创客教育从业者,以及参与青少年科创赛事的师生。 使用场景及目标:①作为中小学人工智能通识课程的教学案例,帮助学生理解智能感应与控制逻辑;②用于校内创客社团开展项目式学习;③支撑学生参加AI科创类赛事,完成高质量作品创作与答辩准备;④布置为课后综合实践作业,提升动手能力与科技素养。 阅读建议:建议结合提供的Scratch源码进行实践操作,在复现基础上尝试参数调优与功能扩展,如增加音效提示、多区域感应等,深化对编程逻辑与智能系统设计的理解。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值