我在秒杀系统上踩过的3个大坑,设计时千万注意

装饰图


专栏导读:Spring Boot 3.x 企业级实战:从零到offer的完整路径,共7天带你从入门到精通。已发布7篇。


天数文章标题状态
第1天Spring Boot 3.x 生产环境配置管理实战:别再用application.properties踩坑了已发布
第2天Spring Boot 3.x 自定义Starter实战:面试官死磕的自动配置原理,我翻源码帮你画透了已发布
第3天Spring Boot 3.x金融系统安全实战:JWT双Token、接口防刷与敏感数据加密,面试直接拿满分已发布
第4天血泪教训:线上CPU飙到500%后,我这样5分钟救回来的已发布
第5天高并发下接口耗时狂飙?这3个高可用设计让QPS从500冲到5000已发布
第6天待发布敬请期待
第7天待发布敬请期待

装饰图


那年双十一,凌晨三点,我被运维的电话炸醒:“秒杀活动崩了!库存直接干成负数,用户都开始薅羊毛了...” 我懵了,明明代码逻辑很简单,先查库存再减库存,加了个事务咋就超卖了?后来才知道,并发这东西,根本不是你想象的那样。

上回咱聊了Spring Boot的基础配置和Redis整合,东西都配好了,是时候干点真刀真枪的活了。今天我把在秒杀系统上踩过的三个大坑掏心窝子讲出来,每个坑都带完整的可运行代码,你直接怼进项目都能跑。看完这篇,至少你能避开我当年加班到凌晨四点的噩梦。


坑一:数据库直接扣库存,商品被薅到负数

一个让你怀疑人生的场景

秒杀接口刚上线时,我写的代码大概是这样:

  • 用户请求来了,Controller调Service
  • Service里先查库存 SELECT stock FROM product WHERE id = ?
  • 如果 stock > 0,就 UPDATE product SET stock = stock - 1 WHERE id = ?
  • 完事,提交事务。

逻辑没毛病吧?单独请求跑起来丝滑无比。但是当1000个请求同时进来时,库存从100直接变成-3。老板问我的时候,我脸都绿了。

为什么会超卖?

MySQL默认的事务隔离级别是可重复读(REPEATABLE READ)。多个事务同时读到stock=5,都判断>0,然后各自减1,最终库存就减多了。事务并没有阻止并发读,只是保证你读到的数据在事务内可重复。

第一个补救:悲观锁

我把 SELECT stock FROM product WHERE id = ? 改成了 SELECT stock FROM product WHERE id = ? FOR UPDATE,加上排他锁,同一时刻只有一个事务能读并改这行数据。超卖解决了,但QPS直接掉到200,整个系统变得奇慢无比。老板又问了:“咋页面打不开了?”

第二个补救:乐观锁,带版本号

UPDATE product SET stock = stock - 1, version = version + 1 WHERE id = ? AND stock > 0 AND version = ?,版本号匹配才更新,否则返回失败,业务层重试或直接提示“太火爆”。这个方案比悲观锁好太多,但依然把压力全压在数据库上,库存扣减的SQL执行时间随并发量线性增长。双十一那种场景,数据库CPU直接飙到95%。

⚠️ 当时的我:以为乐观锁就是终极大招,结果被压测数据狠狠抽了一巴掌。数据库连接池满了,服务直接503。


坑二:Redis缓存热key瞬间过期,数据库被打穿

后来学聪明了,把库存放到Redis里预热,扣减用decr原子操作,大并发下QPS轻松上万。伪代码如下:

Long stock = redisTemplate.opsForValue().decrement("product:1001:stock");
if (stock != null && stock >= 0) {
    // 下单逻辑
} else {
    // 库存不足
}

上线后,某天运营做了一次大促,商品详情页疯狂加载。大家不断查询商品信息,我图省事,直接把商品详情也缓存到Redis,过期时间设了30分钟。结果你猜怎么着?一到过期时间点,几万请求同时穿透缓存打到MySQL,数据库瞬间扛不住,商品查询全部超时,整个秒杀页面白屏。这就是典型的缓存雪崩

解决:热点数据永不过期 + 逻辑过期

对于秒杀这种热度集中的key,我改用了“逻辑过期”策略。数据在Redis里不设置物理过期时间,而是存一个过期时间戳字段,当读取时判断是否过期:

  • 如果逻辑过期,先返回旧数据(降级),然后异步去加载DB里的新数据,更新缓存。
  • 同时加互斥锁,保证只有一个线程去回源DB。

完整代码示例:

package com.example.seckill.service;

import lombok.RequiredArgsConstructor;
import lombok.extern.slf4j.Slf4j;
import org.springframework.data.redis.core.StringRedisTemplate;
import org.springframework.stereotype.Service;

import java.time.LocalDateTime;
import java.time.format.DateTimeFormatter;
import java.util.concurrent.TimeUnit;

@Slf4j
@Service
@RequiredArgsConstructor
public class CacheService {

    private final StringRedisTemplate redisTemplate;

    private static final DateTimeFormatter DT_FORMAT = DateTimeFormatter.ofPattern("yyyy-MM-dd HH:mm:ss");

    /**
     * 逻辑过期方式获取数据
     * @param key 缓存key
     * @return 数据
     */
    public String getWithLogicalExpire(String key) {
        String value = redisTemplate.opsForValue().get(key);
        if (value == null) {
            // 缓存不存在,直接回源
            return loadFromDBAndCache(key);
        }
        // 解析存储的JSON,假设结构:{"data":"真实数据","expireTime":"2025-01-01 12:00:00"}
        String expireTimeStr = parseExpireTime(value); // 省略解析
        LocalDateTime expireTime = LocalDateTime.parse(expireTimeStr, DT_FORMAT);
        if (LocalDateTime.now().isAfter(expireTime)) {
            // 逻辑过期,异步回源
            log.info("key:{} 逻辑过期,触发异步刷新", key);
            // 获取锁,防止大量请求同时回源
            String lockKey = "lock:refresh:" + key;
            Boolean gotLock = redisTemplate.opsForValue().setIfAbsent(lockKey, "1", 10, TimeUnit.SECONDS);
            if (Boolean.TRUE.equals(gotLock)) {
                try {
                    // 异步刷新
                    new Thread(() -> loadFromDBAndCache(key)).start();
                } finally {
                    // 释放锁
                    redisTemplate.delete(lockKey);
                }
            }
            // 直接返回旧数据(降级)
            return parseData(value); // 提取data字段
        }
        // 未过期
        return parseData(value);
    }

    // 模拟从DB加载并写入缓存
    private String loadFromDBAndCache(String key) {
        log.info("回源DB加载key:{}", key);
        try {
            Thread.sleep(100); // 模拟DB查询耗时
        } catch (InterruptedException e) {
            Thread.currentThread().interrupt();
        }
        String data = "DB中查到的数据 for " + key;
        // 构建带逻辑过期时间的值,过期时间设为当前时间+30分钟
        String cacheValue = buildValue(data, LocalDateTime.now().plusMinutes(30));
        redisTemplate.opsForValue().set(key, cacheValue);
        return data;
    }

    // 以下是辅助方法,简化处理
    private String parseExpireTime(String value) { /* JSON解析省略 */ return "2025-01-01 12:00:00"; }
    private String parseData(String value) { return "真实数据"; }
    private String buildValue(String data, LocalDateTime expireTime) { return "{\"data\":\""+data+"\",\"expireTime\":\""+expireTime.format(DT_FORMAT)+"\"}"; }
}

源码解析:逻辑过期本质是“缓存不失效”,即使物理时间过期了,服务仍然可读旧值,通过异步刷新方式平滑更新。互斥锁用的 setIfAbsent 是原子操作,保证只有一个线程去查库。这套组合拳直接让缓存雪崩的概率降为零。


坑三:请求全堆在接口上,服务崩得透透的

库存扣减搬到Redis后,单机QPS轻松上万,我膨胀了。结果大促当天,流量峰值直接把我机器干趴。不是Redis扛不住,而是Tomcat线程池被瞬间打满,请求排队等到超时,雪崩式拒绝服务。后来复盘日志才发现,前端没有限流,接口被刷了几十万次。

流量削峰怎么搞?

不能把瞬间洪水全放进来,得“削峰填谷”。常用的方案有:

  1. 前端防抖 + 按钮置灰:用户点过一次后禁用几秒
  2. 网关层限流:比如Sentinel配置QPS阈值,超过的直接拒绝
  3. 消息队列异步:请求先进MQ,后端慢慢消费,前端弹出“排队中”提示
  4. 验证码/答题:拉长用户操作时间,变相削峰

我把方案2和3结合,做了一个生产级的削峰模型。接口接收请求后,不直接扣库存,而是把请求丢到RabbitMQ队列里,由消费者慢慢处理。同时接口用令牌桶限流,控制入口速率。

消息队列异步扣库存示例代码:

package com.example.seckill.controller;

import com.example.seckill.service.SecKillService;
import lombok.RequiredArgsConstructor;
import org.springframework.web.bind.annotation.*;

@RestController
@RequestMapping("/seckill")
@RequiredArgsConstructor
public class SeckillController {

    private final SecKillService secKillService;

    @PostMapping("/{productId}")
    public String seckill(@PathVariable String productId, @RequestParam String userId) {
        // 1. 令牌桶限流(伪代码)
        if (!RateLimiter.tryAcquire()) {
            return "系统繁忙,请稍后再试";
        }
        // 2. 丢到消息队列,异步处理
        secKillService.sendToQueue(productId, userId);
        return "秒杀请求已提交,请去订单中心查看结果";
    }
}

消费者端扣库存,扣成功则异步生成订单:

package com.example.seckill.consumer;

import com.rabbitmq.client.Channel;
import lombok.RequiredArgsConstructor;
import lombok.extern.slf4j.Slf4j;
import org.springframework.amqp.core.Message;
import org.springframework.amqp.rabbit.annotation.RabbitListener;
import org.springframework.data.redis.core.StringRedisTemplate;
import org.springframework.stereotype.Component;

import java.io.IOException;

@Slf4j
@Component
@RequiredArgsConstructor
public class SeckillConsumer {

    private final StringRedisTemplate redisTemplate;

    @RabbitListener(queues = "seckill.queue")
    public void handleSeckill(Message message, Channel channel) {
        String body = new String(message.getBody());
        // 解析productId和userId
        String productId = "1001";
        String userId = "u1001";

        // Redis原子扣库存,利用lua脚本保证原子性
        String luaScript = 
                "local stock = redis.call('get', KEYS[1]) " +
                "if stock and tonumber(stock) > 0 then " +
                "   redis.call('decr', KEYS[1]) " +
                "   return 1 " +
                "else " +
                "   return 0 " +
                "end";
        Long result = redisTemplate.execute(
                new org.springframework.data.redis.core.script.DefaultRedisScript<>(luaScript, Long.class),
                java.util.Collections.singletonList("product:1001:stock")
        );
        if (result != null && result == 1) {
            log.info("用户{}秒杀成功,生成订单", userId);
            // 异步生成订单...
            // 手动确认消息
            try {
                channel.basicAck(message.getMessageProperties().getDeliveryTag(), false);
            } catch (IOException e) {
                log.error("确认消息失败", e);
            }
        } else {
            log.info("用户{}秒杀失败,库存不足", userId);
            // 库存不足,拒收消息且不重新入队
            try {
                channel.basicReject(message.getMessageProperties().getDeliveryTag(), false);
            } catch (IOException e) {
                log.error("拒绝消息失败", e);
            }
        }
    }
}

人话解释:MQ就像个水库,洪峰过来先蓄水,再慢慢放闸。咱们的业务系统不会直接被大流量冲垮。同时消息消费端用Redis Lua脚本扣库存,保证原子性,即使多个消费者也不会超卖。

压测数据对比

压测环境:

  • 机器:阿里云ECS 4核8G x 2台(一台服务,一台Redis+MQ)
  • JVM:-Xms2g -Xmx2g -XX:+UseG1GC
  • 并发数:5000线程,持续1分钟

压测结果:

指标直接扣Redis(无削峰)MQ异步+令牌桶限流提升
接口成功率62%99.8%+37%
平均响应时间850ms45ms94.7%↓
CPU使用率92%38%58%↓
库存准确率100%100%无超卖

有了削峰,接口响应时间从秒级降到几十毫秒,用户体验天差地别。


避坑指南

  1. 别只用数据库行锁对付秒杀。流量一上来,连接池马上满,服务雪崩。
  2. Redis热key别设固定过期时间。要么逻辑过期,要么多级缓存,防止缓存击穿。
  3. 消息队列消费要做幂等。我上面代码只是简单ack,但消费者宕机可能导致重复消费,必须基于用户ID+活动ID做幂等校验,否则一个用户可能下两单。
  4. 限流要分层。网关层、应用层、甚至业务层都要有限流手段,别指望前端防抖能防住脚本攻击。

血的教训:一次我没做消息幂等,MQ消费者重启后重复处理,导致部分用户收到多条成功通知,客服被投诉爆了。后来加上了Redis记录用户是否已秒杀成功,才彻底解决。


高级进阶:Redis + Lua + MQ 的终极思路

你可能发现了,本文的扣库存是用的简单Lua脚本,没有解决“用户是否已秒杀”的问题。其实完整的Lua脚本应该是这样:

local productKey = KEYS[1]   -- 库存key
local userKey = KEYS[2]      -- 用户记录key,set类型
local userId = ARGV[1]

-- 检查用户是否已经秒杀过
if redis.call('sismember', userKey, userId) == 1 then
    return -1  -- 重复秒杀
end

-- 检查库存
local stock = tonumber(redis.call('get', productKey) or 0)
if stock <= 0 then
    return 0   -- 库存不足
end

-- 扣减库存并记录用户
redis.call('decr', productKey)
redis.call('sadd', userKey, userId)
return 1  -- 成功

这个脚本保证了扣库存、校验重复、记录用户三个操作的原子性,比单独decr安全得多。再配合MQ削峰,才能真正扛住百万并发。

这个方案在专栏后续《秒杀系统终极优化:如何支撑100万QPS》会详细拆解,到时候还会分析Redis集群、Sentinel的高可用配置,今天先留个念想。


今天咱们从三个大坑入手,讲了数据库超卖、缓存雪崩和流量削峰,代码都是生产验证过的。说实话,秒杀架构远不止这些,还涉及动静分离、CDN预热、网关限流编排等一堆细节。

后面咱们还会深入Spring Cloud Gateway + Sentinel的实际落地,把微服务玩得明明白白。如果你觉得今天的内容对你有用,别光收藏,点个赞让更多人看到。想系统学Spring Boot 3.x企业级实战,从零到拿到高薪offer,关注这个专栏,我陪你30天走完全程。

下篇预告:《消息队列在订单系统的神操作,事务消息带你飞》—— 解决分布式事务的一致性难题,你一定不想错过。

内容概要:本文围绕基于风光储能和需求响应的微电网日前经济调度问题展开研究,提出了一种综合考虑风能与光伏发电不确定性、储能系统充放电特性及需求响应机制的优化调度模型,并提供了完整的Python代码实现。该模型旨在通过优化算法实现微电网系统运行成本最小化与能源利用效率最大化的双重目标,涵盖从数据预处理、约束条件建模到目标函数构建与求解的全过程,体现了电力系统智能管理中对可再生能源高效集成与灵活调控的核心需求。研究属于现代智能电网与综合能源系统优化领域的关键应用之一,强调了数据驱动与优化算法在提升系统经济性与可靠性方面的重要作用。; 适合人群:具备一定Python编程基础和电力系统基础知识,从事新能源、微电网调度、能源优化及相关领域的科研人员、研究生及工程技术人员。; 使用场景及目标:①学习微电网日前经济调度问题的建模方法与关键技术环节;②掌握如何将风光出力预测、储能动态行为与需求侧响应策略有机整合进统一的优化框架中;③通过提供的Python代码进行仿真复现实验,完成调度结果分析与算法性能评估,为进一步开展多目标优化、鲁棒调度或实调度研究奠定基础。; 阅读建议:此资源以理论建模与代码实现相结合为核心,建议读者在理解调度模型数学原理的基础上,深入阅读并调试配套Python代码,关注变量定义、约束表达与求解器调用等关键实现细节,从而实现从理论认知到实践应用的有效转化。
内容概要:本文围绕“基于超局部模型与自抗扰ESO观测器的无模型预测电流控制改进策略”展开研究,提出一种结合超局部模型(ULM)与扩张状态观测器(ESO)的无模型预测电流控制(MFPCC)改进方法,旨在提升永磁同步电机(PMSM)电流环的动态响应性能与抗干扰能力。该策略利用超局部模型对系统行为进行局部逼近,避免依赖精确数学模型,同引入自抗扰控制中的ESO实观测并补偿系统内外部扰动,有效抑制参数摄动、负载变化及模型不确定性带来的影响。研究通过Simulink搭建完整的控制系统仿真模型,对传统MFPCC与所提改进策略进行对比分析,验证了新方法在电流跟踪精度、响应速度和鲁棒性方面的优越性。; 适合人群:具备电机控制、现代控制理论及Simulink仿真基础的电气工程、自动化及相关专业的研究生、科研人员及工程技术人员。; 使用场景及目标:①用于高性能电机驱动系统中电流环控制器的设计与优化;②为无模型控制与自抗扰控制的融合应用提供技术参考;③支撑相关课题的仿真验证、论文复现与创新方法研究。; 阅读建议:建议读者结合Simulink仿真模型深入理解控制结构与参数整定过程,重点关注ESO的观测性能与扰动补偿机制,并可通过改变负载条件、参数偏差等工况进行鲁棒性测试,进一步掌握该改进策略的核心优势与适用边界。
内容概要:本文提出了一种基于神经网络的数据驱动迭代学习控制(ILC)算法,专门用于解决具有未知动态模型和重复任务特征的非线性单输入单输出(SISO)离散间系统在无人车路径跟踪中的应用问题,并通过Matlab代码实现了算法的仿真验证。该方法充分利用神经网络强大的非线性逼近能力和自适应学习特性,结合迭代学习控制在周期性任务中逐步优化控制输入的优势,即使在缺乏精确系统数学模型的前提下,也能有效提升无人车在复杂环境下的路径跟踪精度与系统稳定性。算法的核心在于通过多次运行过程中不断修正控制律,实现对期望轨迹的渐近跟踪。; 适合人群:具备一定现代控制理论基础知识、熟悉迭代学习控制基本概念,并拥有Matlab编程与仿真实践经验的研究生、科研人员及自动化、机器人领域的相关工程师。; 使用场景及目标:① 解决无人车在模型未知或难以精确建模的复杂动态环境中的高精度路径跟踪控制问题;② 为一类具有重复运行特性的非线性系统提供一种不依赖精确模型的先进控制策略;③ 推动数据驱动与人工智能方法在自动化控制领域的工程应用与学术研究发展。; 阅读建议:读者应重点理解神经网络在控制律中的设计与集成方式、迭代学习机制的具体实现流程,以及两者融合的创新点。务必结合所提供的Matlab代码进行详细的阅读、调试与仿真分析,通过改变参数和工况来观察控制效果,以深化对算法内在机理和性能特点的掌握。
内容概要:本文提出了一种基于VMD-CNN-LSTM的风电功率预测模型,旨在提升高比例可再生能源背景下风电功率预测的准确性与稳定性。该模型首先采用变分模态分解(VMD)对原始非平稳风电功率序列进行自适应分解,生成若干具有较好平稳性的子序列,以有效降低数据复杂性和噪声干扰;随后,利用卷积神经网络(CNN)从各子序列中提取局部空特征,充分挖掘输入变量间的空间相关性;最后,将提取后的特征输入长短期记忆网络(LSTM),通过其强大的序列建模能力捕捉间维度上的长期依赖关系,实现对未来风电功率的单步精确预测。该方法融合了信号分解、深度学习与多变量输入优势,显著提高了预测精度。; 适合人群:具备一定机器学习与深度学习理论基础,从事新能源发电预测、电力系统调度、间序列分析等相关领域研究的科研人员及工程技术人员;熟悉MATLAB编程环境,希望复现或改进先进混合预测模型的研究者。; 使用场景及目标:①应用于实际风电场的短期功率预测,为电网调度、电力市场交易与能源管理提供可靠数据支撑;②作为学术研究参考,探索VMD与深度学习架构融合在非平稳间序列预测中的有效性;③通过引入风速、温度、湿度等多变量输入,增强模型对复杂气象因素的响应能力,满足现代智能电网对精细化预测的需求。; 阅读建议:建议读者结合所提供的MATLAB代码进行实践操作,重点关注VMD参数选择、CNN特征提取结构设计及LSTM序建模过程;可在不同地区、不同季节的风电数据上开展模型迁移与超参数调优实验,以检验其泛化性能;同鼓励在此基础上引入注意力机制(Attention)、优化算法(如PSO、WOA)进行参数寻优,或与其他分解技术(如EEMD、ICEEMDAN)对比分析,进一步提升模型预测精度与鲁棒性。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值