大家好,我是老三,之前在 如何防止订单重复支付 里和大家聊过掉单导致的重复支付,这篇文章,我们来聊聊,如何防止掉单。

好好的支付,怎么就掉单了?

我听说过下单、买单、脱单……掉单是什么东西?

所谓的掉单,就是用户下单支付,在钱包里完成了支付,结果回到电商APP一看,订单还是未支付……

毫无疑问,用户肯定会炸,结果不是客诉,就是差评。

那么掉单是怎么来的呢?

我们先来看看订单支付的完整流程:

  1. 用户从电商应用点击支付,客户端向服务端发起支付请求
  2. 支付服务会向第三方的支付渠道发起支付,支付渠道会响应对应的url
  3. 以APP为例,客户端通常是会拉起对应的钱包,用户跳到对应的钱包
  4. 用户在钱包里完成支付
  5. 用户完成支付后,跳转回对应的电商APP
  6. 客户端轮询订单服务,获取订单状态
  7. 支付渠道回调支付服务,通知支付结果
  8. 支付服务通知订单服务,更新订单状态

对于支付订单而言,大概可以分为这么几个状态:

  • 未支付:用户在点击支付之后,支付服务请求支付渠道之前,处于未支付状态
  • 支付中:用户发起支付后,到跳转到支付钱包,再到完成支付,支付服务获取到最终支付结果之间,属于支付中状态,这个状态下,可以说是一个迷雾状态,电商系统对于用户的支付是不确定
  • 支付成功/失败/取消/关闭:电商系统最终确定了用户在第三方钱包的支付最终结果

看起来没什么问题啊,怎么就掉单了?简单说,就是支付的状态没有同步到,或者没有及时同步到。

  1. 支付渠道的支付回调

    发生了一些异常,导致支付服务没有收到支付渠道的回调通知

  2. 支付服务通知订单服务

    服务内部出现异常,导致支付状态没有同步到订单服务

  3. 客户端获取订单状态

    客户端通常是轮询获取状态,可能会在轮询时间内没有获取到订单状态,结果用户看到未支付

其中1可以称之为外部掉单,2和3可以称之为内部掉单。

接下来我们看看,怎么预防掉单问题。

怎么防止内部掉单

我们先从系统内部的掉单说起,当然在系统内部,稳定性更容易保证,发生掉单的概率还是比较小的。

服务端防止掉单

支付服务和订单服务之间防止掉单,关键就在于尽可能保证支付通知订单支付结果成功,我们一般通过这两种方式。

  1. 同步调用重试机制

    支付服务调用订单服务的时候,要进行失败重试,防止网络抖动情况下的调用失败。

  2. 异步消息可靠性投递

    同步不稳妥,那就再加一个异步。支付服务投递一个支付成功消息,订单服务消费支付成功消息,整个过程要尽可能保证可靠性,例如订单服务要在完成订单状态更新后再确认完成消息消费。

同步+异步两手策略,基本上可以防范服务端的内部掉单。

至于引入分布式事务(事务消息、Seata)来保证状态一致,我觉得也没有必要。

客户端如何防止掉单

用户支付完成后,跳回电商系统,客户端会轮询一下订单的状态,通常两三秒内,就会得到订单完成支付的结果,这个过程出现问题的概率相比是非常低的。

但是也不排除,很小概率下,客户端轮询一段时间,还没得到结果,那么只能结束轮询,给用户展示未支付。

这种情况,通常问题也是出在服务端,没有及时更新订单的状态,最主要的还是要处理服务端的掉单,保证服务端能及时同步支付订单的状态。

但是一旦服务端的订单状态变更了,也要尽可能同步到客户端,不能让用户一直看到未支付。

客户端和服务端之间,同步状态,无非就是推和拉:

  1. 客户端轮询

    客户端判断用户未支付之后,通常会进行订单倒计时。

    这里再提一下?大家觉得这种倒计时是怎么实现的呢?纯客户端组组件倒计时吗?

    ——肯定不行,通常是客户端组件倒计时,定期向服务端请求,检查倒计时时间。同样的,这种情况下,客户端也可以检查支付状态。

  2. 服务端推送

    说真的,服务端推送,看上去是一种很美好的方案,Web端可以使用Websocket,APP端可以用自定义Push,大家可以看看我有 7种 实现web实时消息推送的方案,7种!。但实际上,推送的成功率经常不那么理想。

怎么防止外部掉单

相比较内部掉单,外部掉单发生的概率就大很多,毕竟和外部渠道的对接,不可控的因素更多。

要防止外部掉单,核心就是四个字:“主动查询”,如果只是等待第三方的回调通知,风险还是比较大的,支付服务要主动向第三方查询支付状态,即使有什么异常,也能及时感知到。

主动查询,主要就是两种形式:

定时任务查询

毫无疑问,最简单的肯定就是定时任务了,支付服务,定时查询一段时间内支付中的支付订单,向第三方渠道查询支付结果,查询到终态之后,就去更新支付订单状态、通知订单服务:

实现也很简单,用xxl-job之类的定时任务框架,定时扫表,向第三方查询就行了,大概代码如下:

    @XxlJob("syncPaymentResult")public ReturnT<String> syncPaymentResult(int hour) {//……//查询一段之间支付中的流水List<PayDO> pendingList = payMapper.getPending(now.minusHours(hour));for (PayDO payDO : pendingList) {//……// 主动去第三方查PaymentStatusResult paymentStatusResult = paymentService.getPaymentStatus(paymentId);// 第三方支付中if (PaymentStatusEnum.PENDING.equals(paymentStatusResult.getPayStatus())) {continue;}//支付完成,获取到终态//……// 1.更新流水payMapper.updatePayDO(payDO);// 2.通知订单服务orderService.notifyOrder(notifyLocalRequestVO);}return ReturnT.SUCCESS;}

定时任务的最大好处肯定是简单了,但是它也有一些问题:

  1. 查询的结果不实时

    定时任务频率的设置永远是个不好确定的事情,间隔短对数据库压力大,间隔长了不实时,很容易出现,上面提到的用户回到APP,结果轮询不到支付成功状态的情况。

    实际上,用户跳转钱包之后,通常会很快完成支付,如果短时间内没有完成支付,那么一般也不会再付了。所以其实,发起支付开始,从第三方查询支付结果的频率应该是递减的。

  2. 对数据库有压力

    定时任务扫表,对数据库肯定是会有压力的,扫表的时候,经常会看到数据库的监控出现一个小突刺,如果数据量大的话,可能影响更大。

    可以单独创建一个支付中流水表,定时任务扫描这张表,获取到支付最终态之后,就删除掉对应的记录。

延时消息查询

定时任务存在一些问题,那么有没有什么其它办法呢?答案是延时消息。

  • 在发起支付之后,发送一个延时消息,前面讲到,用户跳转到钱包,通常很快会支付,所以我们希望查询支付状态这个步骤,符合这个规律,所以希望在10s、30s、1min、1min30s、2min、5min、7min……这种频率去查询支付订单的状态,这里我们可以用一个队列结构实现,队列里存放下一次查询的时间间隔。

    大概代码如下:

            //……//控制查询频率的队列,时间单位为sDeque<Integer> queue = new LinkedList<>();queue.offer(10);queue.offer(30);queue.offer(60);//……//支付订单号PaymentConsultDTO paymentConsultDTO = new PaymentConsultDTO();paymentConsultDTO.setPaymentId(paymentId);paymentConsultDTO.setIntervalQueue(queue);//发送延时消息Message message = new Message();message.setTopic("PAYMENT");message.setKey(paymentId);message.setTag("CONSULT");message.setBody(toJSONString(paymentConsultDTO).getBytes(StandardCharsets.UTF_8));try {//第一个延时消息,延时10slong delayTime = System.currentTimeMillis() + 10 * 1000;// 设置消息需要被投递的时间。message.setStartDeliverTime(delayTime);SendResult sendResult = producer.send(message);//……} catch (Throwable th) {log.error("[sendMessage] error:", th);}
    

    PS:这里用的是RocketMQ云服务器版,支持任意级别的延时消息,开源版的RocketMQ只支持固定级别的延时消息,不得不感概充钱才能变强。有实力的开发团队,可以在开源基础上,进行二次开发。

  • 在消费到延时消息之后,向第三方查询支付订单的状态,如果还在支付中,就继续发送下一个延时消息,延时间隔从队列结构中取。如果获取到最终态,就去更新支付订单状态、通知订单服务。

    @Component
    @Slf4j
    public class ConsultListener implements MessageListener {//消费者注册,监听器注册//……@Overridepublic Action consume(Message message, ConsumeContext context) {// UTF-8解析String body = new String(message.getBody(), StandardCharsets.UTF_8);PaymentConsultDTO paymentConsultDTO= JsonUtil.parseObject(body, new TypeReference<PaymentConsultDTO>() {});if (paymentConsultDTO == null) {return Action.ReconsumeLater;}//获取支付流水PayDO payDO=payMapper.selectById(paymentConsultDTO.getPaymentId());//……//查询支付状态PaymentStatusResult paymentStatusResult=payService.getPaymentStatus(paymentStatusContext);//还在支付中,继续投递一个延时消息if (PaymentStatusEnum.PENDING.equals(paymentStatusResult.getPayStatus())){//发送延时消息Message msg = new Message();message.setTopic("PAYMENT");message.setKey(paymentConsultDTO.getPaymentId());message.setTag("CONSULT");//下一个延时消息的频率Long delaySeconds=paymentConsultDTO.getIntervalQueue().poll();        message.setBody(toJSONString(paymentConsultDTO).getBytes(StandardCharsets.UTF_8));try {Long delayTime = System.currentTimeMillis() + delaySeconds * 1000;// 设置消息需要被投递的时间。message.setStartDeliverTime(delayTime);SendResult sendResult = producer.send(message);//……} catch (Throwable th) {log.error("[sendMessage] error:", th);}return Action.CommitMessage;}//获取到最终态//更新支付订单状态//…… //通知订单服务//……return Action.CommitMessage;}
    }
    

    延时消息的方案相对于定时轮询方案来讲:

    • 时效性更好
    • 无需扫表,对数据库压力较小

    不过大家也看到,我这里的实现是利用的是充钱版的RocketMQ,所以看起来不太复杂,但是如果用开源方案,那就没那么简单。

结语

这篇文章介绍了一个让用户炸毛,让客服恼火,让开发挠头的问题——掉单,包括为什么会掉单,怎么防止掉单。

其中内部掉单,发生的概率相对较少,掉单最主要的原因还是所谓的外部掉单。

外部掉单解决的关键点是主动查询,有两种常用的方案:定时任务查询延时消息查询,前者简单一些,后者功能上更加出色。


参考:

[1]. 支付掉单异常最全解决方案

[2]. 解决支付掉单问题


⭐面渣逆袭系列:

  • 面渣逆袭:Java基础五十三问
  • 面渣逆袭:Java集合连环三十问
  • 面渣逆袭:JVM经典五十问,这下面试稳了!
  • 面渣逆袭:Java并发六十问
  • 面渣逆袭:Spring三十五问,四万字+五十图详解!
  • 面渣逆袭:二十二图、八千字、二十问,彻底搞定MyBatis!
  • 面渣逆袭:计算机网络六十二问,三万字图文详解!速收藏!
  • 面试字节,被操作系统问挂了
  • 面渣逆袭:RocketMQ二十三问

关注⬇️⬇️⬇️,回复「666」,领取七百多页独家原创的面试手册!

钱扣了,订单却是未支付,用户炸了——聊聊如何防止支付掉单相关推荐

  1. 钱被扣走了,但是订单却未成功!支付掉单异常最全解决方案

    前言 好了,回归到今天的主题,今天分享一下支付系统中异常一些处理方式. 其实这些处理方式并不只是局限于支付系统,也可以适用于其他系统,大家可以借鉴,应用到自己系统中,提高自己系统的健壮性. 异常是系统 ...

  2. 面试官问:用户钱付了,订单还是显示未支付,怎么解决?

    什么是掉单? 所谓的掉单,就是用户下单支付,在钱包里完成了支付,结果回到电商APP一看,订单还是未支付-- 毫无疑问,用户肯定会炸,结果不是投诉,就是差评. 用户感觉受到了欺诈 那么掉单是怎么来的呢? ...

  3. php h5微信支付和app微信支付区别,关于微信公众号支付 微信H5支付和微信APP支付的问题 (PHP)TP+VUE...

    话不多说 直接上源码 在写支付之前一定要确定好微信要求配置的相关回调域名 安全支付域名还有杂七杂八的哪些地址都准备好了 要不然是没法实现的 微信公众平台 微信商户平台 还有开发者平台 什么的 这点比较 ...

  4. 面试官问:生成订单30分钟未支付,则自动取消,该怎么实现?

    欢迎关注方志朋的博客,回复"666"获面试宝典 来源 | https://blog.csdn.net/hjm4702192/article/details/80519010 在开发 ...

  5. 订单30分钟未支付自动取消怎么实现?

    本文已经收录到Github仓库,该仓库包含计算机基础.Java核心知识点.多线程.JVM.常见框架.分布式.微服务.设计模式.架构等核心知识点,欢迎star~ 地址:https://github.co ...

  6. 面试官:生成订单30分钟未支付,则自动取消,该怎么实现?

    Hollis的新书限时折扣中,一本深入讲解Java基础的干货笔记! 目录 了解需求 方案 1:数据库轮询 方案 2:JDK 的延迟队列 方案 3:时间轮算法 方案 4:redis 缓存 方案 5:使用 ...

  7. 实现生成订单30分钟未支付,则自动取消

    目录 了解需求 方案 1:数据库轮询 思路 实现 优点 缺点 方案 2:JDK 的延迟队列 思路 实现 优点 缺点 方案 3:时间轮算法 思路 实现 优点 缺点 方案 4:redis 缓存 思路一 实 ...

  8. 生成订单30分钟未支付,则自动取消,该怎么实现?(典藏版)

    目录 方案分析 (1)数据库轮询 (2)JDK的延迟队列 (3)时间轮算法 (4)redis缓存 (5)使用消息队列 在开发中,往往会遇到一些关于延时任务的需求.例如 生成订单30分钟未支付,则自动取 ...

  9. 秒杀的定时任务开启 、 将秒杀商品存入redis、秒杀商品 下单进入订单队列(未支付)、异步实现下单

    秒杀的定时任务开启 ⼀会⼉我们采⽤Spring的定时任务定时将符合参与秒杀的商品查询出来再存⼊到Redis缓存,所以这⾥需要使⽤到定时任务 这⾥我们了解下spring boot定时任务相关的配置,配置 ...

最新文章

  1. 献给新一代AI后浪们----《后丹》
  2. c++区块链实例_确定技术任务了解区块链限制 开发区块链你该做哪些准备工作?...
  3. 认识flex中的sprite
  4. 五年级用计算机探究规律教案,人教版五年级上册数学《用计算器探索规律》教案...
  5. 鸿蒙系统超级功能,华为再发新版鸿蒙OS系统!新增超级终端功能:可媲美iOS系统...
  6. vue官方eslint插件配置eslint-plugin-vue-libs
  7. 程序员修仙之路--优雅快速的统计千万级别uv
  8. Java 多线程 —— 深入理解 volatile 的原理以及应用
  9. jquery常用技巧及常用方法列表
  10. 微信小程序开发--【初体验】(一)
  11. delphi2007 打开项目时,突然报错,提示microsoft.net borland 报错
  12. 苹果录屏没声音_不会真有人MacBook录屏没声音吧?别用了SoundFlower了!
  13. t6服务器验证密码失败,用友T6软件T6服务无法启动,提示SA密码错误
  14. Espresso环境搭建及其基本使用
  15. 流行计算机病毒和造成的危害,计算机病毒的危害主要造成程序和数据的破坏
  16. 关于α测试与β测试的区别
  17. 服务器文件增量备份,服务器文件增量备份
  18. 微信web开发者工具-移动调试iphone端的调试
  19. Visual Studio帮助文档安装以及设置(内置msdn)
  20. 2022云南省职业院校技能大赛(高职组) Web技术(网站设计与开发)赛项规程

热门文章

  1. 漫步微积分三十三——体积计算:圆盘法
  2. 京东在2018年成为Intel全球最大PC零售渠道
  3. 轻量级实时语义分割:Guided Upsampling Network for Real-Time Semantic Segmentation
  4. Word2Vec报错:KeyError: word 'XXX' not in vocabulary
  5. 微信小程序直播商品与直播房间管理时提示:api unauthorized hints: [mhcddo3Me-lLeTBA!]/r/napi 功能未授权
  6. 利用Tableau绘制各类图表
  7. oracle等待进程为lgwr,足球与oracle系列(3):oracle进程排名,世界杯次回合即将战罢!...
  8. 没有大神的技术社群,我如何做到高达75%的沟通率?
  9. 【四轴飞行器】【电源部分】3.7V到5.0V、3.3V电路设计
  10. CoCube群机器人预览→资讯剧透←