最近发生了一起线上事故,导致团队半夜 3 点就赶到公司搞了一天。觉得还是需要复盘一下。这次不是技术故障,更多是因为产品设计而导致。商家因此损失接近 100 万。

事故原因是一位商家对优惠券的理解有出入,出入点主要是:

  • 商家的理解是:消费者下单后,才能用这张消费券;
  • 产品逻辑是:产品本身的场景,确实是引导消费者下单后,才能用这张消费券。但是由于这个优惠券不支持判断消费者 ID 和订单信息,技术上没办法实现。所以产品上只做了文案提醒商家。

最终的结果就是被羊毛党注意到,2 小时传播了 10000 多张。商家损失惨重。最后复盘内容,有几点想法,这里分享下。

  1. 文案上。不要用文案取代产品流程;重要提醒要产品化,避免加大加粗加红粗暴提醒文案;
  2. 如果关键点(比如:接口支持、技术实现)和核心流程有冲突,产品方案的设计,一定要考虑极端情况。特别是交易类产品;
  3. 如果项目涉及多个部门,最好在上线后,开一个同步会。事无巨细,同步清楚。出问题能找到责任人。

最后这个事故,解决方案是:

  1. 临时方案先将文案产品化,提醒内容需要用户确认;
  2. 开始核对关键接口,如果长期技术实现不了,考虑下掉该功能。