一次线上项目故障
最近发生了一起线上事故,导致团队半夜 3 点就赶到公司搞了一天。觉得还是需要复盘一下。这次不是技术故障,更多是因为产品设计而导致。商家因此损失接近 100 万。
事故原因是一位商家对优惠券的理解有出入,出入点主要是:
- 商家的理解是:消费者下单后,才能用这张消费券;
- 产品逻辑是:产品本身的场景,确实是引导消费者下单后,才能用这张消费券。但是由于这个优惠券不支持判断消费者 ID 和订单信息,技术上没办法实现。所以产品上只做了文案提醒商家。
最终的结果就是被羊毛党注意到,2 小时传播了 10000 多张。商家损失惨重。最后复盘内容,有几点想法,这里分享下。
- 文案上。不要用文案取代产品流程;重要提醒要产品化,避免加大加粗加红粗暴提醒文案;
- 如果关键点(比如:接口支持、技术实现)和核心流程有冲突,产品方案的设计,一定要考虑极端情况。特别是交易类产品;
- 如果项目涉及多个部门,最好在上线后,开一个同步会。事无巨细,同步清楚。出问题能找到责任人。
最后这个事故,解决方案是:
- 临时方案先将文案产品化,提醒内容需要用户确认;
- 开始核对关键接口,如果长期技术实现不了,考虑下掉该功能。