2011年07月29日 05:11 来源:21世纪经济报道
鲍勇剑
截止到7月28日,上海铁路局对于“7·23”动车事故原因的最新通报,是由于温州南站信号设备在设计上存在严重缺陷,遭雷击发生故障后,导致本应显示为红灯的区间信号机错误显示为绿灯。
在2008年的夏天,我写过一篇文章,题为《等待下一次事故》,那一年的1月23日,18名中铁十六局的员工被撞死;4月28日,胶济线发生脱轨、撞车。这是2007年4月18日中国铁路第六次大提速之后,济南铁路局发生的两次重大事故。
当时,仔细阅读几次事故的新闻报道后,可以推论铁路方面正等待着下一次的事故。因为造成事故的原因仍然被当作解决问题的方案。胶济线事故已然反映的是铁路部门组织机制的失败。由这个失败的机制执行安全大检查不会产生实质的学习效果。这套自我安慰的仪式在已经发生的和将来注定的事故之间正被反复回收使用。
一语成谶。在浙江温州“7·23”甬温线特别重大铁路交通事故发生之前,由雷电造成的列车运行系统的短路现象,已经发生过好几次。但铁路系统的工程师认为“这在我们的纠错范围内”,可以继续运行。不久之后的7月23日,一次死伤人数达到两百余人的事故在又一个雷雨之夜,发生了。
以中国庞大的铁路网以及承载的客货流量而言, 系统出现意外的失误是无可避免的。人为的策略规划永远无法涵盖所有的系统变量。任何技术设计都一定有难以解释的偶然偏差。“人定胜天”可以做精神鼓励的口号,但不能当作管理复杂系统的控制目标。
复杂系统的危机管理
对于复杂系统的意外事故,它的三大策略目标是:隔离发生事故的区域;降低破坏性;迅速恢复正常运营。与其它复杂系统相比,铁路运营具有特定的管理优势:(1)它在一个自成体系的环状封闭结构中运营,比开放的系统容易控制;(2)它的组织任务循环往复,容易标准化、规范化、格式化、文件化;(3)它有半军事化的组织结构,容易严申纪律和法规;(4)它有丰富的经济资源,容易调动人的积极性;(5)它有百年的历史,沉淀了足够的事故记忆。这些优势足以帮助铁路部门建立正常的事故防范能力。
和医院、发电厂、航空公司一样,铁路属于“高度责任”的组织。社会与政府政策也鼓励它们优先投资建设应该有的危机防范能力。因此,不论是胶济线的事故还是甬温线的撞车都反映了深度薄弱的专业防范能力,表现了整个组织机制的失败。机制没有再造,事故不会自己跑掉。
在胶济铁路事故发生后,我曾对这个组织机制的失败表现做过如下分下:第一,它没有及时将成熟的通讯技术结合到自动化的内部沟通设计之中。以一位普通中国公民为例,他可以把一个同样的拜年段子在24小时内通过手机传遍大江南北。像更改火车速度这样的重要信号却仍然要通过书面文件下达到各专业操作员手中。今天,每位消费者在中国任何地方刷信用卡后,他的发卡银行就能在3分钟之内进行短信自动确认。铁路部门的调度与司机之间关于限速通知的确认仍无法有这样的技术保障。他们缺少的不是技术,而是应用技术的组织能力。
第二,它缺乏应有的系统能力和知识管理能力。铁路包括了人、机器、网络、后勤、运营环境等子系统。与一般的企业生产相比,铁路部门子系统多,交叉互动强,具有连锁反应的关系,同步协调的要求高。天生要求系统思维,系统配合。同时,它的技术稳定、组织程序稳定、专业任务的重复性强又为知识管理创造了天生的好条件。结合上述的优势,它有足够的时间、场合、资源对组织技术除错,精细化。可是我们没有观察到它对系统设计和协调的重视。第六次大提速强调最多的是“动车组”这个机器子系统。关于人的子系统的配套设计往往被忽视了。例如,1月23日,中铁十六局的员工忽视“动车组”的速度, 提前进入施工现场。(如果是农民工,问题更严重)。这些系统科学方面的盲点不是普通员工的过失。它反映了组织机制的失败。出事的乘务员只是在不幸的时间,不幸的路段成为组织无能的不幸表现者。他们应该是最需要被抚恤的对象。
第三,它丧失了应有的安全文化。专业人员指出,火车有自动的超速警告设计。但出事的列车却超速51公里/小时。 警告设计可能失灵,可能被关闭,可能没有安装。无论是哪一样的情形,反映了同样的问题:薄弱的安全文化。
一位医院院长曾经用一张多孔的瑞士乳酪说明“高度责任”组织的安全文化模式。光线往往无法穿透一叠多孔的瑞士乳酪,除非每一片乳酪上的孔串联在一起。在安全管理领域,奶酪上的洞代表着每一个作业环节可能产生的失误或技术上存在的“短板”。复杂系统可能出现各种安全事故,它本质如此。
“高度责任”组织危机管理有两大法宝:多重安全设计,降低危机穿过每一个事故孔的可能性;以强烈的安全文化来保障每个执行者都尽心尽力地完成自己的堵漏工作。在胶济线撞车前,调度员没收到正确的通知,乘务员没确认改变的限速,值班员没尽职了望。这些所有大开的孔显示的不再是单个员工的责任,而是溃散的组织机制,沦丧的安全文化。
组织机制为实施策略目标进行沟通、控制、协调。上述的推断分析说明,现有的组织机制丧失了应有的沟通、控制和协调的能力。从现在开始,铁道部门正上演着经典的“亡羊补牢”安全大检查。如果由这样的机制重复失败的程序,只是挑战我们等待下一次事故的耐心。
我们要做的是不断去提高每一个子系统抗脆弱性的能力,降低它发生危机的概率,如何在发生危机之后降低它所造成的影响。我们永远不可能预想把所有的危机都消除掉,但是到今天为止,管理者的认识系统还不够清晰。
学错,在追尾之后
如何“学错”
在甬温线事故发生后,铁道部用“常态管理”的思维去要求尽快恢复通车。危机不是事件,是事变,事前、事中和事后,每一个阶段都有各自的特点,不能用时间的观点去看待危机。第一个阶段最重要的就在于保护人员生命和设施的危机,尽可能提高他们的存活率,尽可能去救助他们。危机的首要目标不是强调如何提高效率,节省成本,而是关注如何生存下去。这是事变,不是事件。只有将其当作是事件的人,才会掐着秒表说:到时间了,给你24小时修复,你得通车了。
那么,在危机事前,我们如何去防范它呢?假设环境一直是稳定的,我们只需要有一种能力,学习学习再学习。去学习过去发生的事件,找出最佳标准,然后标准化、重复化。在稳定的条件下,我们认为过去会在未来重复,所以只要学习过去就可以了,这就是“学对”。
但当环境稳定的前提条件不复存在,只有一种方法可以不断地提高我们防范危机的能力,那就是学错。
我们整个知识系统都是建立在学对的基础上,是建立在采样的基础上:1块巧克力、2块巧克力、3块巧克力……我们通过30块巧克力来进行回归分析,我们发现巧克力的重量和质量平均分布是在某处,知识就总结出来了。既有的常态管理的知识都是建立在中值或者平均值的基础上,是中值或者平均值的逻辑。但是在发生危机的时候,所有的信号都是在偏差中出现的,所以,危机管理的重要目的是消除偏差。
如果只具备了学对的能力,那是平均值学习的能力,不是学错的能力。学错的方式方法和学对的方式方法是不一样的,它不是关于归纳演绎的过程。铁道部的这次事故反映了组织中很麻烦的事情,董事长的文化。董事长变成了组织,组织就是为董事长服务的,如果有类似的组织形态,我们也可以想象说它一定会发生危机。
我们长期以来习惯性地“学对”,是因为过去没有好好地研究如何“学错”,也没有人好好地系统总结经验,尽管我们每个人都在或多或少地学错。这就对我们管理学者提出了要求,如何在动荡的环境下面对“变态的”现象提供学错的工具。
(本文由本报记者王晶、黄锴、李海强采访整理)
分享到: |