数据分析的四件事情


上期我们讲到了数据分析师是一个火爆的职业(数据分析师,一个复合型职业),本期就来谈谈数据分析要做些什么?数据分析(Data Analysis)的内涵定义非常简单:是用于将原始数据转化为可行的见解(Opinion),它包括一系列工具、技术和过程,用于利用数据来发现趋势并解决问题。概括地说,数据分析要完成以下四件事情的准确描述、分析、预判和指导的完整过程:发生了什么?为什么会发生?可能会发生什么?该做什么?

01 发生了什么?

通常称之为描述性的数据分析(Descriptive analysis),目的是了解数据环境中已发生的事情或正在发生的事情。技术特征包括数据的可视化,例如饼图、条形图、折线图、表格或生成的叙述。评价标准在描述性分析中起到非常重要作用,好与坏、对和错、优和良等都首先需要大家先能够达成共识,才能描述清楚问题。

比如,医院的医保DRG/DIP支付亏损是好是坏就需要临床达成共识:在低风险病种上的亏损是“坏事”,但在高风险病种上的亏损可能却是“好事”,因为医疗技术难度获得了提升。

02 为什么会发生?

也叫诊断性的数据分析(Diagnostic analysis),目的是通过一种深入或详细的数据分析流程,找到某些情况发生的根本原因。它的特征是技术,比如数据下钻分析、数据挖掘以及关联性分析等。在每种技术中,都使用多个数据操作和转换来分析原始数据。诊断性分析又分“从上至下”和“从下至上”的两种分析路径:

  • 从上至下是一种由面到点的逐层下钻式的分析方法,这是我们在日常工作中十分常用的方法。比如我们常常从医院、科室深入到医疗组和医生的分析模式,从学科到病种、诊断和手术、乃至个案病例的抽丝剥茧的分析思路。
  • 从下至上则是由点反推出面上的问题,这个面指的是系统性问题。但要注意的是,由于某个问题产生的关联性因素太多,如果仅凭直觉去采用这种方法做出的判断容易导致盲人摸象的错误结论,因此,分析必须具有全面性、逻辑关联性和所有诱发因素的完整性。

“从下至上”的分析方法在质量管理中应用得非常广泛,比如航天事故分析就是通过对问题的逆向工程的相关性分析,回溯到工程系统的源头。医院管理中的JCI认证也是采用这种分析方法,通过对日常工作流程中的细微问题(潜在的质量事故)的观察来逆向溯源出某个操作和服务流程是否存在系统性问题。


03 可能会发生什么?

可能一定是对未来的预测,因此也叫预测性的数据分析(Predictive analysis),通过使用历史数据来准确预测未来趋势。技术特征包括机器学习、预测、模式匹配和预测建模。在每一种技术中,计算机均经过训练,能对数据中的因果关系进行逆向工程,从而找到事件发生的诱因,准确判断出事件下一次发生的概率大小,比如我们每天都关注的天气预报。

预测性分析在临床医学中最经典的例子是重症医学中的Apache评分,可以时刻掌握病人的生存概率。在医院管理中,疾病风险调整也是一种对医疗行为和资源管理(药品、耗材、住院天数等)的预测性分析方法。

04 该做什么?

也叫指导性分析(Prescriptive analysis),是将预测数据提升到新水平。它不仅会预测可能会发生的情况,还能为对结果的最佳响应提供建议,同时可以分析不同选择的潜在影响,并推荐最佳行动方案。技术特征包括图形分析、模拟、复杂事件处理、神经网络和建议引擎等。指导性分析是分析方法中的最高境界,它的基石是对业务和数据之间的关联性的深度理解,并从各种可能的结论中博弈出最佳方案。比如公立医院绩效考核中的提升CMI和降低药品耗材费用就是一种决策博弈分析:如何解决既能够让马儿跑得快,又得少吃草的难题?

指导性分析涉及决策博弈,我们尽可能通过各种分析和预测结论获得最佳的行动方案。然而现实中每个方案都可能存在潜在的短板或者风险。我们常常困局于日常工作的思维中,如果能够从更高维度来看决策的博弈,反而可能起到降维打击的效果,这也是一名优秀分析师的价值所在。比如前述的国考例子中,如果从政策制定的历史背景着手(2030健康中国系列政策文件),研究清楚政策制定者眼中的“高质量发展医院”应该是个什么样子之后,回头再来看具体问题,就会发现只有通过医院整体的病种结构、门住院结构和病人转化等的综合性解决方案,才能解决“既、、和又、、”的困局。

数据分析的四个阶段也是四类分析方法,由浅入深,层层递进,终极目的是为决策提供指导性的意见,提高决策的正确性,减少走弯路、甚至走错路的无效成本(图1)。


图1 数据分析的四个类型


了解“医院运营数据分析实战训练营” →V信公众号

举报
评论 0