数据类型的软件工具,最需要的是用户的信任感。让用户能够直观、准确地“看见”理解数据是如何在该系统里被处理的,有助于提升用户的信任感。 以 BI 系统为例,当我们在 BI 上定义了一个指标时。刚刚使用这个指标的业务方是时刻准备着“挑战”我们的计算结果的。完全可以理解。实际上,作为数据开发,我也比较欢迎业务方以非敌意的方式挑战我们的计算结果。科学并不是被突然地建立起来的,而是在一次次的辩驳中以最高程度的对现实的解释能力建立起来的,数据系统的科学性如果也能如此建立起来,是极好的。 但是,一次次地挑战,建立起来的信任,还是比不上“真诚”。极端的真诚就是完全的透明。如果业务人员,可以看到我们在数据系统里加工的过程和结果,而且是他们可以理解的方式展示出来的,那么他们可以极快地判断、接受我们的计算结果,从而和我们一起发现导致问题的其他原因。 我简单总结了一下,有几种可见性。并不完全。以备后续使用。 (1)数据可见 - 数据本身可见。即可以按最明细原始的方式查看数据。这也是后面计算逻辑可见的基础。 - 数据的基础性质可见。比如常用的数据分布、异常值、metadata 等。 (2)计算逻辑可见 如果我们定义了指标、标签。那么涉及到他们计算结果的每一个中间步骤需要对外披露,方便我们检查计算逻辑是否符合要求。 (3)计算过程可见 因数据系统的计算不像 excel 那样可以在一个 excel 文件里查看,所以所有在上下游发生的计算也需要可见。 (4)计算结果可见 当然,中间的和最后的计算结果需要可见。如果有明细的计算结果,那么也需要可见。比如利润率指标是最后的计算结果,每一单的利润是明细的中间的计算结果。数据权限的问题,另外考虑。先考虑一般原则上的最通用的问题。 以上