问题

对于慢性病而言,疾病有自身的亚型差异与演进过程。

然而,横断面研究只能捕获某一瞬间某个个体的患病情况。

我们该如何根据许多个横断面,同时推测人群中的个体所患疾病的亚型,以及疾病的演进过程?

SuStaIn

我们定义,如果某种疾病的某些标志物以某一种特定形式演进,那它就构成一种亚型。

对于个体jj,我们可以测量生物标志物ii,得到观测xijx_{ij},我们的数据集可以表示为Xxiji=1,,I,j=1,,JX{x_{ij}|i=1, \cdots, I,j=1, \cdots, J}。如果生物标志物ii提示了异常(或者指示了某个事件),就记作EiE_i

我们想计算在这个群体中事件发生的顺序SS,可以使下面的式子概率最大

P(XS)=j=1J[k=0I(P(k)i=1kP(xijEi)i=k+1IP(xij¬Ei))]P(X|S) = \prod_{j=1}^J\left[\sum_{k=0}^I\left(P(k)\prod_{i=1}^kP\left(x_{ij}|E_i\right)\prod_{i=k+1}^IP(x_{ij}|\neg E_i)\right)\right]

其中kk表示阶段,在阶段kkEk+1EIE_{k+1}\cdots E_{I}还是尚未发生的事件。