在T-PROGS中提供了五种方法方便我们构建马尔科夫链的转移概率矩阵，这五种方法各自适用于不同的情况，并且在操作上有着比较大的区别，现在通过对T-PROGS操作手册的翻译来大致介绍一下每一种方法的情况。测试

T-PROGS中各种方法的具体描述

转移率方法

所谓转移率就是计算连续转移概率矩阵的方程所提到的转移率矩阵$R_\phi$的输入元素。转移率可以被解释为转移概率在滞后距离为零时的斜率。因此，一个建立转移率矩阵的方法需要估计转移概率数据的斜率：$\frac{\partial t_{jk}(h \rightarrow 0)}{\partial h_\phi}$ ，对于一个四分类的例子来说（debris flow, floodplain, levee, channel）转移率矩阵可以被建立为:

$\mathbf{R}_{z}=\left[\begin{array}{cccc} -0.87 & * & 0.10 & 0.066 \\ * & * & * & * \\ 0.030 & * & -1.23 & 0.12 \\ 0.039 & * & 0.79 & -0.82 \end{array}\right] \mathrm{m}^{-1}$

其中非背景分类的部分是可以改变的，但是需要遵守一定的概率原则；含有背景分类的部分不能改变，程序会自动调整以满足前述概率原则。值得注意的是，对角线元素是负数，非对角线元素是非负的（这是和自转移以及协转移相关的，自己转移到自己的概率随着滞后距离的增加必定是减小的，而两个不同分类之间的转移随着滞后距离的增加自然是增加的，而转移率实际上就是转移概率的斜率，自然会满足上面的条件）。

使用某一特定滞后距离转移概率数据的离散滞后距离方法

MCMOD使用特征分析的方法来从特殊滞后距离的转移概率数据中建立转移率矩阵，其中$\Delta h_\phi$将在两者(两种岩性)相关的距离内选取，例如下面这个垂向的转移概率矩阵：

$\mathbf{T}\left(\Delta h_{z}=0.6 \mathrm{~m}\right)=\left[\begin{array}{llll} 0.6182 & 0.2892 & 0.0529 & 0.0397 \\ 0.0325 & 0.8061 & 0.0787 & 0.0826 \\ 0.0192 & 0.3817 & 0.5258 & 0.0727 \\ 0.0168 & 0.0995 & 0.2359 & 0.6478 \end{array}\right]$

通过这个特定距离的转移概率（离散）计算出转移率，再通过转移率计算出连续的转移概率。

内嵌马尔科夫链分析的转移概率方法

内嵌马尔可夫链分析是估计分离的地质单元事件发生在临近的另一个地质单元特定方向上的条件概率（通俗一点说就是某一个方向上，A分类出现在B分类之后的条件概率）。举个例子，对于上述的四分类系统中，内嵌转移概率$\pi_{jk,\phi}$在垂直方向$(z)$上被定义为：

$\pi_{43,\phi} = Pr\{levee \ occurs \ above \ | \ channel\ occurs\ below \}$

因此内嵌转移概率矩阵$\boldsymbol{\Pi}_{z}$可以被构建为：

$\boldsymbol{\Pi}_{z}=\left[\begin{array}{cccc} - & 0.803 & 0.124 & 0.073 \\ 0.176 & - & 0.390 & 0.434 \\ 0.026 & 0.846 & - & 0.128 \\ 0.045 & 0.058 & 0.896 & - \end{array}\right]$

注意，对角线上的自转移被视为无法观测到的，因此，对角线上的输入元素是空着的。从解释的观点来说，(4)式中$\pi_{43,z} >> \pi_{41,z}$以及$\pi_{43,z} >> \pi_{42,z}$意味着levee相对来说趋向于出现在channel的上面。

如果有岩层更进一步的平均长度$\overline{L}_{j,z}$的信息，那么内嵌转移概率（通过频率来估计的）可以通过下式转化为转移率矩阵：

$r_{jk,z} = \frac{\pi_{jk,z}}{\overline{L}_{j,z}}\\ r_{jj,z} = - \frac{1}{\overline{L}_{j,z}}$

因此，开发转移率矩阵的方法步骤是：

根据并置趋势的地质解释或者数据建立内嵌转移概率矩阵；
建立平均长度；
根据(5)式将内嵌转移概率转化为转移率。

注意非对角线元素需要满足:

$\sum^K_{k = 1}\pi_{jk,z} = 1$

如果设定了背景类别，矩阵中包含了背景类别的行列元素就不需要精确规定（可以将它们设置为零），这样根据内嵌转移概率以及平均长度改进后的转移率矩阵$R_z$为：

$\left[\begin{array}{cccc} \bar{L}_{1, z}=1.15 & * & 0.12 & 0.075 \\ * & * & * & * \\ 0.025 & * & \bar{L}_{3, z}=0.82 & 0.10 \\ 0.04 & * & 0.96 & \bar{L}_{4, z}=1.24 \end{array}\right]$

其中第2各分类被设置为背景类别，这就是为什么含有该类别的元素被设定成了任意值，由此建立的马尔科夫链如下图所示：

可以看到，由内嵌转移概率方法对测量转移概率的拟合相对初试模型（最大熵因子法）来说稍稍更好一点。

内嵌马尔科夫链分析的转移频率方法

所谓内嵌转移频率（垂直方向上）被定义为：

$f_{43,z} = Pr\{ levee\ occurs\ above\ {\bf and} \ channel\ occurs\ below\}$

于是内嵌转移频率矩阵$F_z$可以被表示为：

$\mathbf{F}_{z}=\left[\begin{array}{llll} (0.0841) & 0.0677 & 0.0101 & 0.0063 \\ 0.0672 & (0.3468) & 0.1264 & 0.1713 \\ 0.0085 & 0.2971 & (0.3395) & 0.0340 \\ 0.0085 & 0.0000 & 0.2031 & (0.2115) \end{array}\right]$

其中对角线元素（插入的部分）是对应$j$类别嵌入事件的边缘频率$f_{j,z}$的行列之和：

$f_{j,z} = \sum^K_{k \not= j}f_{jk,z} = \sum^K_{j \not= k}f_{kj,z}$

再加上平均长度$\overline{L}_{j,z}$的信息，转移频率可以转化为转移率通过：

$r_{jk,z} = \frac{f_{jk,z}}{f_{j,z} \overline{L}_{j,z}} \quad \forall k \neq j$

类似内嵌转移概率，MCMOD同样可以由转移频率构建出转移率矩阵的非对角线部分的元素：

$\left[\begin{array}{cccc} \bar{L}_{1, z}=1.15 & * & 0.0101 & 0.0063 \\ * & \bar{L}_{1, z}=2.27 . & * & * \\ 0.0085 & * & \bar{L}_{3, z}=0.82 & 0.0340 \\ 0.0085 & * & 0.2031 & \bar{L}_{4, z}=1.24 \end{array}\right]$

尽管非对角线元素并不需要额外的设定，但是这个方法需要背景类别的平均长度，因为边缘频率依赖于各个类别的比例以及平均长度。

“独立性”或者“最大熵因子（无序）”转移频率方法

地质系统的并置趋势反映了地层序列的有序或者无序的程度，地层之间转移频率$f_{jk,\phi}$（某一种地层紧挨着其他地层的概率）的熵因子$S_{\phi}$可以量化某一特殊方向$\phi$上的并置趋势的无序性，其中熵因子定义（参考“熵分析方法”）为：

$S_{\phi} = - \sum_j \sum_k f_{jk,\phi} \ln{f_{jk,\phi}}$

考虑一个问题，“最大程度无序的系统来说，地层应该是什么样的呢？”。从我们所参考的状态来说，其中一个答案可能是能够判断出观察到的地层序列显示非随机的并置趋势或者说是一定程度上的有序。

在应用内嵌马尔科夫链分析时，地质学家将兴趣放在量化他们对用地质相连续性的解释上，尤其是在垂直方向上。四种类别岩性连续性的“随机”或者独立的转移频率为：

$\left[\begin{array}{llll} f_{1} f_{1} & f_{1} f_{2} & f_{1} f_{3} & f_{1} f_{4} \\ f_{2} f_{1} & f_{2} f_{2} & f_{2} f_{3} & f_{1} f_{4} \\ f_{3} f_{1} & f_{3} f_{2} & f_{3} f_{3} & f_{3} f_{4} \\ f_{4} f_{1} & f_{4} f_{2} & f_{4} f_{3} & f_{4} f_{4} \end{array}\right]$

其中$f_i$代表连续出现$i$类别的“边缘”频率，但在实际操作中这个问题并不简单。通常来说，自转移的情况是无法观察到的（尤其是对于钻孔数据来说），所以不仅仅是对角线上的转移频率，就连边缘频率也是没有办法直接估计的。而非对角线上的转移_计数_是可以被精确估计的，因为协转移（不同类别之间的转移）是可以观察到的。

假设自转移观察不到，一个更加实际的问题就被暴露出来了。于是，取而代之的是，非对角转移频率$\eta_{jk}$的观测值，被定义为转移计数除以所有非对角转移计数的总和：

$\left[\begin{array}{llll} - & \eta_{12} & \eta_{13} & \eta_{14} \\ \eta_{21} & - & \eta_{23} & \eta_{24} \\ \eta_{31} & \eta_{32} & - & \eta_{34} \\ \eta_{41} & \eta_{42} & \eta_{43} & - \end{array}\right]$

其中，自转移无法观察到，所以留为空白。

独立转移频率的目标是找到满足以下条件的$f_i$：

$\frac{1}{T} \sum^K_{j \neq i} f_i f_j = \sum_{j \neq i}^K \eta_{ij} \quad \forall i = 1,...,K\\ T = \sum^K_{i = 1}\sum^K_{i \neq j} f_i f_j$

上式的非线性系统可以通过IPF（iterative proportion fitting)方法解决。生成的独立模型将显示嵌入事件$\eta_i$的相同边缘频率：

$\eta_{i}=\sum_{j \neq i}^{K} \eta_{i j} \quad \forall i=1, \ldots, K$

以上，与$f_i$对应的非对角线转移频率将会是独立的。通过将$\eta_i$与比例$p_i$除以平均长度$\bar{L}_i$成比例，可以将连续滞后马尔可夫链模型与该独立性模型联系起来：

$\frac{p_{i}}{L_{i}} \propto \eta_{i} \quad \forall i=1, \ldots, K$

因此，给定比例和平均长度的设定，就可以得到一个包含独立转移频率的连续滞后马尔科夫链。

因此一个特殊的问题出现了，“对于给定的比例和平均长度，什么是使得熵最大的转移频率矩阵呢？”巧合的是统计独立性的概念正好与最大熵的结果是一致的。在先前的例子中，比例和平均长度对应的独立或者最大熵转移频率矩阵$F_z^{(S\ max)}$为

$\mathbf{F}_{z}^{(S \max )}=\left[\begin{array}{cccc} (0.0841) & 0.0377 & 0.0311 & 0.0152 \\ 0.0377 & (0.3671) & 0.2196 & 0.1075 \\ 0.0311 & 0.2196 & (0.3396) & 0.0888 \\ 0.0152 & 0.1075 & 0.0888 & (0.2115) \end{array}\right]$

其中对角线元素代表某一行或者某一列的边缘频率的总和。这个矩阵可以用来作为解释在相同比例和平均长度的情况下与最大无序程度的地层连续性相关的并置趋势的基础。例如，如果观测到的转移频率$f_{43,z}$比$f_{z}^{(S\ max)}$更大，一个可能的推断是此处_levee_出现在_channel_的上方是具有统计趋势的.

综上所述，开发转移率矩阵有以下的步骤：

建立各类别的比例和平均长度；
计算最大熵因子转移频率矩阵$F_{z}^{(S\ max)}$以及相应的转移率；
解释相对于最大熵因子转移率的非对角转移率。

举个例子里说，根据（11），最大熵因子转化率$r_{jk,z}^{(S\ max)}$可以通过下式计算：

$r_{j k, z}^{(S \max )}=\frac{f_{j k, z}^{(S \max )}}{\bar{L}_{j, z} \sum_{k \neq j} f_{j k, z}^{(S \max )}}$

最大熵转移率对应的垂向转移率矩阵表示为：

$\mathbf{R}_{z}^{(S \max )}=\left[\begin{array}{llll} \frac{-1}{\bar{L}_{1, z}=1.15 \mathrm{~m}} & 1.80 r_{12, z}^{(S \max )} & 0.32 r_{13, z}^{(S \max )} & 0.41 r_{14, z}^{(S \max )} \\ 1.78 r_{21, z}^{(S \text { max })} & \frac{-1}{\bar{L}_{2, z}=2.27 \mathrm{~m}} & 0.58 r_{23, z}^{(S \max )} & 1.59 r_{24, z}^{(S \max )} \\ 0.27 r_{31, z}^{(S \max )} & 1.35 r_{32, z}^{(S \max )} & \frac{-1}{\bar{L}_{3, z}=0.82 \mathrm{~m}} & 0.45 r_{34, z}^{(S \max )} \\ 0.56 r_{41, z}^{(S \max )} & 0.00 r_{42, z}^{(S \max )} & 2.29 r_{43, z}^{(S \max )} & \frac{-1}{\bar{L}_{4, z}=1.24 \mathrm{~m}} \end{array}\right]$

这样计算出来的非对角线上的元素通过系数乘以$r_{jk,z}^{(S\ max)}$得到，如果比1小则表示两个类别具有并置趋势（在某个方向上某一分类通常紧挨着另一分类出现）小于1时则不具有并置趋势。

最大熵的概念在解释已存在的马尔科夫链模型的并置趋势时是非常有用的。举个例子，你可以通过比例和平均长度建立一个已存在的模型，比如说（11），然后生成一个马尔科夫链，它有着最大程度的无序的并置趋势。再与转移概率方法进行比较，从而解释地层是否展现出了一定程度的有序并置趋势。在这过程中必须要给定全部类别的平均长度，包括背景类别。