关于疾病的第一个观点就是疾病不是邪恶的外来的物质,如邪气等等的描述,我认为这是一种比较宏观的抽象描述,但已经跟不上时代的发展步伐了。疾病是一种与健康状态共存的等价状态,作为网络的不同序列,其只有概率的不同,没有本质上的区别。这里的假设就是基于网络这个高维结构,我们首先降维表达为一定的概率矩阵,不同的概率具有一定的比例,然后再降维具体表达为特定的整体的排列组合,即序列,可以与人体的各种状态构建高相关性的联系。
这种序列理论上能够与各种疾病的各种症状构建一定的映射关系,也就是说,我们希望能够构建一定的序列来解释各种复杂疾病的可能症状,然后在这个基础上开发可能的疗法。我们不仅仅是收集大规模的数据并且进行一定的聚类分析来限定一个边界来定义特定的疾病,还需要知道这是一个概率性的表达过程,即有特定的序列可能在宏观的基团层次表达出特定的症状也是有一定的概率分布的,我们只是能够做出统计层次的推断,虽然我们的目标是把这种群体层次的同一时间截面的推测转换为个体层次的所有时间的推断,但这种路径的坍缩具有极大的随机性,即可能有混沌效应出现,我们要遍历所有的路径也未必能够做出准确的度量,如同天气预报。
而这种数学结构序列,与机体情况的对应是什么,我们能不能找到比较本征的对应?我个人的意见是,我们可以以组织的各种细胞的分布符合来构建一定的对应关系,这是相对于机体的宏观层次(如水肿、斑块、肿瘤等等症状)的一种降维处理:特定的细胞增生、凋亡、炎症细胞迁移、细胞外基质的各种胶原蛋白等等的表达。这些变化我们可以在病理切片上观察,我们只是把这些统计的特征提取出来,构建一定的高维结构概率矩阵(统计能够提取出高维结构,从而能够以更高的视角来理解低维层次的变化。而且我认为医生的学习过程也是在构建这种高维结构,从而能够对现实的各种情况进行快速的模式识别。因此统计得出的比例很重要,能够作为贝叶斯推断的前验概率快速将所有疾病的遍历收敛为有限路径的查找)。而且这种模式识别是多层次的,我们不仅仅可以在细胞层次寻找各种模式,我们还可以在基因蛋白表达层次寻找其模式。这种先降维再升维的方法可以使得我们找到最后的疾病层次的不动点。
而且我们注意到,细胞之间的关系也存在一定的收敛,即各种细胞的比例不可能无限地改变,这什么其存在一定的机制使得细胞的组合不能指数级爆炸,这可能使得我们的算法不再需要解决np难的无限组合问题。这种机制,结合博弈论,我们认为是细胞之间,乃至细胞组合形成的团体之间的竞争博弈达成的均衡。如何以算法表示?我目前由于知识储备不足,只能大致处理为一定的矩阵关系来彼此限制,即不同对象之间的比例只能维持在一定范围之内。也就是对概率矩阵的状态比例在特定的部位进行一定的微调,接下来的问题是在哪里调多少,这就只能依靠统计了。
因此,数据的收集是我们进行各种统计分析模式识别的基础。医生可以通过学习来进行这种数据收集,而我们需要更底层的数据,因为计算机还没有智能到理解自然语言,我们需要翻译为计算机能够理解的语言即各种量化的数据。因此我们需要良好的定义和数据结构来存储这些数据,并且以一定的运算结构来整理,我们的一贯想法是构建不同序列之间的概率性联系,可以表示为一定的自定义函数。
然后就是基于这些底层数据的往上遍历,根据不同层次的靶定点选择特定的路径坍缩,从而能够以更大的精度拟合具体情况,如各种细胞的相对比例、不同基因蛋白的表达的相对比例等等对应于各种疾病的症状:脱皮、丘疹、水疱、炎症反应等等。然后我们就可以在这个层次进行一定的处理,即寻找各种可能的疗法,这也是未来的个体化的精准医疗的发展方向。我们要找到的是多特的模式的封闭/激活补丁,从而能够在整体层次起到一定的作用,宏观的表示就是状态平衡往偏移疾病状态倾向健康状态的移动。比较具体的表示是对各种对象的特定处理,如各种受体的拮抗剂/激动剂能够起到比较有效的作用,如质子泵抑制剂和h2受体拮抗剂对消化性溃疡能够起到比较好的作用,这启示我们可以寻求对有限的不动点施加处理产生比较好的效应,然后再不断优化,这也是一种动态规划的局部最优对整体最优的逼近。毕竟如果一开始就寻求完美的匹配,即使我们能够找到最好的处理序列,但具体的药物可能还没有,也就不能施加作用产生影响。这是一种层次的嵌套,我们能够通过寻找不动点的不动点,即通过层次的遍历来找到我们现实层次能够施加影响的各种措施,如手术、药物、各种替代疗法来对这些序列进行一定的影响。如我们要对abcdefgn这条序列(相对于疾病的不动点)进行影响,但是其可能存在一定的作用组合,即我们可以对dfgi(相对于序列的不动点)进行处理就起到相似的作用,而后者的实现更加现实,毕竟变量减少很多。我们举一个例子作为佐证:假设存在一种疾病(太多了,随便一翻全都是),这是一种高维结构,然后我们可以进行一定的分解降维,即把