第五百零三章 艺术复杂性的计算(概率与统计)
作者:蔡泽禹   数学心最新章节     
    对柯尔莫哥洛夫来说,音乐和文学也非常重要,他相信自己可以从概率的视角去洞察人类心灵的运作方式。他也是一个文化精英主义者,认为艺术的价值是分三六九等的。最顶尖的就是歌德、普希金和托马斯·曼的著作,还有巴赫、维瓦尔第、莫扎特和贝多芬的音乐作品——这些作品的永恒的价值类似于永恒的数学真理。柯尔莫哥洛夫强调,每一件真正的艺术作品都是独一无二的,是所谓“不可能”的事物,是超脱统计规律以外的事物。他在1965年的一篇文章中讽刺地问道,“有没有可能把‘托尔斯泰的《战争与和平》’以一种合理的方式纳入‘所有可能的小说’集合中,并进一步假定这一集合中存在某种特定的概率分布?”

    同时,柯尔莫哥洛夫也渴望能找到解密艺术创作本质的钥匙。1960年,柯尔莫哥洛夫为一组研究人员配备了机电计算器,指派他们计算俄罗斯诗歌的节奏结构。柯尔莫哥洛夫对实际韵律与古典韵律的偏差特别感兴趣。在传统诗学中,抑扬格是由一个非重读音节跟着一个重读音节组成的。但在实际的创作中,这条规则却很少被遵守。普希金的《叶甫盖尼·奥涅金》是俄语中最著名的古典抑扬格诗,全诗的5300行中,几乎有四分之三的诗句违反了抑扬格定义,超过五分之一的音节都非重读音节。柯尔莫哥罗夫认为,重音偏离古典韵律定义的频率为诗人提供了一个客观的“统计画像”。在他看来,一种不太可能出现的重音模式恰好反映了艺术的创造性和表现力。通过对普希金、帕斯捷尔纳克和其他俄国诗人作品的研究,柯尔莫哥洛夫认为,诗人对韵律格式的独特运用,奠定了自己作品的“调性”。

    为了衡量文本的艺术价值,柯尔莫哥洛夫还采用了字母猜测法来估算自然语言的熵(entropy)。在信息论中,熵是对不确定性或不可预测性的度量。对于信息而言,一份信息的不可预测性越大,它所携带的信息量就越多。在柯尔莫哥洛夫眼中,熵成为了一种评价艺术独创性的指标。他的研究小组进行了一系列实验:给志愿者们展示一段俄罗斯散文或诗歌,并让他们猜下一个字母,再猜一个,以此类推。柯尔莫哥洛夫私下说过,从信息论的观点来看,苏联报纸的信息量不如诗歌。因为政治话语会使用大量的固定短语,内容更容易预测。而对于诗歌来说,尽管存在严格的格律要求,但那些伟大诗人的作品却难以预测。他认为这就是诗人的独特标志,也是艺术上的不可能,但概率论有助于衡量艺术的价值。

    虽然将《战争与和平》这样的小说置于一个概率样本空间的想法遭到了柯尔莫哥洛夫的蔑视,他却可以通过计算《战争与和平》的复杂性来表达其不可预测性。柯尔莫哥洛夫假设,复杂性是一个对象的最短描述长度,或者是生成一个对象的算法的长度。确定性的对象的描述是简单的。比如,它可以通过一个周期性的0和1组成的序列产生。但不确定的、真正随机的对象则是复杂的,任何生成算法的长度都必须和对象本身一样长。比如,无理数,小数点以后的数字没有规律可循(循环小数可用一个简洁的分数来表示)。因此,大多数无理数都属于复杂对象,因为要描述它们就只能原样再写一遍。这种对复杂性的理解是符合直觉的,即没有任何办法去预测、描述一个随机对象。今日,这一观点对于衡量一个物体所需的计算资源非常重要,在网络路由、排序算法和数据压缩都有所应用。