专家能尝出葡萄酒的好坏吗?
葡萄酒的品鉴看上去很有品味,光看步骤就知道很复杂,比如如何闻香、如何把酒倒入杯中、如何摇动酒杯、如何喝下、如何让酒长时间刺激味蕾、如何让喉咙感受酒香、如何体验回味,等等。但这篇文章的目的就是要痛毁小清新:实际上评价葡萄酒的好坏和掷骰子、抛硬币是差不多的。
Robert Hodgson退休后在加州的Humboldt村经营一个酒厂,每年他都会从厂里选出最好的葡萄酒参加比赛。大多数年份,获奖结果都出人意料,有些获得金奖的白葡萄酒在其他比赛中表现却很差劲,这种情况在红葡萄酒上也一样存在。评价酒的好坏虽然有主观的成分,但谁能获金奖看上去好像真的是个随机事件。
Robert Hodgson曾经是一个海洋学家,凭借他在统计学上的背景知识,他拜访了加州葡萄酒大赛的组织者并提议他们在每年竞赛的同时做个实验。
在从前的比赛中,对于每种参赛酒,每个评委都会品尝一小杯,但为了配合实验,此后的规则稍加改动:其中某些参赛酒会被用同样的杯子端上来3次,最后观察评委对同一种酒的评价是否一致,来判断他们的打分是否科学。
这项实验从2005年开始一直持续到2013年6月,实验结果令葡萄酒业惊讶:即便是受过专业训练的品酒师对酒的判断也是非常糟糕的。每年的比赛中只有10%的评委可以对同一种酒的评价保持一致,而如果跟踪这10%的评委在其他年份比赛的表现,他们又好像失去了这种客观评价的能力。而评委绝不是业余的,他们的身份都是酿酒师、品酒师、评论家,是消费者眼中绝对的行家。
在Hodgson的实验中这些酒通过打分来评价好坏,最好的100分,最差的50分,大多数葡萄酒得分在70多分到90多分。前四年实验的统计结果发表在《葡萄酒经济》上,品酒师对同一种盲测的酒3次品尝结果打分的平均差值为4分。比如同一种酒,某位评委第一次品尝打分为90分,评价为“优”;一分钟后品尝打分为86分,评价为“还可以”;再过两分钟品尝,打分为94分,评价又变为“出色”。
上述情况还只是平均值,有些表现差的品酒师对同一瓶酒的评价差异达到正负10分,表现最好的品酒师也有正负2分。虽然有时只是几分的差距,但最终能获奖凭借的就是几分的差距。这些奖项对酒厂来说就意味着丰厚的利润,足以影响它和竞争对手在销量上的输赢。Hodgson随后继续统计了每年的竞赛情况,发现获奖呈现随机分布。
Hodgson说:“我不否认确实有些人味觉发达,在品酒上很专业,但如果摆在你面前100种葡萄酒,要准确评价它们已经远远超过人力所及。回顾我自己酒厂曾经获过的奖项,现在来看仅仅是幸运而已。”
Hodgson的研究当然也遭到了同行的攻击,很多人说他的研究就是一坨屎。Hodgson并不是一个人在战斗,法国学者Frederic Brochet对葡萄酒的“标签效应”做了研究,他准备了完全一样的波尔多顶级葡萄酒,征集了57个志愿者。葡萄酒瓶的标签被换成两种:一种标明是餐酒级(Table),在一般超市1~5欧元就可以买到;另一种标明特级(Grand Cru),几十到几千欧元可以买到。
结果可想而知,标明特级的酒评价很积极:口味丰富、均衡、有回味、醇厚。同样的酒标为餐酒后评价就很负面了:淡、轻、平淡无奇。
此方面的研究还有2008年Robin Goldstein发表在《葡萄酒经济》上的文章,文章揭示了葡萄酒价格和受人们喜爱的程度正相关。2011年赫特福德郡大学心理学教授Richard Wiseman组织了578人来品尝价格从3.49英镑到30英镑的葡萄酒,同样也是采用盲测的方法。能分辨出价格在5英镑以下与10英镑以上红葡萄酒的人只占53%。如果换成白葡萄酒,能尝出很便宜的和很贵的酒之间差别的人只有47%了(可能和白葡萄酒中含单宁更少有关)。总的来说,这578人能正确分辨酒的好坏的概率和我们扔硬币赌正反面差不多,都是接近50%。
为什么我们在盲测实验中基本无法分辨酒的好坏呢?有可能是因为酒中的成分非常复杂。澳大利亚食品学家Bryce Rankine博士说葡萄酒中可以检测出27种有机酸、23种醇类物质、80种醛类和酯类物质,以及16种糖类,除此之外还有很多维生素、矿物质。所有这些不可能都标注在产品标签上,而且酒中也一样会含有砷、铅这样的有害物质。
辨别葡萄酒的好坏主要从三方面入手:甜度、酸度、苦涩度。这些都由味蕾完成。甜来自于葡萄中的糖分,酸来自于酒石和苹果酸,苦涩来自于醇类、多酚和单宁。好葡萄酒可以在这三个维度之间达到平衡。举例来说,有些葡萄酒的酸度比柠檬汁还厉害,但喝起来却适口,就是因为甜味和苦味平衡了那些酸味。专业的品酒就是来通过品这三种口味的平衡还有散发出来的气味来判断酒的好坏。不过涉及到气味,化学家又要进行更深入的分析了。
最近几十年化学家对葡萄酒的味道做了很多研究。Sauvignon Blanc(白索维农葡萄酒,也叫长相思)中草木的香味主要来自葡萄在氨基酸代谢中的副产物——甲氧基吡嗪,这种物质在低温下更容易生成,所以同年份新西兰南部产的Sauvignon Blanc比澳大利亚北部产的Sauvignon Blanc有更明显的草木香味。
酒香不是靠味蕾,而是靠鼻子中数以百万计的嗅球来感知,这些嗅球直接和大脑中的神经相连。化学家们一共确认了400种单独起作用的气味,它们混合在一起组成了复杂的气味。有些气味刚刚吸入鼻中就会消失,而其他一些气味会停留很久。酒香是由低沸点的挥发物飘入鼻中感觉到的。这些挥发物主要来自葡萄,其次是经过长时间发酵后产生的物质,还有就是盛酒的木桶。
对酒的评价甚至不单由它本身决定。2008年,赫瑞瓦特大学的研究发现,音乐有助于大幅度提升人们对酒的评价(提升60%)。结论听起来有些搞笑:Jimi Hendrix(就是舞台上烧吉他的鼻祖)的音乐会提升人们对Cabernet Sauvignon(产自波尔多的一种红葡萄酒,中文名叫赤霞珠)的评价,Kylie Minogue的音乐会提升人们对Chardonnay(产自法国勃艮第的一种白葡萄酒,中文名叫霞多丽)的评价。
嗅觉系统根据蛋白质受体来探测不同的气味。大多数人的鼻子可以辨别的气味非常宽泛,不过我们的大脑并不会对每个刺激都做出反应,尤其是让你用语言描述并给酒打分,难度就更大了。英国皇家学会化学家Hutchinson说:“在葡萄酒界有太多‘皇帝的新衣’了,我可以轻松找到令我失望的几百英镑的葡萄酒,也可以轻易找到令我惊喜的葡萄酒,它的售价只有几英镑。”
除了化学因素,酒的温度也影响人们对它的评价。葡萄酒挥发气味的多少与温度有关,在北欧国家喝葡萄酒时这种扑面的酒香就会淡很多。除此之外,酒具、品酒的环境、心情、身体健康程度都对评价酒有较大影响。所以想靠人评价葡萄酒的好坏是完全不可能的。
如果人不能评价,那么靠仪器是否可以呢?Hutchinson说:“这方面我们还有很长的路要走,有很多成分要分析,不过我们已经可以根据仪器的分析结果给出一些让葡萄酒味道更均衡的建议了,但众多的味道和感觉到底是由哪些化学成分主导的?人们接触到某种成分后会产生什么反应?对于诸如此类的问题,我们可能永远也没有答案。”
盲测法在品酒中还有更多的应用。Robert Hodgson正在利用从前的实验数据提出一套新的评价葡萄酒味道的方法,虽然还不够完美,但起码要比从前“随机夺冠”的方式合理多了。这套方法2013年在南非开普敦第一次进行了尝试。他说起码我们现在知道哪些评价方法是不合格的了。
最后是一记尖酸刻薄的老拳:2007年,普林斯顿大学经济学教授Richard E.Quandt发表了一篇名为《葡萄酒界的废话:一套新软件》的论文。这篇文章里讨论了“砖家”、“叫兽”、伪艺术家对葡萄酒的形容词和评论,而且还整理出一套“葡萄酒奇葩词汇表”,包含了123个形容词,比如“有棱角的”、“紫罗兰样的”、“壁炉样的”、“纹理细致的”。然后他在同事的帮助下设计了一套算法,这样可以自动随机生成一段对葡萄酒口味的描述,比如:“此款Chateau L’Ordure Pomerol葡萄酒产于2004年,有不错的矿物质口感,干杏仁的味道混着雪松的特质,充满了智慧的红酒入口后就爆发出黑色水果和烤栗子的味道。”教授说这样的评论并不夸张,实际上品酒师们写出的内容也大抵如此。
解读
这篇文章介绍了一种有力的科学方法:双盲实验。它最初应用于药物的临床实验,20世纪60年代后也广泛应用于心理学实验中,现在已经是科研中标准化的测量工具。为什么说它“有力”呢?因为它把主观和客观第一次清晰地分割开来,也让人们第一次深刻认识到:感觉是靠不住的。
以临床实验来说,双盲实验指的是:被试和测试者都不知道,在实验中被试到底吃了真药还是淀粉做成的和真药外观一模一样的安慰剂。具体谁吃了什么,详细数据是由第三方记录的。慢性病的进展程度尤其受心理因素的影响。如果病人知道自己服用了最新研发的药物,他倾向于相信自己的病情有所好转。人们很难相信几百人的通力合作和十几亿美元的投入都没有效果。所以,一定要找到一种方法把这些干扰因素排除开来。
当然,有的时候因为受条件所限,难以做到双盲(比如评价按摩有没有疗效),但即便只有单盲,也比全凭主观判断要稳妥。我们在论文库里可以找到一些研究红酒口味的论文,绝大多数的结论是:难以从口味区分价格。同样道理,在评价音响的效果时也可以使用双盲实验。我们可以找到很多让人啼笑皆非的结论,比如:晾衣杆做成的导线,它的音效比200美元一根的高级导线还要好。
有时候我们自己都可以体察到主观上的差异,这就更难以否定自己的感受了。其实,在有充足双盲实验证据的领域承认自己的感觉是不可靠的,也是现代人和古代人的最大差异之一。