量子那些事儿 关注
手机版

从量子力学到量子卫星:教你成为量子科学高手

  1. 云栖社区>
  2. 量子那些事儿>
  3. 博客>
  4. 正文

从量子力学到量子卫星:教你成为量子科学高手

雪花又一年 2018-05-03 15:49:00 浏览352 评论0

摘要: 我们可以把量子力学的框架总结为“三大神秘”和“一个必需”。“三大神秘”包括:叠加,测量,纠缠。“一个必需”则是:对量子态的变换。从这四个元素,可以引出“量子比特”,以及多种多样的量子算法和量子通信方案。

我们可以把量子力学的框架总结为“三大神秘”和“一个必需”。“三大神秘”包括:叠加,测量,纠缠。“一个必需”则是:对量子态的变换。从这四个元素,可以引出“量子比特”,以及多种多样的量子算法和量子通信方案。

作者网名: 中科大胡不归

化学博士,中国科学技术大学副研究员,中国科学技术大学科技与战略风云学会会

————————————————————————————————

【本文在“墨子号”量子卫星发射前夕应邀写作,分两篇连载于《中国国家天文》2016年第7期和第8期。感谢中国科学技术大学宣传部褚建勋副部长、范琼老师出色的组织工作,以及云南大学陈清研究员、中国科学技术大学彭新华教授在科学内容方面的宝贵意见。】

《中国国家天文》杂志为国家天文台主办,特邀顾问李政道。本刊着力于天文人文结合,涉及天文学、空间科学及航天、地理、历史、哲学等。为美国著名天文杂志《Sky & Telescope》中国独家版权合作者,内容权威,图片精美,欢迎订阅。

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy

《中国国家天文》2016年第7期封面

中国即将发射全球第一颗“量子卫星”,这是科学界的一件大事,也是产业界的一件大事。量子卫星的科学意义究竟是什么呢?量子卫星的全称是量子科学实验卫星,它是用来做量子信息实验的。我们将在这里介绍量子信息学的基本框架,并回答若干常见的问题,给出一幅大图景。希望读者今后看到层出不穷的相关消息时,理解它们在说什么,不再感叹“不明觉厉”。

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy

基于浮空平台的量子密钥分发

量子、台阶、离散

一个首当其冲的问题是,什么是量子?这个词虽然看起来有些抽象,但实际的意思却很简单,可以解释为“离散变化的最小单元”。比如我们登台阶时,只能上一个台阶、两个台阶等,而不可能上半个台阶、1/3个台阶等,这就是一种离散的概念,一个台阶就相当于一个量子。

在微观世界里,很多物理量都是离散变化的,这是微观世界的一种本质特征。例如,氢原子中电子的能量只能取一个基本值(-13.6电子伏特)或者它的1/4、1/9、1/16、1/25等等,但不能取其2倍或1/2、1/3。准确地描述微观世界的物理学理论就是量子力学。

宏观物体是由微观粒子组成的,所以要准确描述宏观世界,原则上也必须用量子力学。牛顿力学只是量子力学在宏观条件下的一个近似理论,又被称为经典力学。在后文中,我们将会看到在某些问题中经典结果和量子结果的对比。读者只要记住“如果两个结果不一致,量子总是对的,经典总是错的”,就差不多了。

新旧量子论

量子力学的起源是在1900年,普朗克(Max Planck)在研究“黑体辐射”问题时,第一次发现必须把某个物理量当作离散变化的,在黑体辐射中这个物理量是辐射携带的能量。在此基础上,爱因斯坦(Albert Einstein)、玻尔(Niels Henrik David Bohr)、德布罗意(Louis Victor de Broglie)等人后来提出了许多重要的概念,大大扩展了量子力学的应用范围。

有趣的是,爱因斯坦获得诺贝尔物理学奖,是因为他在解释光电效应时提出了光量子理论,而不是因为相对论。上述这些科学家的工作被后人称为“旧量子论”,因为,虽然屡经扩展,这些理论却仍然是一堆智慧的碎片,缺乏统一的数学框架,对稍微复杂一点的体系就无法定量处理了。

 1925年,这种状况被海森堡(Werner Karl Heisenberg)的工作所改变,他使用矩阵的数学语言,第一次给出了一套能够精确描述任何微观现象的理论。过了没多久,薛定谔(Erwin Rudolf Josef Alexander Schrödinger)用微分方程的数学语言给出了另一套理论,很快又证明了两种理论是等价的。从那以后,人类更深一步地了解了微观世界的奥秘,进而创造了不计其数的奇迹。


640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy

量子力学创始人群像

量子力学对阵相对论

量子力学和相对论是二十世纪的两大革命性科学理论,对人类的世界观都造成了巨大的震撼。但科学界之外的人往往不知道,其实这两者在实际应用和研究的活跃程度上相差甚远。


640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy

未来的量子通信(示意图)

量子力学能用来干什么呢?更该问的是它不能干什么!宏观物质的性质是由其微观结构决定的,所以量子力学解释了导电性、导热性、硬度、超导、超流、相变等日常可以见到的多种物理现象。可以说,现代社会硕果累累的技术成就,几乎都与量子力学有关。

另一方面,相对论在物体以接近光速运动时和强引力场条件下有基础作用。可是想一想,日常生活中有多少机会遇到这些情况呢?所以目前相对论的应用,局限在宇宙学、原子钟、全球定位系统等领域。拢起来能讲出不少,跟量子力学的应用相比却是九牛一毛。

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy

量子态叠加(想象图)

因此,现在所有的物理专业学生和许多相关专业(尤其是化学)的学生,都要学量子力学,而学广义相对论的只有少数理论物理专业的学生。在科技新闻中你会发现,量子力学领域日新月异,相对论领域却是在验证爱因斯坦100年前预测的引力波。

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=

多重量子态(想象图)

量子力学的“三大神秘”和“一个必需”

从信息科学的角度看,量子力学是一种可资利用的数学框架。能不能利用量子框架做到在经典框架下做不到的事?这就是量子信息研究的问题。

向非专业的读者解释量子力学,从来就是一个难题。从帮助人们通俗地理解量子信息的角度来说,我们可以把量子力学的框架总结为“三大神秘”和“一个必需”。“三大神秘”包括:叠加,测量,纠缠。“一个必需”则是:对量子态的变换。

从这四个元素,可以引出“量子比特”,以及多种多样的量子算法和量子通信方案。下面分别来介绍这些元素。

每当你感到“这怎么可能”、“这不是胡说八道吗”的时候,请记住,这些原理不是某个科学家的心血来潮无端虚构,而是已经经过近百年来的无数实验反复证明的,其应用范围几乎涉及我们身边所有事物。

第一大神秘:叠加

比特是计算机科学的基本概念,指的是一个有且仅有两个可能的状态“0”和“1”的体系,这类似于硬币的正、反两个面。但在量子力学中,情况出现了本质的不同。量子力学有一条基本原理叫做叠加原理:如果两个状态是一个体系允许出现的状态,那么它们的任意线性叠加也是这个体系允许出现的状态。

那么,什么叫做“状态的线性叠加”呢?为了说清楚这一点,最方便的办法是用一种数学符号表示量子力学中的状态,就是在一头竖直一头尖的括号“|>”中填一些表征状态特征的字符。在量子信息中,经常把两个基本状态写成|0>和|1>。而|0>和|1>的线性叠加,就是a|0> + b|1>,其中a和b是两个常数。这种符号是狄拉克(Paul Adrien Maurice Dirac)发明的,称为狄拉克符号。叠加原理说的是,如果一个体系能够处于|0>和处于|1>,那么它也能处于任何一个a|0> + b|1>。后面在讨论第二大神秘“测量”的时候,我们会看到,对a和b唯一的限制就是它们的绝对值的平方和等于1,即|a|^2 + |b|^2 = 1。

叠加原理乍看起来完全和常识相反。假如用|0>代表你正在北京喝茶,|1>当作你正在巴黎喝茶,那么(|0> + |1>)/√2就意味着你同时处于北京与巴黎喝茶!这种状态怎么可能存在呢?但量子力学的一切实验结果都表明,叠加原理是正确的,是一条必不可少的基本原理。至少在微观世界的应用中,科学家对叠加原理充满信心。一个电子确实可以同时位于两个地方。至于宏观世界里为什么没见过一个人同时位于两处,那是另一个深奥的问题,相当于著名的问题“薛定谔的猫”,我们在本文中不做更多的讨论。


640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy

量子叠加

在叠加原理的框架下,经典的比特变成了量子比特,也就是说它不是只能取0或取1了,而是可以处于任意的a|0> + b|1>状态,包括a = 1、b = 0的|0>和a = 0、b = 1的|1>。这是个巨大的扩展,可以想象,一个量子比特潜在地包含比一个经典比特大得多的信息量。之所以说“潜在地”,是因为这只是一个可能性,要发挥出来还需要十分聪明的实验设计。


640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy

量子纠缠(想象图)

为了更方便地理解这个概念,我们可以把一个量子力学的状态理解成一个矢量,实际上狄拉克符号|>正是为了让人联想到矢量而设计的。在一个由这些态矢量组成的平面上,|0>和|1>定义了两个方向,相当于两个坐标轴上的单位矢量。在|a|^2 + |b|^2 = 1的条件下,a|0> + b|1>就是任何一个从原点到半径为1的单位圆上一点的矢量。看清楚这个几何图象,我们立刻就明白,单位圆上任何一点的地位都是相同的,没有一个状态比其他状态更特殊,可谓“众生平等”。

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=
多世界理论(想象图)

现在来定义两个状态,|+> = (|0> + |1>)/√2和|-> = (|0> - |1>)/√2。它们相当于|0>和|1>都向一边旋转45度。如果把|+>和|->当作基本状态,用它们的线性叠加来表示所有的其他状态,同样是可行的。取一组矢量,如果其他所有的矢量都能表示成这组矢量的线性叠加,那么这组矢量就叫做“基组”。|0>和|1>构成一个基组,|+>和|->也构成一个基组,这样的基组有无穷多个。

第二大神秘:测量

在经典力学中,测量固然是一种重要的操作,但我们并不会认为测量过程跟其他过程服从不同的物理规律。可是在量子力学中,测量跟其他过程确实有本质性的区别,描述量子力学中的测量要用与众不同的物理规律!关于量子力学的许多著名的争论,如“薛定谔的猫”、多世界理论,都是由测量造成的。我们在这里不拟详细讨论这些争论,而是直接给出绝大多数科学家接受的共识。

量子力学中的测量,特殊在哪里呢?首先,一次测量必须对应某个基组。不同次的测量可以改变基组,比如说这次用|0>和|1>,下次用|+>和|->,这是允许的,但你每次必须说清当前用的是哪个基组。然后,在|0>和|1>的基组中测量a|0> + b|1>(a和b都不等于0),会使这个状态发生突变,变成|0>和|1>中的某一个。我们无法预测特定的某次测量变成|0>还是|1>,能预测的只是概率:以|a|2的概率得到|0>,|b|2的概率得到|1>。由于只可能有这两种结果,所以这两个概率相加等于1,这就是前面所说的|a|2 + |b|2 = 1的来源。

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy

量子测量

举个例子,在|0>和|1>的基组中测量|+> = (|0> + |1>)/√2,会以1/2的概率得到|0>,1/2的概率得到|1>。1/2概率的意思是,如果你重复这个实验很多次,可以预测有接近一半的次数得到|0>,接近一半的次数得到|1>。但对于单独的一次实验,你没办法做出任何预测。也就是说,同样的原因可以导致不同的结果!


640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy

量子态

这种内在的随机性是量子力学的一种本质特征。在经典力学中,一切变化都是有确定原因的,同样的原因必然要导致相同的结果,而量子力学却不是。


640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy

量子力学实验室

有人在这里可能要问:经典力学中也有随机性,掷硬币不就是一半可能朝上,一半可能朝下吗?回答是:同样是概率,背后的原因不一样,可改进的余地也不一样。掷硬币的结果难以预测,是因为相关的外界因素太多:硬币出手时的方位、速度、空中的气流状况等等。也就是说,掷硬币的概率反映的是信息的缺失。你可以通过减少这些因素的干扰来增强预测能力,例如在真空中掷,消灭气流,用机器掷,固定方向和力度,最终使得掷出某一面的机会显著超过另一面。但在量子力学中,概率是由体系本身的状态决定的,不是由于外界的干扰,不是由于缺少任何信息,因此完全没有办法做什么“改进”。所以再次强调,这种随机性是内在的,是量子力学的一种本质特征!

第三大神秘:纠缠

前面说的都只是一个量子比特的体系,已经有这么多不可思议之处。多个量子比特的体系,可想而知会更加奇怪。

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy

EPR对(想象图)

在经典力学中,我们如何描述一个两粒子体系的状态?我们会说,粒子1处于某某状态,粒子2处于某某状态。在量子力学中,有些两粒子体系的状态也可以用这种方式来描述,例如常用狄拉克符号|00>表示两个粒子都处于自己的|0>态,|01>表示粒子1处于|0>态,粒子2处于|1>态,|11>表示两个粒子都处于自己的|1>态。在数学上,把这样的状态称为两个单粒子状态的“直积”,就是直接相乘的意思。我们还可以用直积来定义两个粒子都处于自己的|+> =(|0> + |1>)/√2态的状态,即|++> = [(|0> + |1>)/√2] [(|0> + |1>)/√2] = (|00> + |01> + |10> + |11>)/2。看起来,直积态已经能表示所有的多粒子态了,但是这不对,事实并非如此!

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy

漫画:贝尔不等式

考虑这样一个两粒子状态:(|00> + |11>)/√2。它是|00>和|11>的一个叠加态(是的,叠加原理对于多粒子体系也适用),我们把它记作|β00>。这个态能不能写成两个单粒子态的直积呢?也就是说,(|00> + |11>)/√2能不能写成(a|0> + b|1>) (c|0> + d|1>)?回答是不能。因为这个状态中不包含|01>,也就是说ad = 0,但是a如果等于0,|00>就不会出现,而d如果等于0,|11>又不会出现。无论如何都矛盾,所以只能承认这个状态不能分解成两个单粒子态的直积。这就意味着,不能用“粒子1处于某某状态,粒子2处于某某状态”来描述|β00>。

那么对于|β00>,我们能说些什么呢?你去测量粒子1的状态,会以一半的概率得到|0>,与此同时粒子2也变成|0>;以一半的概率得到|1>,与此同时粒子2也变成|1>。你无法预测单次测量时粒子1变成什么,但你可以确定,粒子1变成什么,粒子2也同时变成了什么。两者似乎被一种神秘的力量绑在一起,总是同步变化。只要不是直积态,对一个粒子的测量就必定影响另一个粒子,这种现象就叫做“纠缠”,这样的状态称为“纠缠态”。


640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy

量子纠缠

EPR

有趣的是,纠缠这个重要的量子力学现象,是由几位反对量子力学的人提出的。而这几位反对量子力学的人当中,领头的就是爱因斯坦!

如前所述,爱因斯坦曾经对旧量子论的发展做出重要的贡献,他得诺贝尔奖是因为提出光量子理论而不是因为相对论(当然这是诺贝尔奖评奖委员会在开历史玩笑,不是爱因斯坦的问题)。但随着新量子论的发展,爱因斯坦对量子力学的许多特性产生了深深的怀疑。他认为每个粒子在测量之前都应该处于某个确定的状态,而不是等到测量之后。在他看来,这才叫“物理实在”。爱因斯坦的一个经典问题是:“你是否相信,月亮只有在我们看它的时候才存在?”

1935年,爱因斯坦、波多尔斯基(Boris Podolsky)和罗森(Nathan Rosen)提出了一个思想实验,后人用他们的姓名首字母称为EPR实验。先让两个粒子处于|β00>态,这样一对粒子称为“EPR对”。然后把这两个粒子在空间上分开很远,可以任意的远。然后测量粒子1。如果你测得粒子1在|0>,那么你就立刻知道了粒子2现在也在|0>。好比成龙电影《双龙会》中有心灵感应的双胞胎,一个做了某个动作,另一个无论有多远都会做同样的动作。而最重要的问题是,既然两个粒子已经离得非常远了,粒子2是怎么知道粒子1发生了变化,然后发生相应的变化的?EPR认为两个粒子之间出现了“鬼魅般的超距作用”,信息传递的速度超过光速,从而违反了狭义相对论。所以,看来量子力学肯定有“问题”。


640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy

玻尔与爱因斯坦

这个问题非常深邃。不过量子力学有一个标准回答:处于纠缠态的两个粒子是一个整体,绝不能把它们看作彼此独立无关的,无论它们相距有多远。当你对粒子1进行测量的时候,两者是同时发生变化的,并不是粒子1变了之后传一个信息给粒子2,粒子2再变化。所以这里没有发生信息的传递,并不违反相对论。


640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy

量子通信(想象图)

贝尔不等式

在爱因斯坦的时代,人们只能对EPR实验进行哲学辩论,无法通过实验做出判断。1964年,贝尔(John Stewart Bell)指出,可以设计一种现实可行的实验,把双方的矛盾明确表现出来。对两粒子体系测量某些物理量之间的关联,如果按照EPR的观点,这些物理量在测量之前就有确定的值,那么这个关联必然小于等于2;而按照量子力学,这个关联等于2√2,大于2。这个经典体系应该满足的不等式就叫做贝尔不等式,而量子力学不满足贝尔不等式。


640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy

量子通信网络(想象图)

1980年代,阿斯佩克特(Alain Aspect)等人做了实验,结果是在很高的置信度下违反贝尔不等式。EPR的思想实验最初是用来批驳量子力学的,结果却证实了量子力学的正确!

类似的故事在科学史上也有。十九世纪的时候,泊松(Simeon-Denis Poisson)主张光是粒子,菲涅耳(Augustin-Jean Fresnel)主张光是波动。1818年,菲涅耳计算了圆孔、圆板等形状的障碍物产生的衍射花纹。泊松指出,按照菲涅耳的理论,在不透明圆板的正后方中央会出现一个亮点。他认为这是不可能的,于是宣称驳倒了波动说。但菲涅耳和阿拉果(Dominique Francois Jean Arago)立即做实验,结果显示果然有亮斑出现,波动说大获全胜。后人很有幽默意味地把这个亮点称为泊松亮斑。这正应了尼采的话:“杀不死我的,使我更强大!”

EPR现象既然是一个真实的效应,而不是爱因斯坦等人以为的悖论,人们就想到利用它。现在EPR对成了量子信息中最有力的工具。对此我们只能说,深刻的错误超过浅薄的正确,伟人连错误都是很有启发性的!

现在科学家们认为,纠缠是一种新的基本资源,其重要性可以和能量、信息、熵或任何其他基本的资源相比。但目前还没有描述纠缠现象的完整的理论,人们对这种资源的理解还远不够深入。有人把纠缠比喻为“青铜时代的铁”,它可能会在下一个历史时代大放异彩。


640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy

量子计算(想象图)

一个必需:对量子态的变换

前面说了这么多,都是对量子态的描述,还没有回答另一个基本问题:如何把一个态变成另一个态?对这个问题的回答倒是不神秘:所有的可逆变换都是可以实现的。用线性代数的术语说,可逆变换就是“酉变换”,不过在下文中我们不使用这个术语。

在可逆变换中,信息没有损失。例如对两粒子体系,有一个对换操作,把两个粒子的状态对换,即把|ab>变成|ba>。如果这个操作连续进行两次,就回到了最初的状态,例如|01>变成|10>,又变回了|01>。

测量也能改变量子态,但它是不可逆的,会丢失信息。例如对处于|+> =(|0> + |1>)/√2态的一个粒子,在|0>和|1>基组下测量,第一次测量得到|0>,那么后面你再做多少次同样的测量,体系都一直保持在|0>,再也不可能回到|+>态了。在经典力学的实验中,随便在哪里进行一次测量都没有关系。但在量子力学的实验中,在某个地方进行一次测量会造成不可逆的后果(不一定是有害的),所以一定要仔细设计,确保由此得到的结果对实验的目的有利。事实上,量子信息的许多应用都用到了测量操作,例如后面要谈到的量子隐形传态、量子密码术。

量子信息的优势

从上述内容可以看出,量子信息跟经典信息相比有很大的优势。经典比特的0和1只有两个状态,量子比特的a|0> + b|1>却有无穷多个状态,这是一个显而易见的优势。还有一个稍微复杂一点的优势。一个包含n个经典比特的体系,总共有2n个状态。想知道一个变换在这个n比特体系上的效果,需要对这2n个状态都计算一遍,总共要2n次操作。对n个量子比特的体系,却有一个巧妙的办法。使所有量子比特都处于自己的|+>态,那么整个体系的状态是|++…+> = (|00…0> + |00…1> + … + |11…1>) /2n/2,0和1的所有长度为n的组合都出现在其中。对这个叠加态做一次操作,所有2n个结果都会产生出来!



640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy

量子计算机(想象图)

但在欢呼之前,我们需要认清,这个巨大的优势并不容易利用。因为所有2n个结果是叠加在一起的,要读取出其中某一个需要做测量,而一做测量就把其余的结果破坏了。所以这个优势只能称为潜在的巨大优势,真要利用它,需要非常聪明的算法设计,只有对极少数问题能够设计出这样的算法。有些科普文章把量子计算机描写成无所不能,这是重大的误解。量子计算机的强大,是与问题相关的,只针对特定的问题。


原文发布时间为:2017-01-17
本文作者:袁岚峰
本文来源:量子趣谈,如需转载请联系原作者。

【云栖快讯】你想见的Java技术专家都在这了,向大佬提问,有问题必答  详情请点击

网友评论