ทฤษฎีควอนตัมในฐานะทฤษฎีความน่าจะเป็น บทท้าย

23 ก.ย.: ปรับปรุงตรงส่วน axioms ใหม่ของทฤษฎีควอนตัม, เพิ่มอรรถาธิบาย
25 ก.ย.: เพิ่มเรื่อง superposition และคำอธิบายของสมมติฐานของทฤษฎีบทของ Gleason ที่เป็นภาษาคนก่อนภาษาคณิตศาสตร์

ในตอนที่แล้วเราได้ประกาศให้

a\left[\begin{array}{c} 1 \\ 0 \end{array}\right] +b\left[\begin{array}{c} 0 \\ 1 \end{array}\right]

เมื่อ a และ b เป็นจำนวนเชิงซ้อนใดๆเป็นสถานะของความรู้ที่มากที่สุดในทฤษฎีควอนตัม ต่างกับในทฤษฎีความน่าจะเป็นแบบไม่ต่อเนื่อง (discrete) ที่

\left[\begin{array}{c} 1 \\ 0 \end{array}\right]

และ

\left[\begin{array}{c} 0 \\ 1 \end{array}\right]

เป็นเพียง 2 สถานะของความรู้ที่มากที่สุดถ้ามีเพียง 2 เหตุการณ์ที่ไม่สามารถเกิดพร้อมกันได้ (mutually exclusive) ถ้ามีมากกว่านั้นก็ประกาศให้ทุกๆเวกเตอร์ของจำนวนเชิงซ้อนที่เป็นผลบวกของเวกเตอร์ของเหตุการณ์ที่ไม่สามารถเกิดพร้อมกันได้เป็นสถานะของความรู้ที่มากที่สุดเช่นกัน

แต่มันเสียเวลาที่จะเขียนเวกเตอร์แถวหรือหลักโดยการลิสต์ตัวเลขทุกๆตำแหน่งของเวกเตอร์ตลอดเวลา นักฟิสิกส์จึงบอกให้รู้ว่าสิ่งที่เขียนนั้นเป็นเวกเตอร์โดยการครอบสัญลักษณ์อะไรก็ได้ที่ label เวกเตอร์ระหว่างเส้นแนวตั้งกับหัวลูกศร โดยข้อตกลงทั่วไปคือถ้าชี้ขวาเป็นเวกเตอร์หลัก (column vector) | \psi \rangle เรียกว่า “ket” (เค็ต) ถ้าชี้ซ้ายเป็นเวกเตอร์แถว (row vector) \langle \psi | (ที่ได้จากการสลับแถวกับหลักของ |\psi \rangle แล้ว complex conjugate ทุกตำแหน่ง) เรียกว่า “bra” (บรา) (การใช้เครื่องหมายมากกว่า > หรือน้อยกว่า < เป็นหัวลูกศรเป็นบาปหนัก ตายไปแล้วจะตกนรก LaTeX ชั้นที่แปด) เพราะเมื่อเอามันมาคูณกันตามหลักการคูณเมทริกซ์แล้วจะได้ inner product “bracket” ซึ่งเป็นตัวเลข

บราแคทโดย Sabine Hossenfelder

 

ในขณะที่ “ket-bra” |\psi\rangle \langle \varphi | เป็นเมทริกซ์

คำติดปากที่นักฟิสิกส์ใช้เรียกสถานะที่เขียนได้เป็นผลบวกของเวกเตอร์ |\psi \rangle = |\varphi \rangle + |\chi \rangle ก็คือ |\psi \rangle เป็นซูเปอร์โพสิชัน (superposition) ของ |\varphi \rangle และ | \chi \rangle คำศัพท์ที่ตกทอดมาจากฟิสิกส์ของคลื่นที่สามารถซ้อนทับ (superpose) กันได้

คำเตือนหนึ่งในการใช้คำว่าสถานะซูเปอร์โพสิชันก็คือมันขึ้นอยู่กับเบสิสที่เราเลือก ทุกๆสถานะควอนตัมเป็นซูเปอร์โพสิชันของเซตของเวกเตอร์ที่เป็นเบสิสเบสิสใดเบสิสหนึ่งเสมอ จึงไม่มีความหมายที่จะพูดว่าสถานะที่เรามีเป็นสถานะซูเปอร์โพสิชันหรือไม่ถ้าไม่ได้เจาะจงเบสิสลงไป

แต่สถานะซูเปอร์โพสิชันในควอนตัมมีความหมายอะไรทางฟิสิกส์? สมมติถ้าเราเอาเวกเตอร์ของแมวมารวมกับเวกเตอร์ของบรา เวกเตอร์แทนสถานะของความรู้ที่มากที่สุดซึ่งก็คือสถานะของความรู้ที่รู้ทุกอย่างเท่าที่จะรู้ได้ ดังนั้นสถานะซูเปอร์โพสิชันของแมวกับบราจึงไม่ใช่สถานะของความไม่แน่นอนที่เราอาจจะสังเกตแล้วเจอแมวหรือบราได้ ดังเช่นในกรณีของโพลาไรเซชันของแสง, โพลาไรเซชันแบบหมุนซึ่งเป็นซูเปอร์โพสิชันของโพลาไรเซชันแนวตั้งกับแนวนอนนั้นต่างกับโพลาไรเซชันแนวตั้งหรือแนวนอนและไม่ใช่ความไม่แน่นอนที่จะเห็น โพลาไรเซชันไม่แนวตั้งก็แนวนอนซึ่งจะเป็นแสงที่โพลาไรซ์บางส่วนหรือไม่โพลาไรซ์แทน ดังนั้นซูเปอร์โพสิชันของแมวและบราก็อาจจะเป็น

(หรือแมวกับบราอาจจะรวมกันไม่ได้ด้วยเหตุผลเดียวกับที่โบซอน (boson) และเฟอร์มิออน (fermion) รวมกันไม่ได้) แต่ประเด็นที่เกี่ยวข้องกับเราในตอนนี้ก็คือเราสมมติว่าเมื่อไรก็ตามที่เรามีเซตของเวกเตอร์ของสถานะของความรู้มากที่สุดที่ตั้งฉากกัน กล่าวคือเซตของสถานะความรู้มีความสัมพันธ์หนึ่งต่อหนึ่งกับเซตของเหตุการณ์ที่เกิดขึ้นพร้อมกันไม่ได้ เราสามารถทำการวัดที่จะแยกแยะมันได้ อย่างในคิวบิท (qubit), ระบบควอนตัมที่มีเหตุการณ์ที่เกิดขึ้นพร้อมกันไม่ได้อย่างมาก 2 เหตุการณ์, เรียกว่า |0\rangle กับ |1\rangle , ถ้าเราสามารถทำการวัดเพื่อแยกแยะ |0\rangle กับ |1\rangle ได้เราก็แยกแยะ |0\rangle +|1\rangle กับ |0\rangle - |1\rangle หรือ |0\rangle +i|1\rangle กับ |0\rangle - i|1\rangle ได้ ซึ่งเป็นสมมติฐานภายใต้ทฤษฎีบทของ Gleason

ทฤษฎีบทของ Gleason และการวัด

Andrew M. Gleason (1921-2008) บอกว่าเราจะคำนวณความน่าจะเป็นจากการวัดในทฤษฎีความน่าจะเป็นแบบใหม่นี้ได้อย่างไร ในปี 1957, Gleason พิสูจน์ว่าถ้าเรามีการวัดที่ให้ผลแน่นอนซึ่งแทนด้วยเซตของเมทริกซ์การฉาย {E} ที่ตั้งฉากซึ่งกันและกัน หากมีฟังก์ชัน P ที่ให้ความน่าจะเป็น (ตัวเลขที่มีค่าได้ตั้งแต่ 0 ถึง 1) ของผล j ซึ่งขึ้นอยู่กับ Ej เท่านั้น โดยเฉพาะว่า P ไม่ขึ้นกับสมาชิกอื่นๆ Ek ≠ j ของการวัด และ P มีพฤติกรรมเหมือน P(E) ในทฤษฎีความน่าจะเป็นดั้งเดิมดั้งต่อไปนี้

I. ความน่าจะเป็นที่จะไม่มีผลการวัดเป็น 0

P(0) = 0

II. ความน่าจะเป็นที่จะได้ผลสักผลเป็น 1

P(I) = 1

(I คือเมทริกซ์เอกลักษณ์ เราให้เซต {E} มีเมทริกซ์การฉายทั้งหมดที่เป็นไปได้ ดังนั้นจะต้องมีสักเซตย่อยที่รวมกันได้เมทริกซ์เอกลักษณ์)

III. ความน่าจะเป็นที่ j และ k จะเกิดขึ้นเป็นผลบวกของความน่าจะเป็นของ j และของ k เมื่อ j และ k ไม่สามารถเกิดขึ้นพร้อมกันได้

E_j E_k =0 \implies P(E_j+E_k) = P(E_j) + P(E_k)

P จะต้องให้ความน่าจะเป็นตามทฤษฎีควอนตัม! นั่นคือความน่าจะเป็นที่จะได้ผล Ej ในสถานะที่รู้มากที่สุดเท่าที่จะรู้ได้ |\psi\rangle คำนวณได้จาก

P( j | \psi ) = \langle \psi|E_j|\psi \rangle

[1] ทฤษฎีบทของ Gleason ไม่ต้องสมมติความต่อเนื่อง (continuity) ของ P หรืออะไรอย่างอื่นอีกเลย (แต่เดี๋ยวเราจะพูดถึงช่องโหว่ของมันและวิธีอุด)

ณ จุดนี้จะเห็นได้ว่าทำไมเราถึงแยะแยะความรู้ที่มากที่สุดและความรู้ที่สมบูรณ์ ถ้าจำนิยามที่เราตกลงกันในตอนที่แล้วได้ ความรู้ที่รู้ทุกอย่างเท่าที่จะรู้ได้แล้วเราเรียกว่าความรู้ที่มากที่สุด และความรู้ที่ทำให้ความน่าจะเป็นของทุกๆเหตุการณ์เป็น 0 หรือ 1 เท่านั้นเป็นความรู้ที่สมบูรณ์ ในสถานะที่รู้มากที่สุดเท่าที่จะรู้ได้ |\psi \rangle ถ้าเราทำการวัดด้วย |\psi \rangle \langle \psi | ที่ฉายลงบนตัวมันเองเราก็จะได้ผลที่แน่นอน, |\psi \rangle ด้วยความน่าจะเป็น 1 แต่ทันทีที่เราทำการวัดนอกเหนือจากนี้ (ซึ่งมีให้เลือกจำนวนนับไม่ถ้วน เราสามารถฉายไปบนสถานะ |\varphi \rangle \langle \varphi | ไหนก็ได้ ) เราจะทำนายได้เพียงความน่าจะเป็นที่จะได้ผลการวัดใดผลการวัดหนึ่ง

P(\varphi | \psi) = |\langle \varphi | \psi \rangle |^2

ดังนั้นในทฤษฎีควอนตัม, ความรู้ที่มากที่สุดไม่มีทางสมบูรณ์ [2] สถานะของความรู้ที่มากที่สุดในทฤษฎีควอนตัมทำตัวเหมือนความน่าจะเป็นที่มีความไม่แน่นอนมากกว่า

การคำนวณความน่าจะเป็นด้วยการ “ยกกำลังสอง” นี้คือสิ่งที่ Max Born (1882-1970) เขียนเป็นครั้งแรกในปี 1926 ในเชิงอรรถของเปเปอร์ (แถมที่จริงเขียนผิดไม่มีกำลังสองอีกตะหาก!)

กฏการคำนวณความน่าจะเป็นนี้เทียบเท่ากับบางส่วนของ axioms III และ IV ที่บอกว่า

III. การวัดแทนด้วย “Hermitian operator” X ซึ่งมี “eigenvalue” เป็นผลการวัดที่เป็นไปได้และ “eigenvector” เป็นสถานะหลังการวัด
IV. ค่าเฉลี่ยของการวัด X ในสถานะ |\psi \rangle คือ \langle \psi| X | \psi \rangle

เพราะการคำนวณค่าเฉลี่ยของผลการวัด xj เท่ากับการนิยามเมทริกซ์ X = ∑j xj Eขึ้นมา

\sum_j x_j \langle \psi |E_j|\psi \rangle = \langle \psi | \left( \sum_j x_j E_j \right) |\psi \rangle = \langle \psi |X|\psi \rangle

แต่ X จะเป็นเมทริกซ์ Hermitian ก็ต่อเมื่อ xj เป็นจำนวนจริงเท่านั้น ซึ่งไม่มีความจำเป็น สิ่งที่จำเป็นคือมันต้องเป็นเมทริกซ์ที่แปลงเป็นเมทริกซ์ทแยงมุมได้ถึงจะแตกกลับเป็น ∑j xj Eได้ ในทางกลับกันกฎการหาค่าเฉลี่ยก็เพียงพอที่จะให้ความน่าจะเป็นกับเราได้เพราะถ้าเรานิยาม X = ∑j xj Ej ให้หนึ่งใน xเป็น 1 และที่เหลือเป็น 0 เมื่อเราคำนวณค่าเฉลี่ยของ X ก็จะได้ความน่าจะเป็นที่จะได้ผล Ej แทน (ในมิติอนันต์ที่ทำอย่างนี้ไม่ได้ก็อาศัยว่าเรารู้การแจกแจงความน่าจะเป็นได้ถ้าเรารู้ทุกๆโมเมนต์ (moment) \langle \psi |X|\psi \rangle,\langle \psi |X^2|\psi \rangle …, ของมัน)

สมการ Schrödinger

ผลพลอยได้จากการรู้กฎการคำนวณความน่าจะเป็นก็คือกฎการแปลงความน่าจะเป็น ในการฉาย |\psi \rangle ลงบนตัวมันเอง,

|\langle \psi|\psi \rangle |^2 = 1

จากพีชคณิตเชิงเส้นเรารู้แล้วว่าการแปลงด้วยเมทริกซ์ unitary U

U^{\dagger} U = UU^{\dagger} = I

อนุรักษ์ปริมาณ |\langle \psi|\psi \rangle |^2 นี้แสดงว่ามันเป็นการแปลงที่อนุรักษ์ความน่าจะเป็นในทฤษฎีควอนตัม สิ่งที่ Eugene Wigner (1902-1995) พิสูจน์ (หมอนี่พิสูจน์หลายอย่างมากจนได้รางวัลโนเบล) คือการแปลงที่ต่อเนื่อง(ที่เราต้องการ)ที่รักษาปริมาณนี้จะต้องเป็นเมทริกซ์ unitary โดยไม่ต้องสมมติว่าเป็นการแปลงเชิงเส้นด้วยซ้ำ

และนี่คือวิธี derive สมการ Schrödinger ถ้ายังไม่เคยเห็น: เขียน U ในรูป exponential ของเมทริกซ์ Hermitian

U = e^{-iHt/\hbar},

เมื่อไรก็ตามที่ U และ H เขียนในรูปเมทริกซ์ทแยงมุมได้ (ซึ่งเขียนได้เพราะทั้งคู่เป็นเมทริกซ์ normal), exponential ของเมทริกซ์คือเมทริกซ์ทแยงมุมที่มี exponential (ในที่นี้ e-iEt/ħ เมื่อ E เป็น eigenvalue ของ H) บนแนวทแยง และ ħ (“h-บาร์”)คือค่าคงที่ของ Planck ที่มีหน่วยพลังงาน × เวลาเพื่อตัดกับหน่วยของ H กับ t ที่เราจะให้เป็นพลังงานและเวลาตามลำดับ

เราก็หาอนุพันธ์ของมัน

\begin{aligned} i\hbar \frac{d}{dt} U &= H U \\ i\hbar \left(\frac{d}{dt} U \right)|\psi (0)\rangle &= H U |\psi (0) \rangle \\ i\hbar \frac{d}{dt} |\psi (t)\rangle &= H |\psi (t)\rangle \end{aligned}

และก็จะได้

II. ระบบเปลี่ยนไปในเวลาด้วย “สมการ Schrödinger”

ออกมา

สมการที่ Erwin Schrödinger (1887-1961) เขียนเป็นครั้งแรกในปี 1925-26 ใช้ไม่ได้ในมิติที่มีขอบเขต (finite) และตอนนั้น Schrödinger ยังไม่รู้ด้วยซ้ำว่ามันเป็นสมการของความน่าจะเป็นและนึกว่าเป็นสมการของคลื่นสสารอะไรบางอย่าง

Where Do We Stand?

สิ่งที่มีแล้วในทฤษฎีควอนตัมของเราตอนนี้คือ

I. สถานะของความรู้ที่มากที่สุดในทฤษฎีควอนตัมแทนด้วยเวกเตอร์ของจำนวนเชิงซ้อน
II. การเปลี่ยนสถานะของความรู้ที่มากที่สุดไปในเวลาเป็นไปตามสมการ Schrödinger
III. การวัดแทนด้วยเซตของเมทริกซ์การฉาย {E} ที่ตั้งฉากซึ่งกันและกัน
IV. ความน่าจะเป็นที่จะได้ผลการวัด j ในสถานะ |\psi \rangle  คือ \langle \psi|E_j|\psi \rangle
V. หลายระบบประกอบกันด้วยการคูณแบบเทนเซอร์

และเราไม่จำเป็นต้องถือ 5 ข้อนี้เป็น axioms อีกต่อไปแล้วเพราะเราเห็นแล้วว่า II-V มาจากเพียง axiom เดียว [3]

ทฤษฎีควอนตัมคือทฤษฎีความน่าจะเป็นซึ่งใช้เวกเตอร์ของจำนวนเชิงซ้อนแทนสถานะของความรู้ที่มากที่สุด

ณ จุดนี้ยังไม่มีอะไรที่บอกเราเกี่ยวกับสถานะหลังการวัด และในความเป็นจริงแล้วมันไม่จริงที่ว่าการวัดที่สำเร็จจะปล่อยให้ระบบอยู่ในสถานะที่เราวัดได้เสมอไป เช่น ในการวัดว่ามีโฟตอน (photon) ของแสงหรือไม่ ถ้าเครื่องมือวัดดูดซับโฟตอนไปไม่ว่าจะมีโฟตอนอยู่ก่อนหน้าหรือไม่ก็จะไม่เหลือโฟตอนหลังการวัด

เราจึงตกอยู่ในสถานการณ์ที่น่าสนใจ เราเริ่มต้นจากการพยายามค้นหาความเข้าใจของ “axioms” ของทฤษฎีควอนตัมที่มีในหนังสือเรียนทั่วไป แต่กลับพบว่าบาง “axiom” ก็ต้องมีการเพิ่มเติมเปลี่ยนแปลง บาง “axiom” ก็ไม่จำเป็นจะต้องเป็นจริง

เพื่อหาผลที่ general ที่สุดของ axiom ของทฤษฎีควอนตัม เราจะกลับไปที่ทฤษฎีบทของ Gleason และดูว่าทำไมทฤษฎีบทที่เราร่างไปข้างต้นที่ Gleason พิสูจน์จริงๆแล้วมันใช้ไม่ได้ใน 2 มิติและมีวิธีแก้อย่างไร

ทฤษฎีบทของ Gleason ใน 2 มิติ

เหตุผลก็คือใน 3 มิติขึ้นไปเมทริกซ์เอกลักษณ์สามารถแตกเป็นการวัดได้จำนวนนับไม่ถ้วนเพราะเราสามารถหมุนเบสิสได้อย่างอิสระ I = E1+E2+E3, I = E1+E4+E5 ,… โดยคงเมทริกซ์เดิม (ในที่นี้ E1) ในทุกๆการแตกได้ อิสระของการแตกเมทริกซ์เอกลักษณ์บวกกับข้อแม้ว่า P ของผลของการวัดที่ 1 ไม่สามารถขึ้นกับ Ej ≠ 1ได้จำกัดรูปแบบที่เป็นไปได้ของ P ให้เป็นกฎความน่าจะเป็นในควอนตัม ในขณะที่ในสองมิติถ้าเราจะใช้ E ในการแตก I ส่วนที่เหลือของ I ก็ต้องเป็น I-E เท่านั้น เป็นอย่างอื่นไม่ได้ เพราะฉะนั้นถึงแม้ว่าจะมีสองเวกเตอร์ที่ใกล้กันแค่ไหน กฎของความน่าจะเป็นในสองทิศทางนั้นก็ไม่จำเป็นต้องมีความสัมพันธ์กันก็ได้

Counterexample: ถ้าเราคิดถึงเวกเตอร์ของจำนวนจริงที่หมุนใน 2 มิติ (ทฤษฎีบทของ Gleason ใช้ได้ทั้งกับเวกเตอร์ของจำนวนจริงและจำนวนเชิงซ้อน) กำหนดให้ฟังก์ชัน Q(θ) นิยามบนช่วง 0 ≤ θ < π/2 มีค่าใดๆก็ได้ตั้งแต่ 0 ถึง 1 เราสามารถนิยาม P(θ)ให้เป็น Q(θ) เมื่อ 0 ≤ θ < π/2, ให้เป็น 1 – Q(θ – π/2) เมื่อ π/2 ≤ θ < π ก็จะได้ความน่าจะเป็นในช่วง 0 ≤ θ < π ทีเหลืออีก π ก็นิยาม P จาก Q ให้เป็นความน่าจะเป็นในทำนองเดียวกัน [4] ก็จะได้ฟังก์ชันที่ให้ความน่าจะเป็นที่ไม่จำเป็นจะต้องต่อเนื่อง (continuous) หรือมีอนุพันธ์ (differentiable) ซึ่งไม่ใช่กฎความน่าจะเป็นของทฤษฎีควอนตัม

แต่ไม่ต้องกังวล ถ้าเราไม่ด่วนเพิกเฉย “การวัดที่สับสนระหว่างผลการวัดที่แตกต่างกันได้” ที่พูดผ่านๆไปในตอนที่แล้ว และกำหนดแค่ว่า E ต้อง “เป็นบวก” และรวมกันได้เมทริกซ์เอกลักษณ์เฉยๆ เราจะสามารถพิสูจน์กฏความน่าจะเป็นของควอนตัมใน 2 มิติได้ [5] เมทริกซ์ E เป็นบวกถ้าหาก

\langle \psi|E|\psi \rangle \ge 0

สำหรับทุกๆเวกเตอร์ |\psi \rangle แม้ในทฤษฎีความน่าจะเป็นดั้งเดิมที่ P(λ) มีแต่จำนวนบวกเราก็ต้องการ P(E|λ) ที่เป็นบวกเพื่อป้องกันไม่ให้ได้ความน่าจะเป็นที่ติดลบออกมา การวัดแบบนี้ในทฤษฎีควอนตัมเรียกว่า “positive-operator valued measure” หรือ POVM ซึ่งหลากหลายกว่าการวัดแบบฉายทำให้พิสูจน์ทฤษฎีบทของ Gleason ได้ง่ายกว่า

ไอเดียก็คือจากความอิสระในการเลือก POVM เราสามารถขยายฟังก์ชัน P ไปเป็นฟังก์ชันเชิงเส้นในเวกเตอร์สเปซของเมทริกซ์ได้ (ไม่ใช่เฉพาะของ E) และทุกคนรู้ว่าฟังก์ชันเชิงเส้นจากเวกเตอร์สเปซไปยังจำนวนจริงเขียนได้ในรูปของ inner product แต่เมื่อเวกเตอร์ของเราเป็นเมทริกซ์ เราก็ใช้ trace inner product แทน (ไม่ว่า inner product ไหนก็เหมือนกันเพราะเราแปลง “Hermitian form” ของมันให้เป็นเมทริกซ์ทแยงมุมได้)

P = \mbox{Tr}(E\rho)

นั่นคือ Gleason พิสูจน์ว่าจะต้องมี “density matrix”ρ ซึ่งให้ความน่าจะเป็นที่ต้องการออกมาในรูปของ trace inner product ข้างต้น โดย density matrix นั้นอาจจะแทนสถานะที่เรารู้มากที่สุดหรือไม่ก็ได้ เหมือนกับทฤษฎีความน่าจะเป็นที่มีความไม่แน่นอนที่มาจากความรู้ที่ไม่มากที่สุดได้

เราจึงมี density matrix และ POVM เข้ามาในคำอธิบายของทฤษฎีควอนตัม ซึ่งการที่จะเข้าใจสองอย่างนี้ได้จะต้องไปเกินกว่าทฤษฎีควอนตัมของระบบเดี่ยวซึ่งจะทำให้เราได้เห็นธรรมชาติอันเป็นมายาของสถานะควอนตัม: เอนแทงเกิลเมนต์ (entanglement)

อรรถาธิบาย

[1] บางครั้งเราจะได้ยินความพยายามในการพิสูจน์กฎความน่าจะเป็นนี้ในการตีความแบบ Many-Worlds เขาไม่อยากใช้ทฤษฎีบทของ Gleason ก็เพราะในการตีความประเภทนั้นทุกอย่าง deterministic หมด ทฤษฎีควอนตัมไม่ใช่ทฤษฎีความน่าจะเป็นตั้งแต่แรกซึ่งเป็นสิ่งที่เราสมมติในโพสท์นี้
[2] “Maximal information is never complete.” จาก Carlton Caves และ Christopher Fuchs, “Quantum information: How much information in a state vector?” (1996)  
[3] นี่จะเรียกว่าเป็นสโลแกนเฉยๆก็ได้ เราไม่ได้เข้มงวด (rigorous) มากนักเพราะนึกจะเก็บส่วนไหนของทฤษฎีความน่าจะเป็นก็เก็บ นึกจะทิ้งก็ทิ้ง ถ้าจะทำให้เข้มงวดจะต้องหา axioms ที่สอดคล้องกับทั้งทฤษฎีความน่าจะเป็นและทฤษฎีควอนตัมก่อน จากนั้นจึงเติม axiom ที่สอดคล้องกับทฤษฎีควอนตัมแต่ขัดแย้งกับทฤษฎีความน่าจะเป็นอย่างใน Lucien Hardy, “Quantum Theory From Five Reasonable Axioms” (2001) ภาพรวมสั้นๆ ของสิบกว่าปีของความพยายามนี้หาอ่านได้ใน section 2 ของ Lucien Hardy, “Reconstructing quantum theory” (2013)  
[4] K. R. Parthasarathy, An Introduction to Quantum Stochastic Calculus
[5] Paul Busch, “Quantum states and generalized observables: a simple proof of Gleason’s theorem” (2003), Carlton Caves, Christopher Fuchs, Kiran Menne และ Joseph Renes, “Gleason-Type Derivations of the Quantum Probability Rule for Generalized Measurements” (2003)