ทฤษฎีควอนตัมมักจะถูกนำเสนอต่อบุคคลทั่วไปในรูปคอลเลกชันของผลการทดลองและคอนเซปต์ที่ผิดแปลกไปจากตรรกะ อนุภาคอยู่ในสองที่ในเวลาเดียวกัน, เราไม่สามารถวัดตำแหน่งและโมเมนตัมของอนุภาคพร้อมกันได้, การวัดเปลี่ยนพฤติกรรมของสิ่งที่ถูกวัด ฯลฯ ถ้าถามคนทั่วไปว่าควอนตัมคืออะไรก็ไม่แปลกที่จะได้คำตอบว่ามันคืออะไรที่แปลกประหลาดพิศดารน่ะสิ!

ถ้าโชคดี(หรือโชคร้าย?)ได้เรียนทฤษฎีควอนตัมก็จะได้พบ axioms ของทฤษฎีควอนตัม

I. ระบบในทฤษฎีควอนตัมอยู่ในสถานะที่แทนด้วยเวกเตอร์ของจำนวนเชิงซ้อน |\psi \rangle
II. ระบบเปลี่ยนไปในเวลาด้วย “สมการ Schrödinger”

i \hbar \frac{d}{dt}|\psi (t) \rangle = H |\psi (t) \rangle

III. การวัดแทนด้วย “Hermitian operator” X ซึ่งมี “eigenvalue” เป็นผลการวัดที่เป็นไปได้และ “eigenvector” เป็นสถานะหลังการวัด
IV. ค่าเฉลี่ยของการวัด X ในสถานะ |\psi \rangle คือ \langle \psi| X | \psi \rangle
V. หลายระบบประกอบกันด้วย “การคูณเทนเซอร์ (tensor product)”

และหลายคนก็จะถือว่านี่เป็นกฎที่ดลบันดาลมาจากสวรรค์ ควอนตัมคืออะไร? ควอนตัมก็คือผลของ axioms เหล่านี้ถึงจะไม่มีทางเข้าใจได้แต่นำไปใช้ได้ก็พอแล้ว แต่ผมไม่พอใจกับทัศนคตินี้ ถ้าเราไม่รู้ว่าทำไม axiom แต่ละ axiom ถึงควรจะเป็นจริงเราจะรู้ได้อย่างไรเมื่อมันเกิดไม่เป็นจริงขึ้นมา ไม่มีอะไรในฟิสิกส์ดั้งเดิมที่คล้ายคลึงกับ axioms เหล่านี้ [1] ยกเว้น axiom แรกที่ใช้อธิบายสถานะของคลื่นโดยจำนวนเชิงซ้อนแทนทั้ง amplitude และ phase ในฟิสิกส์ดั้งเดิม

ในโพสท์นี้เราจะบอกว่า ลืม axioms II-V ไปซะ เพราะเมื่อใดที่เราใส่ “ความต่อเนื่อง (continuity)” ของ  axiom I ให้กับทฤษฎีความน่าจะเป็นแบบไม่ต่อเนื่อง (discrete) เราก็จะได้ทฤษฎีควอนตัม!

ทฤษฎีความน่าจะเป็น

ทุกคนรู้จักความน่าจะเป็นกันอยู่แล้ว มันเป็นการต่อยอดตรรกะจากที่มีแต่ “จริง” และ “เท็จ” มามี “อาจจะ” เข้าไปด้วย แต่เมื่อเรารู้มากที่สุดเท่าที่จะรู้ได้และไม่หลงเหลือความไม่แน่นอนอีกแล้ว ความน่าจะเป็นก็เป็น 0 หรือ 1 กลับสู่ตรรกะข้างต้นเหมือนเดิม

การกระทำของเราส่งผลต่อความไม่แน่นอนที่เรามีได้อย่างไรบ้าง? ถ้าเรามีเซต X ของเหตุการณ์ที่ไม่สามารถเกิดขึ้นพร้อมกันได้ (mutually exclusive) เราก็จะมีเซตของความน่าจะเป็น P(x), x ∈ X เมื่อเซตนี้เป็นเซตไม่ต่อเนื่อง (discrete) เราก็จะได้ทฤษฎีความน่าจะเป็นที่ไม่ต่อเนื่อง (ในที่นี้เราจะสมมติไปอีกว่าเซตนี้มีขนาดจำกัด (finite) เราสามารถจะไปสู่ continuum limit ได้ถ้าต้องการ) สิ่งที่สามารถทำกับมันได้คือการแปลงด้วยเมทริกซ์ (matrix) P(y|x) ซึ่งบอกความน่าจะเป็นที่ y ∈ X จะเกิดขึ้นเมื่อ x เกิดขึ้นไปแล้วก่อนหน้านี้ด้วยกฎของความน่าจะเป็นทั้งหมด (Law of total probability)

P(y) = \sum_{x \in X} P(y|x) P(x)

โดยจำเป็นจะต้องให้

\sum_{y \in X} P(y|x) = 1

เพื่อให้ P(y) เป็นความน่าจะเป็น นั่นคือถ้า P(x) เป็นเวกเตอร์หลัก (column vector) ตัวเลขในแต่ละหลักของ P(y|x) จะต้องรวมกันได้ 1

จากนั้นความน่าจะเป็นที่จะได้ผล E ∈ χ จากการทำการวัดคือ

P(E) = \sum_{x,y \in X} P(E|y)P(y|x) P(x)

ข้อที่แตกต่างกับการแปลงก็คือแต่ละ E ก็จะมี P(E|λ) ของมันเอง ดังนั้นถ้าให้มันเป็นเมทริกซ์ มันก็จะเป็นเซตของเมทริกซ์ทแยงมุมที่รวมกันได้เป็นเมทริกซ์เอกลักษณ์

\sum_{E \in \chi} P(E|x) = I

เราเรียกเซต {P(E|x)} ว่าการวัด การวัดในลักษณะนี้รวมถึงการวัดที่เราสับสนระหว่างผลการวัดที่แตกต่างกันได้ เช่น แสงในห้องอาจจะสลัวๆทำให้สังเกตได้ไม่ชัด ถ้าไม่มีปัญหาแบบนั้นแต่ละ P(E|x) ก็เป็นเมทริกซ์ที่มี 1 ตำแหน่งเดียวบนแนวทแยงและ 0 ในตำแหน่งอื่นๆทั้งหมด นั่นคือ P(E|x) เป็นเมทริกซ์ที่ทำหน้าที่ฉาย (project) เวกเตอร์ลงบนเวกเตอร์ที่ให้ความน่าจะเป็น 1 สำหรับเหตุการณ์ E และ 0 สำหรับเหตุการณ์อื่น และแต่ละ P(E|x) ตั้งฉาก (orthogonal) ซึ่งกันและกัน

P(E|x)P(E'|x) = 0

เมื่อ E ≠ E’

ท้ายสุดก่อนที่เราจะไปยังทฤษฎีควอนตัม ถ้ามีสองระบบที่ไม่สัมพันธ์กัน (uncorrelated)

\left[\begin{array}{c}p\\1-p\end{array}\right]

และ

\left[\begin{array}{c}q\\1-q\end{array}\right]

เวกเตอร์ความน่าจะเป็นของระบบคู่ก็จะเป็น

\left[\begin{array}{c}pq\\p(1-q)\\(1-p)q\\(1-p)(1-q)\end{array}\right]

เพราะว่าความน่าจะเป็นของสองเหตุการณ์ที่เป็นอิสระต่อกันเป็นผลคูณของความน่าจะเป็นของสองเหตุการณ์นั้น นี่ไม่ใช่อะไรมากไปกว่าการคูณแบบเทนเซอร์ (tensor product) นักเรียนจะขยาดเวลาได้ยินชื่อนี้ครั้งแรก แต่หน้าที่ของมันในทฤษฎีความน่าจะเป็นซึ่งเหมือนกับหน้าที่ในทฤษฎีควอนตัมทุกประการก็แค่เพื่อรวมระบบที่ไม่สัมพันธ์กันเข้าด้วยกันอย่างที่เราทำเมื่อกี้โดยไม่ต้องเอ่ยชื่อมันขึ้นมาเลย

ทฤษฎีควอนตัม

เราคุ้นเคยกับความจริงที่ว่าความไม่แน่นอนจากความไม่รู้ของเราไม่ได้แปลว่าสิ่งที่เราไม่รู้มีความไม่แน่นอนในตัวมันเอง การที่เราไม่รู้ผลของการแข่งกีฬาที่ผ่านไปแล้วไม่ได้หมายความมันยังแข่งไม่เสร็จ เพียงแต่เราไม่รู้เท่านั้นเอง แต่ในทางกลับกันเราเชื่อว่าหากเรารู้ทุกอย่างเท่าที่จะรู้ได้แล้ว ความน่าจะเป็นของทุกๆเหตุการณ์ก็จะเป็น 0 หรือ 1 เท่านั้นและไม่มีความไม่แน่นอนหลงเหลืออยู่ในการวัดใดๆก็ตาม เราจะขอแยกแยะและเรียกความรู้ที่รู้ทุกอย่างเท่าที่จะรู้ได้ว่าความรู้ที่มากที่สุด ในขณะที่ความรู้ที่สมบูรณ์ทำให้ความน่าจะเป็นของทุกๆเหตุการณ์เป็น 0 หรือ 1 เท่านั้น

เวลาเราพูดถึงการเปลี่ยนแปลงของระบบใดระบบหนึ่ง จริงๆแล้วเราพูดถึงการเปลี่ยนแปลงของความรู้ที่มากที่สุด(ของเรา)เกี่ยวกับระบบนั้น เราจึงพูดได้ว่าในฟิสิกส์เราค้นหากฏการเปลี่ยนแปลงไปในเวลาของความรู้ที่มากที่สุดซึ่งต้องเปลี่ยนแปลงอย่างต่อเนื่องเพราะเวลาเป็นปริมาณที่ต่อเนื่อง แต่ในทฤษฎีความน่าจะเป็นแบบไม่ต่อเนื่องเราไม่มีการเปลี่ยนแปลงอย่างต่อเนื่องที่จะนำสถานะของความรู้ที่มากที่สุด

\left[\begin{array}{c} 1 \\ 0 \end{array}\right]

ไปสู่อีกสถานะของความรู้ที่มากที่สุด

\left[\begin{array}{c} 0 \\ 1 \end{array}\right]

หรือกลับกันโดยไม่ผ่านสถานะที่เรามีความไม่แน่นอนเกี่ยวกับระบบได้ จึงได้ฤกษ์อัญเชิญ axiom I ขึ้นมา เราทราบจากฟิสิกส์ดั้งเดิมของคลื่นแล้วว่าทุกๆสถานะของโพลาไรเซชันของแสงเป็นผลบวกทางเวกเตอร์ของสองเวกเตอร์ของจำนวนเชิงซ้อนเท่านั้น ซึ่งเราจะเลือกสองเวกเตอร์ไหนก็ได้ ในภาษาพีชคณิตเชิงเส้น (linear algebra) สองเวกเตอร์นี้เรียกว่าเบสิส (basis) จะเป็นโพลาไรเซชันแนวตั้งกับแนวนอนหรือโพลาไรเซชันที่หมุนตามเข็มหรือทวนเข็มนาฬิกาก็ตามใจ

เราจึงประกาศให้สองเวกเตอร์ข้างต้นเป็นเบสิส และ

a\left[\begin{array}{c} 1 \\ 0 \end{array}\right] +b\left[\begin{array}{c} 0 \\ 1 \end{array}\right]

เป็นสถานะที่รู้ทุกอย่างเท่าที่จะรู้ได้แล้วเกี่ยวกับระบบ a และ b เป็นจำนวนเชิงซ้อนใดๆก็ได้ จะเป็นจำนวนจริงก็ได้ จะติดลบก็ได้! เราได้ทฤษฎีความน่าจะเป็นที่เป็นประชาธิปไตยมากกว่าเดิม ในทฤษฎีความน่าจะเป็นดั้งเดิมมีสองเวกเตอร์ที่ได้รับอภิสิทธิ์เหนือใคร เพราะเวกเตอร์จะเป็นเวกเตอร์ความน่าจะเป็นได้ก็ต่อเมื่อมันมีสัมประสิทธิ์เป็นบวกเมื่อใช้สองเวกเตอร์นี้เป็นเบสิสในขณะที่ axiom I ทำให้ทุกเวกเตอร์มีความเท่าเทียมกันหมด

มันเสียเวลาที่จะเขียนเวกเตอร์แถวหรือหลักโดยการลิสต์ตัวเลขทุกๆตำแหน่งของเวกเตอร์ตลอดเวลา นักฟิสิกส์จึงบอกให้รู้ว่าสิ่งที่เขียนนั้นเป็นเวกเตอร์โดยการครอบสัญลักษณ์อะไรก็ได้ที่ label เวกเตอร์ระหว่างเส้นแนวตั้งกับหัวลูกศร โดยข้อตกลงทั่วไปคือถ้าชี้ขวาเป็นเวกเตอร์หลัก (column vector) | \psi \rangle เรียกว่า “ket” (เค็ต) ถ้าชี้ซ้ายเป็นเวกเตอร์แถว (row vector) \langle \psi | (ที่ได้จากการสลับแถวกับหลักของ |\psi \rangle แล้ว complex conjugate ทุกตำแหน่ง) เรียกว่า “bra” (บรา) (การใช้เครื่องหมายมากกว่า > หรือน้อยกว่า < เป็นหัวลูกศรเป็นบาปหนัก ตายไปแล้วจะตกนรก LaTeX ชั้นที่แปด) เพราะเมื่อเอามันมาคูณกันตามหลักการคูณเมทริกซ์แล้วจะได้ inner product “bracket” ซึ่งเป็นตัวเลข

บราแคทโดย Sabine Hossenfelder

 

ในขณะที่ “ket-bra” |\psi\rangle \langle \varphi | เป็นเมทริกซ์

คำติดปากที่นักฟิสิกส์ใช้เรียกสถานะที่เขียนได้เป็นผลบวกของเวกเตอร์ |\psi \rangle = |\varphi \rangle + |\chi \rangle ก็คือ |\psi \rangle เป็นซูเปอร์โพสิชัน (superposition) ของ |\varphi \rangle และ | \chi \rangle คำศัพท์ที่ตกทอดมาจากฟิสิกส์ของคลื่นที่สามารถซ้อนทับ (superpose) กันได้

คำเตือนหนึ่งในการใช้คำว่าสถานะซูเปอร์โพสิชันก็คือมันขึ้นอยู่กับเบสิสที่เราเลือก ทุกๆสถานะควอนตัมเป็นซูเปอร์โพสิชันของเซตของเวกเตอร์ที่เป็นเบสิสเบสิสใดเบสิสหนึ่งเสมอ จึงไม่มีความหมายที่จะพูดว่าสถานะที่เรามีเป็นสถานะซูเปอร์โพสิชันหรือไม่ถ้าไม่ได้เจาะจงเบสิสลงไป

แต่สถานะซูเปอร์โพสิชันในควอนตัมมีความหมายอะไรทางฟิสิกส์? สมมติถ้าเราเอาเวกเตอร์ของแมวมารวมกับเวกเตอร์ของบรา เวกเตอร์แทนสถานะของความรู้ที่มากที่สุดซึ่งก็คือสถานะของความรู้ที่รู้ทุกอย่างเท่าที่จะรู้ได้ ดังนั้นสถานะซูเปอร์โพสิชันของแมวกับบราจึงไม่ใช่สถานะของความไม่แน่นอนที่เราอาจจะสังเกตแล้วเจอแมวหรือบราได้ ดังเช่นในกรณีของโพลาไรเซชันของแสง, โพลาไรเซชันแบบหมุนซึ่งเป็นซูเปอร์โพสิชันของโพลาไรเซชันแนวตั้งกับแนวนอนนั้นต่างกับโพลาไรเซชันแนวตั้งหรือแนวนอนและไม่ใช่ความไม่แน่นอนที่จะเห็น โพลาไรเซชันไม่แนวตั้งก็แนวนอนซึ่งจะเป็นแสงที่โพลาไรซ์บางส่วนหรือไม่โพลาไรซ์แทน ดังนั้นซูเปอร์โพสิชันของแมวและบราก็อาจจะเป็น

(หรือแมวกับบราอาจจะรวมกันไม่ได้ด้วยเหตุผลเดียวกับที่โบซอน (boson) และเฟอร์มิออน (fermion) รวมกันไม่ได้) แต่ประเด็นที่เกี่ยวข้องกับเราในตอนนี้ก็คือเราสมมติว่าเมื่อไรก็ตามที่เรามีเซตของเวกเตอร์ของสถานะของความรู้มากที่สุดที่ตั้งฉากกัน กล่าวคือเซตของสถานะความรู้มีความสัมพันธ์หนึ่งต่อหนึ่งกับเซตของเหตุการณ์ที่เกิดขึ้นพร้อมกันไม่ได้ เราสามารถทำการวัดที่จะแยกแยะมันได้ อย่างในควอนตัมบิท, ระบบควอนตัมที่มีเหตุการณ์ที่เกิดขึ้นพร้อมกันไม่ได้อย่างมาก 2 เหตุการณ์ (แทนด้วยเวกเตอร์ที่ตั้งฉากกัน), เรียกว่า |0\rangle กับ |1\rangle , ถ้าเราสามารถทำการวัดเพื่อแยกแยะ |0\rangle กับ |1\rangle ได้เราก็แยกแยะ |0\rangle +|1\rangle กับ |0\rangle - |1\rangle หรือ |0\rangle +i|1\rangle กับ |0\rangle - i|1\rangle ได้ ซึ่งเป็นสมมติฐานภายใต้ทฤษฎีบทของ Gleason

ทฤษฎีบทของ Gleason และการวัด

Andrew M. Gleason (1921-2008) บอกว่าเราจะคำนวณความน่าจะเป็นจากการวัดในทฤษฎีความน่าจะเป็นแบบใหม่นี้ได้อย่างไร ในปี 1957, Gleason พิสูจน์ว่าถ้าเรามีการวัดที่ให้ผลแน่นอนซึ่งแทนด้วยเซตของเมทริกซ์การฉาย {E} ที่ตั้งฉากซึ่งกันและกัน หากมีฟังก์ชัน P ที่ให้ความน่าจะเป็น (ตัวเลขที่มีค่าได้ตั้งแต่ 0 ถึง 1) ของผล j ซึ่งขึ้นอยู่กับ Ej เท่านั้น โดยเฉพาะว่า P ไม่ขึ้นกับสมาชิกอื่นๆ Ek ≠ j ของการวัด และ P มีพฤติกรรมเหมือน P(E) ในทฤษฎีความน่าจะเป็นดั้งเดิมดั้งต่อไปนี้

I. ความน่าจะเป็นที่จะไม่มีผลการวัดเป็น 0

P(0) = 0

II. ความน่าจะเป็นที่จะได้ผลสักผลเป็น 1

P(I) = 1

(I คือเมทริกซ์เอกลักษณ์ เราให้เซต {E} มีเมทริกซ์การฉายทั้งหมดที่เป็นไปได้ ดังนั้นจะต้องมีสักเซตย่อยที่รวมกันได้เมทริกซ์เอกลักษณ์)

III. ความน่าจะเป็นที่ j และ k จะเกิดขึ้นเป็นผลบวกของความน่าจะเป็นของ j และของ k เมื่อ j และ k ไม่สามารถเกิดขึ้นพร้อมกันได้

E_j E_k =0 \implies P(E_j+E_k) = P(E_j) + P(E_k)

P จะต้องให้ความน่าจะเป็นตามทฤษฎีควอนตัม! นั่นคือความน่าจะเป็นที่จะได้ผล Ej ในสถานะที่รู้มากที่สุดเท่าที่จะรู้ได้ |\psi\rangle คำนวณได้จาก

P( j | \psi ) = \langle \psi|E_j|\psi \rangle

[2] ทฤษฎีบทของ Gleason ไม่ต้องสมมติความต่อเนื่อง (continuity) ของ P หรืออะไรอย่างอื่นอีกเลย (แต่ทฤษฎีบทที่ Gleason พิสูจน์ใช้ไม่ได้ใน 2 มิติ! ผมได้เขียนอธิบายไว้แล้วว่าทำไมและมีทางแก้ไขทฤษฎีบทนี้ได้อย่างไร)

ณ จุดนี้จะเห็นได้ว่าทำไมเราถึงแยะแยะความรู้ที่มากที่สุดและความรู้ที่สมบูรณ์ ในสถานะที่รู้มากที่สุดเท่าที่จะรู้ได้ |\psi \rangle ถ้าเราทำการวัดด้วย |\psi \rangle \langle \psi | ที่ฉายลงบนตัวมันเองเราก็จะได้ผลที่แน่นอน, |\psi \rangle ด้วยความน่าจะเป็น 1 แต่ทันทีที่เราทำการวัดนอกเหนือจากนี้ (ซึ่งมีให้เลือกจำนวนนับไม่ถ้วน เราสามารถฉายไปบนสถานะ |\varphi \rangle \langle \varphi | ไหนก็ได้ ) เราจะทำนายได้เพียงความน่าจะเป็นที่จะได้ผลการวัดใดผลการวัดหนึ่ง

P(\varphi | \psi) = |\langle \varphi | \psi \rangle |^2

ดังนั้นในทฤษฎีควอนตัม, ความรู้ที่มากที่สุดไม่มีทางสมบูรณ์ [3] สถานะของความรู้ที่มากที่สุดในทฤษฎีควอนตัมทำตัวเหมือนความน่าจะเป็นที่มีความไม่แน่นอนมากกว่า

การคำนวณความน่าจะเป็นด้วยการ “ยกกำลังสอง” นี้คือสิ่งที่ Max Born (1882-1970) เขียนเป็นครั้งแรกในปี 1926 ในเชิงอรรถของเปเปอร์ (แถมที่จริงเขียนผิดไม่มีกำลังสองอีกตะหาก!)

กฏการคำนวณความน่าจะเป็นนี้เทียบเท่ากับบางส่วนของ axioms III และ IV ที่บอกว่า

III. การวัดแทนด้วย “Hermitian operator” X ซึ่งมี “eigenvalue” เป็นผลการวัดที่เป็นไปได้และ “eigenvector” เป็นสถานะหลังการวัด
IV. ค่าเฉลี่ยของการวัด X ในสถานะ |\psi \rangle คือ \langle \psi| X | \psi \rangle

เพราะการคำนวณค่าเฉลี่ยของผลการวัด xj เท่ากับการนิยามเมทริกซ์ X = ∑j xj Eขึ้นมา

\sum_j x_j \langle \psi |E_j|\psi \rangle = \langle \psi | \left( \sum_j x_j E_j \right) |\psi \rangle = \langle \psi |X|\psi \rangle

แต่ X จะเป็นเมทริกซ์ Hermitian ก็ต่อเมื่อ xj เป็นจำนวนจริงเท่านั้น ซึ่งไม่มีความจำเป็น สิ่งที่จำเป็นคือมันต้องเป็นเมทริกซ์ที่แปลงเป็นเมทริกซ์ทแยงมุมได้ถึงจะแตกกลับเป็น ∑j xj Eได้ ในทางกลับกันกฎการหาค่าเฉลี่ยก็เพียงพอที่จะให้ความน่าจะเป็นกับเราได้เพราะถ้าเรานิยาม X = ∑j xj Ej ให้หนึ่งใน xเป็น 1 และที่เหลือเป็น 0 เมื่อเราคำนวณค่าเฉลี่ยของ X ก็จะได้ความน่าจะเป็นที่จะได้ผล Ej แทน (ในมิติอนันต์ที่ทำอย่างนี้ไม่ได้ก็อาศัยว่าเรารู้การแจกแจงความน่าจะเป็นได้ถ้าเรารู้ทุกๆโมเมนต์ (moment) \langle \psi |X|\psi \rangle,\langle \psi |X^2|\psi \rangle …, ของมัน)

สมการ Schrödinger

ผลพลอยได้จากการรู้กฎการคำนวณความน่าจะเป็นก็คือกฎการแปลงความน่าจะเป็น ในการฉาย |\psi \rangle ลงบนตัวมันเอง,

|\langle \psi|\psi \rangle |^2 = 1

จากพีชคณิตเชิงเส้นเรารู้แล้วว่าการแปลงด้วยเมทริกซ์ unitary U

U^{\dagger} U = UU^{\dagger} = I

อนุรักษ์ปริมาณ |\langle \psi|\psi \rangle |^2 นี้แสดงว่ามันเป็นการแปลงที่อนุรักษ์ความน่าจะเป็นในทฤษฎีควอนตัม สิ่งที่ Eugene Wigner (1902-1995) พิสูจน์ (หมอนี่พิสูจน์หลายอย่างมากจนได้รางวัลโนเบล) คือการแปลงที่ต่อเนื่อง(ที่เราต้องการ)ที่รักษาปริมาณนี้จะต้องเป็นเมทริกซ์ unitary โดยไม่ต้องสมมติว่าเป็นการแปลงเชิงเส้นด้วยซ้ำ

และนี่คือวิธี derive สมการ Schrödinger ถ้ายังไม่เคยเห็น: เขียน U ในรูป exponential ของเมทริกซ์ Hermitian

U = e^{-iHt/\hbar},

เมื่อไรก็ตามที่ U และ H เขียนในรูปเมทริกซ์ทแยงมุมได้ (ซึ่งเขียนได้เพราะทั้งคู่เป็นเมทริกซ์ normal), exponential ของเมทริกซ์คือเมทริกซ์ทแยงมุมที่มี exponential (ในที่นี้ e-iEt/ħ เมื่อ E เป็น eigenvalue ของ H) บนแนวทแยง และ ħ (“h-บาร์”)คือค่าคงที่ของ Planck ที่มีหน่วยพลังงาน × เวลาเพื่อตัดกับหน่วยของ H กับ t ที่เราจะให้เป็นพลังงานและเวลาตามลำดับ

เราก็หาอนุพันธ์ของมัน

\begin{aligned} i\hbar \frac{d}{dt} U &= H U \\ i\hbar \left(\frac{d}{dt} U \right)|\psi (0)\rangle &= H U |\psi (0) \rangle \\ i\hbar \frac{d}{dt} |\psi (t)\rangle &= H |\psi (t)\rangle \end{aligned}

และก็จะได้

II. ระบบเปลี่ยนไปในเวลาด้วย “สมการ Schrödinger”

ออกมา

สมการที่ Erwin Schrödinger (1887-1961) เขียนเป็นครั้งแรกในปี 1925-26 ใช้ไม่ได้ในมิติที่มีขอบเขต (finite) และตอนนั้น Schrödinger ยังไม่รู้ด้วยซ้ำว่ามันเป็นสมการของความน่าจะเป็นและนึกว่าเป็นสมการของคลื่นสสารอะไรบางอย่าง

Where Do We Stand?

สิ่งที่มีแล้วในทฤษฎีควอนตัมของเราตอนนี้คือ

I. สถานะของความรู้ที่มากที่สุดในทฤษฎีควอนตัมแทนด้วยเวกเตอร์ของจำนวนเชิงซ้อน
II. การเปลี่ยนสถานะของความรู้ที่มากที่สุดไปในเวลาเป็นไปตามสมการ Schrödinger
III. การวัดแทนด้วยเซตของเมทริกซ์การฉาย {E} ที่ตั้งฉากซึ่งกันและกัน
IV. ความน่าจะเป็นที่จะได้ผลการวัด j ในสถานะ |\psi \rangle  คือ \langle \psi|E_j|\psi \rangle
V. หลายระบบประกอบกันด้วยการคูณแบบเทนเซอร์

และเราไม่จำเป็นต้องถือ 5 ข้อนี้เป็น axioms อีกต่อไปแล้วเพราะเราเห็นแล้วว่า II-V มาจากเพียง axiom เดียว [4]

ทฤษฎีควอนตัมคือทฤษฎีความน่าจะเป็นซึ่งใช้เวกเตอร์ของจำนวนเชิงซ้อนแทนสถานะของความรู้ที่มากที่สุด

ณ จุดนี้ยังไม่มีอะไรที่บอกเราเกี่ยวกับสถานะหลังการวัด และในความเป็นจริงแล้วมันไม่จริงที่ว่าการวัดที่สำเร็จจะปล่อยให้ระบบอยู่ในสถานะที่เราวัดได้เสมอไป เช่น ในการวัดว่ามีโฟตอน (photon) ของแสงหรือไม่ ถ้าเครื่องมือวัดดูดซับโฟตอนไปไม่ว่าจะมีโฟตอนอยู่ก่อนหน้าหรือไม่ก็จะไม่เหลือโฟตอนหลังการวัด

เราจึงตกอยู่ในสถานการณ์ที่น่าสนใจ เราเริ่มต้นจากการพยายามค้นหาความเข้าใจของ “axioms” ของทฤษฎีควอนตัมที่มีในหนังสือเรียนทั่วไป แต่กลับพบว่าบาง “axiom” ก็ต้องมีการเพิ่มเติมเปลี่ยนแปลง บาง “axiom” ก็ไม่จำเป็นจะต้องเป็นจริง

 

อรรถาธิบาย

[1] สมการ Schrödinger ใกล้เคียงกับสมการ Hamilton-Jacobi ในฟิสิกส์ดั้งเดิมซึ่งเป็นสมการสำคัญในการตีความทฤษฎีควอนตัมแบบ Bohm ด้วย แต่เราจะถือว่าไม่มีใครรู้จักแล้วกัน ที่แน่ๆมันยากกว่า approach สู่ทฤษฎีควอนตัมที่เราจะนำเสนอเยอะ 
[2] บางครั้งเราจะได้ยินความพยายามในการพิสูจน์กฎความน่าจะเป็นนี้ในการตีความแบบ Many-Worlds เขาไม่อยากใช้ทฤษฎีบทของ Gleason ก็เพราะในการตีความประเภทนั้นทุกอย่าง deterministic หมด ทฤษฎีควอนตัมไม่ใช่ทฤษฎีความน่าจะเป็นตั้งแต่แรกซึ่งเป็นสิ่งที่เราสมมติในโพสท์นี้
[3] “Maximal information is never complete.” จาก Carlton Caves และ Christopher Fuchs, “Quantum information: How much information in a state vector?” (1996)  
[4] นี่จะเรียกว่าเป็นสโลแกนเฉยๆก็ได้ เราไม่ได้เข้มงวด (rigorous) มากนักเพราะนึกจะเก็บส่วนไหนของทฤษฎีความน่าจะเป็นก็เก็บ นึกจะทิ้งก็ทิ้ง ถ้าจะทำให้เข้มงวดจะต้องหา axioms ที่สอดคล้องกับทั้งทฤษฎีความน่าจะเป็นและทฤษฎีควอนตัมก่อน จากนั้นจึงเติม axiom ที่สอดคล้องกับทฤษฎีควอนตัมแต่ขัดแย้งกับทฤษฎีความน่าจะเป็นอย่างใน Lucien Hardy, “Quantum Theory From Five Reasonable Axioms” (2001) ภาพรวมสั้นๆ ของสิบกว่าปีของความพยายามนี้หาอ่านได้ใน section 2 ของ Lucien Hardy, “Reconstructing quantum theory” (2013)