ทฤษฎีควอนตัมในฐานะทฤษฎีความน่าจะเป็น

ในโพสท์ก่อนเราพูดถึง axiom หรือชุดความจริงพื้นฐานที่เราหวังว่าจะใช้พิสูจน์ความจริงทั้งหมดได้ (ซึ่งเราพบว่าไม่สามารถทำได้) ในทางคณิตศาสตร์ โพสท์นี้จะนำเข้าสู่ทฤษฎีควอนตัมเพื่อเริ่มค้นหา “ความเข้าใจทฤษฎีควอนตัมและควอนตัมคอมพิวเตอร์… ซึ่งเมื่อคุณเข้าใจแล้วก็จะมองวิทยาศาสตร์และศาสนาเทียมที่อ้างทฤษฎีควอนตัมแบบผิดๆออก” โดยการอุ่นเครื่องเพื่อนำไปสู่ความเห็นที่ว่าทฤษฎีควอนตัมมาจากการเปลี่ยนแปลงทฤษฎีความน่าจะเป็นเพียงแค่ที่จุดจุดเดียวเท่านั้น

“If you want to learn about nature, to appreciate nature, it is necessary to understand the language that she speaks in.”

Richard Feynman

มันมีประโยชน์ไหมที่จะพูดถึง axiom ในฟิสิกส์? ในฟิสิกส์ดั้งเดิมเรามีกฎ Newton, สมการ Maxwell และกฎอุณหพลศาสตร์เป็นหลักแต่มันก็ยังต้องใช้ความจริงของธรรมชาติมากมายที่อธิบายไม่ได้จนกว่าจะค้นพบทฤษฎีของกาลอวกาศ – สัมพัทธภาพ – และทฤษฎีของทุกสิ่งที่นอกเหนือกาลอวกาศ – ควอนตัม เยี่ยม! ที่เหลือก็แค่เขียน axioms ของทฤษฎีทั้งสองนี้ แต่ขณะที่กำลังพยายามเขียน axioms อยู่ก็เจอกับ

standard_model_lagrangian

นี่คือ “Lagrangian ของ  standard model” ที่ให้สมการการเคลื่อนที่กับอนุภาคทุกชนิดที่เรารู้จักที่คนพิมพ์บอกว่าใช้เวลาพิมพ์ 4 ชั่วโมงและอาจจะมีเครื่องหมายบวกลบที่ผิด มันเขียนใน “ภาษา” ของทฤษฎีควอนตัมและสัมพัทธภาพแต่โครงสร้างของทั้งสองทฤษฎีเองไม่ได้ทำนายทุกส่วนของมัน ส่วนที่ทำนายไม่ได้ก็เป็น input เพิ่มเติมจากการสังเกต

ดังนั้นผมจะไม่พยายามที่จะเขียน axioms ของความเป็นจริงซึ่งเกินไปกว่าจุดมุ่งหมายของบล็อกนี้อยู่แล้ว เราต้องการแค่ axioms ของทฤษฎีควอนตัมซึ่งเป็นตัวกำหนด “แกรมมาร์” ของภาษาควอนตัม ซึ่งถ้าพูดได้ก็จะสื่อสารกับธรรมชาติในระดับที่ลึกซึ้งที่สุดได้

ทฤษฎีควอนตัม: เทค 1

Axioms ของทฤษฎีควอนตัมที่ทุกคนรู้ตั้งแต่อนุบาลแล้วคือ

I. ระบบในทฤษฎีควอนตัมอยู่ในสถานะที่แทนด้วยเวกเตอร์ของจำนวนเชิงซ้อน |\psi \rangle
II. ระบบเปลี่ยนไปในเวลาด้วย “สมการ Schrödinger”

i \hbar \frac{d}{dt}|\psi (t) \rangle = H |\psi (t) \rangle

III. การวัดแทนด้วย “Hermitian operator” X ซึ่งมี “eigenvalue” เป็นผลการวัดที่เป็นไปได้และ “eigenvector” เป็นสถานะหลังการวัด
IV. ค่าเฉลี่ยของการวัด X ในสถานะ |\psi \rangle คือ \langle \psi| X | \psi \rangle
V. หลายระบบประกอบกันด้วย “การคูณเทนเซอร์ (tensor product)”

แต่แน่นอนว่าทุกคนลืมไปแล้วว่าเคยเรียนมาเพราะมันไม่น่าจำเอาซะเลย บอกได้ยากว่าทำไม axioms ทั้งหมดนี้จึงควรจะเป็นจริง ไม่มีอะไรในฟิสิกส์ดั้งเดิมที่คล้ายคลึงกับ axioms เหล่านี้ [1] ยกเว้น axiom แรกที่ใช้อธิบายสถานะของคลื่นโดยจำนวนเชิงซ้อนแทนทั้ง amplitude และ phase ในฟิสิกส์ดั้งเดิม

ในโพสท์นี้เราจะบอกว่า ลืม axioms II-V ไปซะ เพราะเมื่อใดที่เราใส่ “ความต่อเนื่อง (continuity)” ของ  axiom I ให้กับทฤษฎีความน่าจะเป็นแบบไม่ต่อเนื่อง (discrete) เราก็จะได้ทฤษฎีควอนตัม!

ทฤษฎีความน่าจะเป็นแบบไม่ต่อเนื่อง

ทุกคนรู้จักความน่าจะเป็นกันอยู่แล้ว มันเป็นการต่อยอดตรรกะจากที่มีแต่ “จริง” และ “เท็จ” มามี “อาจจะ” เข้าไปด้วย แต่เมื่อเรารู้มากที่สุดเท่าที่จะรู้ได้และไม่หลงเหลือความไม่แน่นอนอีกแล้ว ความน่าจะเป็นก็เป็น 0 หรือ 1 กลับสู่ตรรกะข้างต้นเหมือนเดิม

การกระทำของเราส่งผลต่อความไม่แน่นอนที่เรามีได้อย่างไรบ้าง? ถ้าเรามีเซต Λ ของเหตุการณ์ที่ไม่สามารถเกิดขึ้นพร้อมกันได้ (mutually exclusive) เราก็จะมีเซตของความน่าจะเป็น P(λ), λ ∈ Λ สิ่งที่สามารถทำกับมันได้คือการแปลงด้วยเมทริกซ์ (matrix) P(λ’|λ) ซึ่งบอกความน่าจะเป็นที่ λ’ จะเกิดขึ้นเมื่อ λ เกิดขึ้นไปแล้วก่อนหน้านี้ด้วยกฎของความน่าจะเป็นทั้งหมด (Law of total probability)

P(\lambda') = \sum_{\lambda \in \Lambda} P(\lambda'|\lambda) P(\lambda)

โดยจำเป็นจะต้องให้

\sum_{\lambda' \in \Lambda'} P(\lambda'|\lambda) = 1

เพื่อให้ P(λ’) เป็นความน่าจะเป็น นั่นคือถ้า P(λ) เป็นเวกเตอร์หลัก (column vector) ตัวเลขในแต่ละหลักของ P(λ’|λ) จะต้องรวมกันได้ 1

จากนั้นความน่าจะเป็นที่จะได้ผล E ∈ χ จากการทำการวัดคือ

P(E) = \sum_{\lambda \in \Lambda,\lambda' \in \Lambda'} P(E|\lambda')P(\lambda'|\lambda) P(\lambda)

ข้อที่แตกต่างกับการแปลงก็คือแต่ละ E ก็จะมี P(E|λ) ของมันเอง ดังนั้นถ้าให้มันเป็นเมทริกซ์ มันก็จะเป็นเซตของเมทริกซ์ทแยงมุมที่รวมกันได้เป็นเมทริกซ์เอกลักษณ์

\sum_{E \in \chi} P(E|\lambda) = I

เราเรียกเซต {P(E|λ)} ว่าการวัด การวัดในลักษณะนี้รวมถึงการวัดที่เราสับสนระหว่างผลการวัดที่แตกต่างกันได้ เช่น แสงในห้องอาจจะสลัวๆทำให้สังเกตได้ไม่ชัด ถ้าไม่มีปัญหาแบบนั้นแต่ละ P(E|λ) ก็เป็นเมทริกซ์ที่มี 1 ตำแหน่งเดียวบนแนวทแยงและ 0 ในตำแหน่งอื่นๆทั้งหมด นั่นคือ P(E|λ) เป็นเมทริกซ์ที่ทำหน้าที่ฉาย (project) เวกเตอร์ลงบนเวกเตอร์ที่ให้ความน่าจะเป็น 1 สำหรับเหตุการณ์ E และ 0 สำหรับเหตุการณ์อื่น และแต่ละ P(E|λ) ตั้งฉาก (orthogonal) ซึ่งกันและกัน

P(E|\lambda)P(E'|\lambda) = 0

เมื่อ E ≠ E’

ท้ายสุดก่อนที่เราจะไปยังทฤษฎีควอนตัม ถ้ามีสองระบบที่ไม่สัมพันธ์กัน (uncorrelated)

\left[\begin{array}{c}p\\1-p\end{array}\right]

และ

\left[\begin{array}{c}q\\1-q\end{array}\right]

เวกเตอร์ความน่าจะเป็นของระบบคู่ก็จะเป็น

\left[\begin{array}{c}pq\\p(1-q)\\(1-p)q\\(1-p)(1-q)\end{array}\right]

เพราะว่าความน่าจะเป็นของสองเหตุการณ์ที่เป็นอิสระต่อกันเป็นผลคูณของความน่าจะเป็นของสองเหตุการณ์นั้น นี่ไม่ใช่อะไรมากไปกว่าการคูณแบบเทนเซอร์ (tensor product) นักเรียนจะขยาดเวลาได้ยินชื่อนี้ครั้งแรก แต่หน้าที่ของมันในทฤษฎีความน่าจะเป็นซึ่งเหมือนกับหน้าที่ในทฤษฎีควอนตัมทุกประการก็แค่เพื่อรวมระบบที่ไม่สัมพันธ์กันเข้าด้วยกันอย่างที่เราทำเมื่อกี้โดยไม่ต้องเอ่ยชื่อมันขึ้นมาเลย

ทฤษฎีควอนตัม: เทค 2

เราคุ้นเคยกับความจริงที่ว่าความไม่แน่นอนจากความไม่รู้ของเราไม่ได้แปลว่าสิ่งที่เราไม่รู้มีความไม่แน่นอนในตัวมันเอง การที่เราไม่รู้ผลของการแข่งกีฬาที่ผ่านไปแล้วไม่ได้หมายความมันยังแข่งไม่เสร็จ เพียงแต่เราไม่รู้เท่านั้นเอง แต่ในทางกลับกันเราเชื่อว่าหากเรารู้ทุกอย่างเท่าที่จะรู้ได้แล้ว ความน่าจะเป็นของทุกๆเหตุการณ์ก็จะเป็น 0 หรือ 1 เท่านั้นและไม่มีความไม่แน่นอนหลงเหลืออยู่ในการวัดใดๆก็ตาม เราจะขอแยกแยะและเรียกความรู้ที่รู้ทุกอย่างเท่าที่จะรู้ได้ว่าความรู้ที่มากที่สุด ในขณะที่ความรู้ที่สมบูรณ์ทำให้ความน่าจะเป็นของทุกๆเหตุการณ์เป็น 0 หรือ 1 เท่านั้น

เวลาเราพูดถึงการเปลี่ยนแปลงของระบบใดระบบหนึ่ง จริงๆแล้วเราพูดถึงการเปลี่ยนแปลงของความรู้ที่มากที่สุด(ของเรา)เกี่ยวกับระบบนั้น เราจึงพูดได้ว่าในฟิสิกส์เราค้นหากฏการเปลี่ยนแปลงไปในเวลาของความรู้ที่มากที่สุดซึ่งต้องเปลี่ยนแปลงอย่างต่อเนื่องเพราะเวลาเป็นปริมาณที่ต่อเนื่อง แต่ในทฤษฎีความน่าจะเป็นแบบไม่ต่อเนื่องเราไม่มีการเปลี่ยนแปลงอย่างต่อเนื่องที่จะนำสถานะของความรู้ที่มากที่สุด

\left[\begin{array}{c} 1 \\ 0 \end{array}\right]

ไปสู่อีกสถานะของความรู้ที่มากที่สุด

\left[\begin{array}{c} 0 \\ 1 \end{array}\right]

หรือกลับกันโดยไม่ผ่านสถานะที่เรามีความไม่แน่นอนเกี่ยวกับระบบได้ จึงได้ฤกษ์อัญเชิญ axiom I เราทราบจากฟิสิกส์ดั้งเดิมของคลื่นแล้วว่าทุกๆสถานะของโพลาไรเซชันของแสงเป็นผลบวกทางเวกเตอร์ของสองเวกเตอร์ของจำนวนเชิงซ้อนเท่านั้น ซึ่งเราจะเลือกสองเวกเตอร์ไหนก็ได้ ในภาษาพีชคณิตเชิงเส้น (linear algebra) สองเวกเตอร์นี้เรียกว่าเบสิส (basis) จะเป็นโพลาไรเซชันแนวตั้งกับแนวนอนหรือโพลาไรเซชันที่หมุนตามเข็มหรือทวนเข็มนาฬิกาก็ตามใจ

เราจึงประกาศให้สองเวกเตอร์ข้างต้นเป็นเบสิส และ

a\left[\begin{array}{c} 1 \\ 0 \end{array}\right] +b\left[\begin{array}{c} 0 \\ 1 \end{array}\right]

เป็นสถานะที่รู้ทุกอย่างเท่าที่จะรู้ได้แล้วเกี่ยวกับระบบ a และ b เป็นจำนวนเชิงซ้อนใดๆก็ได้ จะเป็นจำนวนจริงก็ได้ จะติดลบก็ได้! เราได้ทฤษฎีความน่าจะเป็นที่เป็นประชาธิปไตยมากกว่าเดิม ในทฤษฎีความน่าจะเป็นดั้งเดิมมีสองเวกเตอร์ที่ได้รับอภิสิทธิ์เหนือใคร เพราะเวกเตอร์จะเป็นเวกเตอร์ความน่าจะเป็นได้ก็ต่อเมื่อมันมีสัมประสิทธิ์เป็นบวกเมื่อใช้สองเวกเตอร์นี้เป็นเบสิสในขณะที่ axiom I ทำให้ทุกเวกเตอร์มีความเท่าเทียมกันหมด

ในโพสท์หน้าเราจะมาดูกันว่าจากจุดนี้ทฤษฎีบทของ Gleason และ Wigner ให้และไม่ให้ axioms II, III และ IV ได้อย่างไร พร้อมทั้งบอกใบ้วิธีการแก้ไขและขยาย axioms เหล่านี้ และทำไมในทฤษฎีความน่าจะเป็นแบบใหม่นี้, ความรู้ที่มากที่สุดจึงไม่มีทางสมบูรณ์

อรรถาธิบาย

[1] สมการ Schrödinger ใกล้เคียงกับสมการ Hamilton-Jacobi ในฟิสิกส์ดั้งเดิมซึ่งเป็นสมการสำคัญในการตีความทฤษฎีควอนตัมแบบ Bohm ด้วย แต่เราจะถือว่าไม่มีใครรู้จักแล้วกัน ที่แน่ๆมันยากกว่า approach สู่ทฤษฎีควอนตัมที่เราจะนำเสนอเยอะ