เวกเตอร์, ดูอัลเวกเตอร์ และสัญกรณ์ Dirac (อ่านโพสท์นี้ถ้าอ่านโพสท์อื่นไม่รู้เรื่อง)

Why are vector spaces like potato chips? Because you cannot have just one.

W. Kahan

ผมพูดถึงควอนตัมอยู่บ่อยๆในบล็อกนี้ วัตถุทางคณิตศาสตร์ที่สำคัญมากในควอนตัมคือเวกเตอร์ เพื่อความสะดวกในการเขียน (และการอ่าน เพราะไม่ต้องอธิบายยืดยาวซ้ำแล้วซ้ำอีก) ในโพสท์นี้ผมอยากจะพูดถึงเวกเตอร์ที่ทุกคนคงรู้จักแต่อาจจะยังรู้จักไม่ดีพอ, ดูอัลเวกเตอร์คู่หูที่ถูกลืมของเวกเตอร์, และวิธีเขียนเวกเตอร์ ดูอัลเวกเตอร์ และทุกสิ่งที่ประกอบกันขึ้นมาจากสองสิ่งนี้ของ Paul Dirac ที่เรียกว่าสัญกรณ์ Dirac (คำนี้ผมตั้งขึ้นมาเอง มาจาก Dirac notation)

ปริภูมิเวกเตอร์
ปริภูมิดูอัล
สัญกรณ์ Dirac
สถานะควอนตัม
Density operators, แรงค์, และเทรซ

เรามักจะรู้จักเวกเตอร์กันในสองหน้าตา ลูกศรที่มีความยาวและทิศทาง กับตัวเลขที่เรียงเป็นแถว สองคอนเซปต์นี้มีข้อดีข้อเสียที่ต่างกันออกไป แต่มันเป็นตัวแทนของเวกเตอร์เท่านั้น ผมจะพูดถึงเวกเตอร์จริงๆในรูปนามธรรม โดยการพูดถึงที่อยู่อาศัย บ้านของเวกเตอร์ กับฐานของบ้านก่อน

ปริภูมิเวกเตอร์

บ้านของเวกเตอร์เรียกว่าปริภูมิเวกเตอร์ (vector space) มักจะแทนด้วยตัวอักษร V บ้านในที่นี้หมายถึงคนในบ้านมากกว่าบ้านเลขที่ เหมือนคำกล่าวที่ว่าประเทศคือประชาชน ไม่ใช่เขตแดน ปริภูมิเวกเตอร์เป็นเซตของวัตถุที่ทำตามกฏหนึ่ง กฏก็คือเมื่อคุณวัตถุด้วยตัวเลข (ซึ่งเลือกได้ เช่นจะให้เป็นจำนวนจริงหรือจำนวนเชิงซ้อน แต่เมื่อเลือกแล้วจะเปลี่ยนไม่ได้) หรือเอาวัตถุไปรวมกับวัตถุอื่นในเซต ผลที่ออกมาจะไม่ออกนอกเซต ไม่ออกนอกบ้าน วัตถุที่ทำตามกฏนี้เรียกว่าเวกเตอร์  จำไว้ว่าการคูณด้วยตัวเลขกับการบวกกันเองเป็นการการกระทำการพื้นฐานที่ทำได้กับเวกเตอร์

อาจจะมีเวกเตอร์จำนวนอนันต์อยู่ในบ้านหลังหนึ่ง ไอเดียที่สำคัญก็คือเราสามารถเลือกเวกเตอร์หยิบมือหนึ่งมาเป็นตัวแทนของทุกเวกเตอร์ได้ เราเรียกเซตของเวกเตอร์นี้ว่าฐานหรือเบสิส (basis) เหมือนรากฐานของบ้าน มีฐานก็ต่อเป็นบ้านได้ สมาชิกของเซตนี้เราเรียกว่าเวกเตอร์ฐาน (basis vector) ฐานเป็นตัวแทนของทุกๆเวกเตอร์ในบ้านเพราะนิยามดังต่อไปนี้

  1. ไม่ว่าเราจะเลือกเวกเตอร์ไหนในบ้าน เราสามารถเขียนมันในรูปผลรวมของเวกเตอร์ที่มาจากการจับสมาชิกในฐานคูณกับตัวเลขได้ ผลรวมนี้มีชื่อเป็นทางการว่าผลรวมเชิงเส้น (linear combination) (เชิงเส้นเพราะไม่มีการยกกำลัง)
  2. ผลรวมเชิงเส้นที่ต่างกันเป็นตัวแทนของเวกเตอร์ที่ต่างกัน

จากสองข้อกำหนดนี้เราสามารถพิสูจน์ได้ว่าถึงแม้จะมีหลายเซตที่ใช้เป็นฐานของบ้านได้ แต่ทุกๆเซตจะมีจำนวนสมาชิกเท่ากัน เราเรียกจำนวนนี้ว่ามิติ (dimension) ซึ่งมักจะแทนด้วยตัวอักษร d คำว่ามิตินี้ตรงกับความหมายของคำว่ามิติเมื่อเรามองเวกเตอร์เป็นลูกศร ทำให้คิดถึงปริภูมิเวกเตอร์ในเชิงเรขาคณิตได้

ปริภูมิย่อย (subspace) เป็นบ้านที่อยู่ในบ้านอีกที เช่นเส้นตรง (หนึ่งมิติ) อยู่ในระนาบ (สองมิติ) ซึ่งอยู่ในปริภูมิสามมิติ กว้าง, ยาว, สูงอีกที ในสัมพัทธภาพพิเศษก็มีมิติเวลาเพิ่มมาอีกหนึ่งมิติ

แต่มิติไม่จำเป็นต้องมีความเกี่ยวข้องมิติทางกายภาพ ในสถิติ, machine learning, หรือทฤษฎีควอนตัมเราสามารถมีข้อมูลเป็นเวกเตอร์ในมิติสูงๆได้ ใครที่อยากทำเรื่องพวกนี้ก็ต้องใช้เวกเตอร์ทั้งนั้น

บางครั้งเราก็ต้องการเซตของเวกเตอร์ที่ใหญ่กว่าฐาน เวกเตอร์ใดๆก็ยังเขียนในรูปผลรวมเชิงเส้นของเซตนี้ได้ เราใช้คำว่าเซ็ตนี้แผ่ทั่ว (span) ปริภูมิหรือเซตนี้เป็น spanning set เพียงแค่ว่าเวกเตอร์หนึ่งอาจจะมีได้หลายตัวแทน (คือตัดข้อสองในนิยามด้านบนออกไป)

ปริภูมิดูอัล

เมื่อใดก็ตามที่มีปริภูมิเวกเตอร์ V เราสามารถสร้างเซตอีกเซตหนึ่งขึ้นมาได้ สมาชิกของเซตนี้เป็นเครื่องจักรที่จะคายตัวเลขออกมาเมื่อป้อนเวกเตอร์ใน V ให้มันโดย “เคารพโครงสร้างของ V” กล่าวคือถ้าได้ a เมื่อป้อนเวกเตอร์ u และได้ b เมื่อป้อนเวกเตอร์ v จะต้องได้ a+b เมื่อป้อน u+v

ปรากฎว่าเซตของเครื่องจักรนี้ก็เป็นปริภูมิเวกเตอร์เหมือนกัน เป็นคู่หู (ในเงามืดที่ไม่ค่อยมีใครรู้จัก) ของ V เรียกว่าปริภูมิดูอัล (dual space) ของ V เขียนแทนด้วย V* สมาชิกของมันเรียกว่าดูอัลเวกเตอร์

หาก d \neq \infty แล้ว V** = V บ้านของเวกเตอร์จึงมาเป็นคู่ๆ (ไม่ใช่บ้านเดี่ยวหรือทาวน์เฮาส์)

สัญกรณ์ Dirac

จะเห็นว่าถ้าไม่เขียน u เป็นลูกศรหรือตัวเลขเรียงกันเป็นแถวก็จะบอกได้ยากว่าเป็นเวกเตอร์ (หรือตัวเลขหรือดูอัลเวกเตอร์) นักฟิสิกส์ Paul Dirac มีวิธีแก้โดยการใช้สัญกรณ์ที่อสมมาตร ถ้าเป็นเวกเตอร์ให้เขียนในรูป |u\rangle  เรียกว่า ket ถ้าเป็นดูอัลเวกเตอร์ให้เขียนในรูป \langle v|  เรียกว่า bra (จริงๆบนล่างซ้ายขวาไม่สำคัญ ขอให้สัญลักษณ์ของเวกเตอร์ตรงข้ามกับของดูอัลเวกเตอร์ก็พอ) พอเอาก้นมาชนกันจะได้ตัวเลขออกมา \langle v|u \rangle = a เป็น bra(c)ket เพราะดูเหมือนเอาวงเล็บมาปิดครอบ แต่ถ้าเขียน |u\rangle \langle v| แปลว่ารอไปชนกันคนอื่นได้ทั้งซ้ายและขวา เพราะฉะนั้นเราจะคำนวณได้ทุกอย่างถ้ารู้ \langle u|v\rangle ของทุกๆเวกเตอร์ u และ v แต่เรารู้แล้วนี่ว่าทุกๆเวกเตอร์มีตัวแทนในรูปของฐาน ดังนั้นเรารู้ \langle u|v\rangle ของทุกๆเวกเตอร์ฐานก็เพียงพอแล้ว

ถ้า u และ v มาจากปริภูมิเดียวกันจะเอาด้านแหลมไปทิ่มก้นอีกคนไม่ได้ ถ้าเห็นใครเขียน |u\rangle |v\rangle เขามักจะหมายถึง |u\rangle \otimes |v\rangle ในปริภูมิเวกเตอร์ที่เป็นผลคูณเทนเซอร์ (tensor product) ระหว่างปริภูมิที่ u และ v อาศัยอยู่

การคูณระหว่างเวกเตอร์ในปริภูมิเดียวกันอย่างการคูณจุด (dot product) นั้นจะต้องนิยามการคูณภายใน (inner product) ซึ่งทำงานโดยการ identify เวกเตอร์ใน V และ V* เข้าด้วยกัน จับคู่ |u\rangle กับ \langle u| แล้วจึงบอกว่าผลคูณจุดระหว่าง u กับ v ในปริภูมิเดียวกันเท่ากับ \langle u|v\rangle  ปริภูมิที่มีการคูณภายในเรียกว่าปริภูมิ Hilbert (Hilbert space) [1]

ฐานที่สะดวกในการใช้คือฐานที่ตั้งฉากกัน (orthogonal basis ย่อว่า OB) \{|e_i\rangle \}

\langle e_i|e_j \rangle = 0 หาก i\neq j

ที่อำนวยความสะดวกยิ่งขึ้นคือฐานที่ตั้งฉากกันและ normalized (orthonormal basis ย่อว่า ONB) คือ OB ที่

\langle e_i|e_i\rangle = 1

กลับมายังประเด็นที่เปิดไว้ตอนต้น เวกเตอร์ในสัญกรณ์ Dirac จะคล้ายกับเวกเตอร์ที่เป็นลูกศรมากกว่าเพราะไม่ต้องมีฐาน เพียงแต่เราใช้ได้ในมิติที่สูงกว่า 3 มิติ (ซึ่งมองเป็นภาพไม่ออกแล้ว) ในขณะที่การจะเขียนเวกเตอร์เป็นตัวเลขเรียงกันเป็นแถวจะต้องกำหนดฐานให้แน่นอน ตัวเลขที่ถูกจับมาเรียงเป็นแถวเหล่านี้คือสัมประสิทธิ์

\langle e_i|u\rangle

ซึ่งต้องรู้ฐาน \{\langle e_i| \} ก่อน ถ้ามีใครมาถามทางแล้วเราบอกไปทาง (1,1) ก็จะไม่มีใครรู้เรื่องถ้าไม่บอกว่า 1 ตัวแรกกับ 1 ตัวที่สองบอกทิศไหน

สถานะควอนตัม

ในควอนตัมเรามีสถานะควอนตัม (quantum state) หรือสถานะบริสุทธิ์ (pure states) |\psi \rangle (ѱ ไม่ได้มีความหมายพิเศษอะไรแค่นิยมใช้กัน) เป็นเวกเตอร์ในปริภูมิ d มิติของจำนวนเชิงซ้อน \mathbb{C}^d  ส่วนฟังก์ชันคลื่น (wave function) คือสัมประสิทธิ์ของสถานะควอนตัมในฐานหนึ่งๆ เช่นตำแหน่ง \{|x\rangle \} ใน d=\infty

\langle x|\psi \rangle = \psi (x)

การรวมกันของเวกเตอร์ในปริภูมินี้เรียกว่าซูเปอร์โพสิชัน (superposition)

สถานะควอนตัม normalized เมื่อ \langle \psi|\psi \rangle = 1

Density operators, แรงค์, และเทรซ

อีกตัวอย่างของปริภูมิเวกเตอร์ที่สำคัญในควอนตัมคือปริภูมิ \mathbb{H}^d ของ Hermitian matrices ขนาด d คูณ d ปริภูมินี้เป็นปริภูมิ d^2 มิติของจำนวนจริง Density operators อาศัยอยู่ในปริภูมินี้แต่ไม่ใช่ทุกเวกเตอร์ในปริภูมินี้เป็น density operator [2]

การรวมกันของ density operators ในปริภูมินี้ (ที่ให้อีก density operator ออกมา) เรียกว่าการผสม (mixing)

สถานะควอนตัมก็อาศัยอยู่ในปริภูมินี้ในฐานะเมทริกซ์ที่มีแรงค์ (rank) 1. แรงค์ของเมทริกซ์ A คือจำนวนน้อยที่สุดของเวกเตอร์ฐาน \{ |e_i\rangle \} ที่ใช้เขียน A ในรูปผลบวก A = \sum_i |e_i\rangle \langle e_i| ได้ ข้อควรระวังคือเซตของสถานะควอนตัมไม่ใช่ปริภูมิย่อยของ \mathbb{H}^d เพราะการรวมเวกเตอร์ในปริภูมินี้ไม่เหมือนกับการรวมเวกเตอร์ในปริภูมิของสถานะควอนตัม (การผสมไม่ใช่ซูเปอร์โพสิชัน ทำให้แรงค์มากขึ้นได้)

Density operators \rho  normalized เมื่อเทรซ (trace) \text{Tr}(\rho) = 1. เทรซของเมทริกซ์คือผลรวมของเลขในแนวทแยง (diagonal) ของมัน ถ้าชอบมากกว่า นิยามที่ไม่ขึ้นกับฐานที่เลือกคือ \text{Tr}(|u\rangle \langle v|) = \langle v|u \rangle เพราะฉะนั้นการที่บอกว่าสถานะควอนตัม |\psi \rangle normalized หรือ rank-1 density operator |\psi \rangle \langle \psi | ก็มีความหมายไม่ต่างกัน

เมื่อพูดถึง rank-1 trace-1 operator นอกเหนือบริบทของสถานะควอนตัม ผมจะใช้คำย่อที่ adviser ผมชอบใช้คือ ODOP (one-dimensional orthogonal projection) ไม่งั้นคำจะยาวมาก

เมื่อแรงค์เท่ากับจำนวนมิติ d ผมจะใช้คำว่า full rank เมทริกซ์ full rank คือเมทริกซ์ที่ผันกลับได้ (มีอินเวิร์ส)

[1] ถ้า d=\infty ปริภูมิจะเป็นปริภูมิ Hilbert ได้ก็ต่อเมื่อมัน “สมบูรณ์” (complete) ด้วยคือทุกลำดับ (sequence) ต้องลู่เข้าสู่เวกเตอร์ในปริภูมิเอง ถ้าลู่ออกนอกปริภูมิก็เหมือนปริภูมิมีรู ถ้าอุดรูหมดปริภูมิก็สมบูรณ์

[2] Density operator จะต้องเป็น positive semidefinite matrix ซึ่งเป็นแค่กรวย (cone) ในปริภูมินี้ (กรวยไม่ใช่ปริภูมิเวกเตอร์)