Psychoacoustics ทำไมหูเราไม่ได้ยินเสียงตามความเป็นจริง?
การทำงานด้านระบบเสียงนั้น Sound Engineer จำเป็นต้องเข้าใจว่าสิ่งที่เราฟังไม่ได้เป็นเพียงแค่คลื่นเสียงตามหลักฟิสิกส์ แต่เป็นผลลัพธ์จากการประมวลผลที่ซับซ้อนของสมองและหูมนุษย์ หูของเราไม่ได้แปลเสียงแบบ “ตรงไปตรงมา” ตามฟิสิกส์ของคลื่นเสียง แต่จะมีการตีความร่วมกับประสบการณ์ การมองเห็น และสภาพแวดล้อม ความเข้าใจในเรื่องนี้จะช่วยให้เราออกแบบและปรับระบบเสียงให้เหมาะสมกับการรับรู้ของมนุษย์ มาทำความเข้าใจกันว่าทำไมการได้ยินของเราจึงไม่ตรงตามความเป็นจริงทางกายภาพ
จิตอะคูสติกส์ (Psychoacoustics) คืออะไร?
จิตอะคูสติกส์ คือสาขาวิชาที่ศึกษาเกี่ยวกับการรับรู้เสียงของมนุษย์ ซึ่งต่างจากการวัดเสียงทางกายภาพ สาขานี้จะศึกษาว่าสมองและหูของเราตีความคุณสมบัติทางกายภาพของเสียง เช่น ความถี่ ความดัง และทิศทาง แตกต่างจากค่าที่วัดได้จริงอย่างไร
การเข้าใจจิตอะคูสติกส์จึงเป็นพื้นฐานสำคัญสำหรับ Sound Engineer เพราะจะช่วยให้เราเข้าใจว่าทำไมเสียงที่วัดได้เหมือนกันจึงอาจฟังดูต่างกัน และทำไมการปรับแต่งระบบเสียงจึงต้องคำนึงถึงการรับรู้ของมนุษย์มากกว่าแค่ข้อมูลทางกายภาพ
หูมีการตอบสนองความถี่ไม่เท่ากัน
Equal Loudness Contours (Fletcher-Munson Curves)
หนึ่งในหลักฐานที่ชัดเจนที่สุดที่แสดงว่าหูเราไม่ได้ยินตามความเป็นจริงทางกายภาพคือ Equal Loudness Contours หรือที่เรียกกันว่า Fletcher-Munson Curves
จากการศึกษาของ Harvey Fletcher และ Wilden A. Munson ในปี 1933 พบว่าหูมนุษย์ไม่ได้รับรู้ความดังของทุกความถี่เท่ากัน แม้ว่าคลื่นเสียงจะมีระดับความดันเสียง (SPL) เท่ากันก็ตาม
หูไวที่สุดที่ความถี่ 2-5 kHz ซึ่งเป็นย่านความถี่ของเสียงพูดของมนุษย์ ในขณะที่ย่านความถี่ต่ำต้องใช้พลังงานมากกว่าหลายเท่าเพื่อให้ฟังดังเท่ากับย่านกลาง การที่หูมีความไวต่อความถี่ไม่เท่ากันนี้ทำให้เสียงที่มีพลังงานเท่ากันในทุกความถี่จะฟังดูไม่สมดุล
ผลกระทบต่อการออกแบบระบบเสียง
ด้วยเหตุนี้ ระบบเสียงที่ดีจึงไม่ควรมี frequency response ที่แบนโดยสมบูรณ์ แต่ควรปรับให้เหมาะสมกับการรับรู้ของหูมนุษย์ นี่คือเหตุผลที่เครื่องขยายเสียงในอดีตมักมีปุ่ม Loudness เพื่อชดเชยการรับรู้ความถี่ต่ำและสูงที่ลดลงเมื่อฟังเสียงเบา
การประมวลผลเสียงของสมอง
Haas Effect / Precedence Effect
สมองของเรามีคุณสมบัติพิเศษในการประมวลผลเสียงที่มาถึงในช่วงเวลาใกล้เคียงกัน Haas Effect หรือ Precedence Effect คือปรากฏการณ์ที่สมองจะรวมเสียงที่มาถึงในช่วง 0-80 มิลลิวินาทีเป็นเสียงเดียวกัน
ปรากฏการณ์นี้ทำให้เสียงสะท้อนที่มาถึงในช่วงเวลาดังกล่าวไม่ถูกรับรู้เป็น Echo แยกต่างหาก แต่จะช่วยเสริมความดังและความชัดเจนของเสียงหลัก นี่คือเหตุผลที่เราสามารถฟังเสียงในห้องที่มีเสียงสะท้อนได้อย่างชัดเจน โดยไม่รู้สึกสับสน
Virtual Pitch
ความสามารถที่น่าทึ่งอีกอย่างหนึ่งของสมองคือการสร้าง Virtual Pitch หรือการ “เติมเต็ม” ความถี่ที่หายไป หากความถี่พื้นฐาน (fundamental frequency) หายไป แต่ยังมีฮาร์มอนิกอยู่ สมองจะยังคงรับรู้ว่าเสียงนั้นมี pitch อะไร
ปรากฏการณ์นี้ทำให้ลำโพงขนาดเล็กที่ไม่สามารถผลิตเสียงเบสลึกได้ ยังคงทำให้เราได้ยิน “เสียงเบส” ผ่านฮาร์มอนิกที่สูงกว่า นี่คือหลักการทำงานของเทคโนโลยี psychoacoustic bass enhancement ในลำโพงขนาดเล็ก
การรับรู้แบบหลายประสาทสัมผัส (Multisensory Integration)
McGurk Effect
การได้ยินของเราไม่ได้ขึ้นอยู่กับหูเพียงอย่างเดียว แต่ยังขึ้นอยู่กับการมองเห็นและประสบการณ์ด้วย McGurk Effect เป็นตัวอย่างที่ชัดเจน เมื่อเสียงที่ได้ยินกับภาพที่เห็นไม่ตรงกัน สมองจะตีความเสียงให้เป็นไปตามที่เห็น
ยกตัวอย่าง หากเราเห็นคนพูดคำว่า “กา” แต่ได้ยินเสียง “บา” สมองอาจจะตีความว่าได้ยิน “ดา” ปรากฏการณ์นี้แสดงให้เห็นว่าการรับรู้เสียงเป็นกระบวนการที่ซับซ้อนและไม่ได้ขึ้นอยู่กับหูเพียงอย่างเดียว
ผลกระทบต่อการออกแบบระบบเสียง
ความเข้าใจในเรื่องนี้ทำให้ Sound Engineer ต้องคำนึงถึงปัจจัยด้านสายตาด้วย การจัดวางลำโพงให้สอดคล้องกับตำแหน่งของผู้แสดง การใช้แสงประกอบเพื่อช่วยให้ผู้ฟังมุ่งความสนใจไปในทิศทางที่ต้องการ ล้วนเป็นการใช้ประโยชน์จากหลักการ multisensory integration
ปรากฏการณ์สำคัญในจิตอะคูสติกส์
Masking Effect
Masking Effect คือปรากฏการณ์ที่เสียงหนึ่งทำให้ได้ยินอีกเสียงหนึ่งแย่ลง หรือหายไปเลย ปรากฏการณ์นี้เกิดขึ้นได้หลายรูปแบบ:
Frequency Masking: เสียงดังจะปกปิดเสียงเบาที่ความถี่ใกล้เคียงกัน Temporal Masking: เสียงดังจะปกปิดเสียงเบาที่เกิดขึ้นก่อนหน้าหรือหลังจากเสียงดัง Upward Spread of Masking: เสียงความถี่ต่ำจะปกปิดเสียงความถี่สูงได้ง่ายกว่าในทางกลับกัน
ผลต่อการมิกซ์เสียง
ความเข้าใจใน Masking Effect ช่วยให้ Sound Engineer สามารถจัดการความถี่และระดับเสียงของเครื่องดนตรีต่าง ๆ ให้ไม่ปกปิดกัน การใช้ EQ เพื่อแยกย่านความถี่ การปรับ timing เพื่อหลีกเลี่ยง temporal masking ล้วนเป็นการประยุกต์ใช้หลักการนี้
ช่วงไดนามิกการได้ยิน
หูของมนุษย์สามารถรับรู้พลังงานเสียงได้ในช่วงที่กว้างอย่างไม่น่าเชื่อ ประมาณ 10^13:1 หรือประมาณ 130 dB การที่หูสามารถรองรับช่วงที่กว้างขนาดนี้ได้ทำให้การใช้หน่วยวัดแบบลอการิทึมอย่างเดซิเบล (dB) เป็นสิ่งจำเป็น
การรับรู้แบบลอการิทึม
สมองของเรารับรู้การเปลี่ยนแปลงของเสียงแบบลอการิทึมมากกว่าเชิงเส้น การเพิ่มความดัง 10 dB จะฟังดู “ดังขึ้นสองเท่า” แทนที่จะเป็นการเพิ่มพลังงาน 10 เท่าตามความเป็นจริงทางกายภาพ
ความเข้าใจนี้สำคัญมากในการปรับระดับเสียง การใช้ compressor และการออกแบบระบบเสียงที่มี headroom เพียงพอ
การประยุกต์ใช้ในการทำงานจริง
การปรับแต่งเสียง (Equalization)
อีควอไลเซอร์ (EQ) ถูกออกแบบมาเพื่อปรับเสียงให้เหมาะสมกับการรับรู้ของมนุษย์ การปรับแต่งระบบเสียงด้วยกราฟิกอีควอไลเซอร์เป็น “การดำเนินการที่เป็นอัตวิสัย” ที่ต้องใช้ประสบการณ์และทักษะ โดยมีหูเป็นผู้ตัดสินสุดท้าย
ไมโครโฟนแบบมีทิศทาง
ไมโครโฟนแบบคาร์ดิออยด์และแบบอื่น ๆ ได้รับการออกแบบให้รวมเอาความต้านทานทางอะคูสติกและการเลื่อนเฟส เพื่อสร้างรูปแบบการรับเสียงที่ช่วยเพิ่มประสิทธิภาพของแหล่งกำเนิดเสียงที่ต้องการ และลดเสียงรบกวนจากแหล่งอื่น
การบีบอัดเสียง (Compression)
คอมเพรสเซอร์ถูกใช้เพื่อปรับช่วงไดนามิกให้เหมาะสมกับการรับรู้ของมนุษย์และข้อจำกัดของระบบ การที่มนุษย์รับรู้ว่าลักษณะเสียงบางอย่างน่าฟังหรือเข้าใจง่ายขึ้นเมื่อมีการปรับแต่งจากสัญญาณ “ดิบ”
White Noise และการรับรู้ความถี่
White Noise เป็นตัวอย่างที่ดีของความแตกต่างระหว่างการวัดทางกายภาพกับการรับรู้ แม้ว่า white noise จะมีการกระจายพลังงานที่สม่ำเสมอในแต่ละเฮิรตซ์ แต่เมื่อแสดงบนมาตราส่วนความถี่แบบลอการิทึม พลังงาน white noise จะเพิ่มขึ้นเป็นสองเท่าในแต่ละอ็อกเทฟที่สูงขึ้น
ผลลัพธ์คือ white noise จะฟังดูมีเสียงฟู่ที่ความถี่สูง แสดงให้เห็นถึงความแตกต่างระหว่างการกระจายพลังงานทางกายภาพกับการรับรู้ทางเสียง
ค่า RMS และการรับรู้
ค่า Root-Mean-Square (RMS) ของรูปคลื่นถูกพัฒนาขึ้นเพื่อหาค่าเฉลี่ยของระดับสัญญาณเมื่อเวลาผ่านไป ซึ่งเป็นค่าที่ “ใกล้เคียงกับระดับที่หูของเรารับรู้ได้มากที่สุด” มากกว่าค่า peak หรือ average
การใช้ RMS ในการวัดและควบคุมระดับเสียงจึงให้ผลลัพธ์ที่สอดคล้องกับการรับรู้ของมนุษย์มากกว่าการใช้ค่าอื่น ๆ
การออกแบบระบบเสียงที่เข้าใจการรับรู้
การที่ Sound Engineer เข้าใจจิตอะคูสติกส์จะช่วยในการออกแบบระบบเสียงที่ไม่เพียงแต่ถูกต้องทางเทคนิค แต่ยังฟังดูดีด้วย การคำนึงถึงข้อจำกัดและคุณสมบัติพิเศษของการรับรู้เสียงของมนุษย์จะทำให้ได้ระบบเสียงที่มีประสิทธิภาพและสร้างความพึงพอใจให้กับผู้ฟัง
นี่รวมถึงการเลือกใช้เทคโนโลยี psychoacoustic processing การปรับแต่งระบบให้เหมาะสมกับสภาพแวดล้อมการฟัง และการใช้เทคนิคต่าง ๆ เพื่อหลีกเลี่ยงปัญหาที่เกิดจากข้อจำกัดของการรับรู้ของมนุษย์
สรุป
หูของมนุษย์ไม่ได้เป็นเพียงเครื่องมือวัดทางกายภาพ แต่เป็นระบบประมวลผลที่ซับซ้อนซึ่งตีความและปรับแต่งข้อมูลเสียงเพื่อให้เกิดการรับรู้ที่เป็นประโยชน์ สิ่งที่เราฟังไม่ใช่ “คลื่นเสียงจริง” แต่คือผลรวมของเสียงและการประมวลผลของสมอง
การเข้าใจจิตอะคูสติกส์จึงเป็นพื้นฐานสำคัญสำหรับ Sound Engineer ในการออกแบบระบบเสียงที่ดี ระบบเสียงที่ดีต้องออกแบบทั้งด้านฟิสิกส์และการรับรู้ของคนฟังพร้อมกัน ไม่ใช่แค่การผลิตเสียงที่ถูกต้องทางเทคนิค แต่ต้องเป็นเสียงที่ฟังดูดีและเข้าใจง่ายสำหรับหูมนุษย์ด้วย
การทำความเข้าใจในเรื่องนี้จะช่วยให้เราสามารถสร้างประสบการณ์การฟังที่ดีที่สุดให้กับผู้ฟัง โดยใช้ความรู้ทางวิทยาศาสตร์มาประยุกต์ในงานศิลปะของการออกแบบเสียง
หลักสูตร Sound Engineer
สนใจเรียนหลักสูตร Sound Engineer สามารถติดต่อได้ที่เบอร์ 02-550-6340 หรือ 064-198-2499 Email: course@liveforsound.com Line: @liveforsound ทางเรายินดีให้คำปรึกษาด้านการเรียนเกี่ยวกับ Sound Engineer
บริการระบบเสียงมืออาชีพ
Live For Sound รับออกแบบ ติดตั้ง จำหน่าย ระบบเครื่องเสียงห้องประชุม พร้อมบริการหลังการขายแบบครบวงจร ด้วยทีมงานระดับมืออาชีพ มาตรฐานสากล สอบถามเพิ่มเติมโทร 02-550-6340, 064-198-2499 อีเมล์ sale@liveforsound.com
แหล่งอ้างอิง
Fletcher & Munson (1933) – Loudness, its definition, measurement and calculation • Howard & Angus – Acoustics and Psychoacoustics (Chapter 2–3, p. 35–68) • Everest & Pohlmann – Master Handbook of Acoustics (Chapter 4, p. 70–85) • Plack, C. – The Sense of Hearing (Chapter 5, Psychoacoustics, p. 101–120) • Audio Engineering Society (AES) – Standards on Psychoacoustics • Zwicker & Fastl – Psychoacoustics: Facts and Models