Nhúng và phát âm thanh trên STM32 với DMA và PWM

stm32 stream wav

Âm thanh kĩ thuật số được lưu lại bằng cách đọc các tín hiệu điện áp từ micro thông qua bộ ADC rồi lưu lại dưới dạng 1 con số cụ thể. Đó gọi là lấy mẫu, khoảng thời gian giữa các lần lấy mẫu phải đều nhau và được gọi là chu kì lấy mẫu, lấy nghịch đảo của chu kì ta được tần số lấy mẫu.

Tần số lấy mẫu thường là 44.1Khz ( tức trong 1 giây sẽ đọc ADC 44100 lần rồi lưu vào bộ nhớ)

Để phát âm thanh, chúng ta sẽ làm ngược lại quá trình trên tức là đọc các con số đã được lưu trong bộ nhớ rồi phát điện áp tương ứng ra ngoài thông qua bộ DAC, tuy nhiên không phải chip nào cũng có sẵn ngoại vi DAC nên chúng ta có thể giả lập nó bằng phương pháp điều chế độ rộng xung – PWM ( đương nhiên DAC fake này sẽ không xịn xò bằng DAC hàng read được)

Khoảng thời gian mà bộ vi điều khiển thay đổi giá trị điện áp phải đúng bằng tần số lấy mẫu thì âm thanh mới chuẩn xác giống như lúc thu âm. Nếu khác thì chúng ta sẽ cho ra các âm thanh bị biến dạng, méo mó

Dữ liệu âm thanh được đóng gói theo các chuẩn file khác nhau ( MP3, WAV … ) file âm thanh mp3 là định dạng phổ biến, tuy nhiên nó là file nén, chúng ta sẽ sử dụng các tool chuyển đổi để đưa nó về dạng file WAV (định dang file không nén)

Bên trong các file sẽ có chưa các thông tin mô tả cách mà âm thanh này được thu lại, có 1 số thuộc tính mà chúng ta cần phải quan tâm như sau:

  • Tần số lấy mẫu của âm thanh
  • Âm thanh này là mono, hay stereo
  • Độ sâu của âm thanh (bit depth)

Âm thanh mono, hay stereo

Để đơn giản chúng ta sẽ chỉ làm việc với âm thanh mono ( tức là 1 kênh pwm phát âm thanh)

Độ sâu của âm thanh

Độ sâu của âm thanh cũng tương đương với độ phân giải của bộ PWM, ví dụ âm thanh lấy mẫu ở 8bit thì bộ PWM (DAC) cũng phải có độ phân giải 8bit, âm thanh 16bit thì bộ PWM cũng phải có độ phân giải 16bit

Do chúng ta đang giả lập PWM như 1 bộ DAC nên tần số của PWM càng cao thì nó sẽ càng mô phỏng gần chính xác bộ DAC hơn, tuy nhiên trong STM32 tần số tối đa của PWM còn phụ thuộc vào độ phân giải của PWM, ví dụ:

Nếu chọn tần số hoạt động của timer là 72Mhz, độ sâu âm thanh là 16bit thì ta có tần số tối đa của PWM là 72M/ (2 mũ 16) = 1,098 Hz
Nếu chọn độ sâu âm thanh là 8bit thì ta có tần số tối đa của PWM là 72M/(2 mũ 8) 281,250 Hz

Tức là nếu bạn cần phát âm thanh có độ sâu 16bit thì bộ giả lập DAC ( tức PWM) chỉ có thể hoạt động ở ~1Khz, đây là con số rất thấp và nó gần như không hoạt động được. Do vậy mình sẽ sử dụng file âm thanh có độ sâu âm là 8bit ( chúng ta sẽ dùng tool để chuyển đổi sang dạng 8bit)

Tần số lấy mẫu của âm thanh

Tần số lấy mẫu của âm thanh sẽ tương đường với số lần chúng ta thay đổi độ rộng xung PWM (Pulse).
Âm thanh thông thường được lưu ở 44.1Khz ( tức trong 1 giây chúng ta phải thay đổi độ rộng xung 44100 lần) nó cũng tương đương với mỗi 1 giây của âm thanh sẽ hao tổn 44.1KB bộ nhớ ( mono – 8bit – 44.1Khz)

Bộ nhớ chính xác của STM32F103C8T6 là 128KB nên nếu phát âm 44.1Khz thì chỉ phát được hơn 2s là cùng. Do vậy mình sẽ giảm tần số lấy mẫu của âm thanh xuống khoảng 16Khz (lưu được gần 8s) hoặc 8Khz (lưu được gần 16 giây)

Qua kiểm nghiệm thử thì mình thấy âm thanh mono – 8bit – 16Khz là nghe ổn và đỡ tốn bộ nhớ nhất

Chuẩn bị file âm thanh

Các bạn tải file âm thanh bất kì về rồi truy cập vào https://audio.online-convert.com/fr/convertir-en-wav để xử lí sang dạng file chúng ta cần

Sau đó tải về là chúng ta đã có file âm thanh đuôi WAV và được xử lí sang cấu hình mà chúng ta cần. Bây giờ chúng ta sẽ chuyển file này sang dạng mảng dữ liệu trong ngôn ngữ C bằng công cụ chuyển đổi FILE to Hex http://tomeko.net/online_tools/file_to_hex.php?lang=en

Các bạn kéo thả file âm thanh đuôi WAV vào là có được mã hex của âm, đó chính là mảng dữ liệu mà chúng ta sẽ copy và nhúng vào code

Cấu trúc của tệp tin WAV

44 byte đầu mô tả các thông tin của file âm thanh, Trong đó, 4 byte đầu luôn là 0x52,0x49,0x46,0x46 . Từ byte thứ 45 là dữ liệu

Các bạn có thể tìm hiểu thêm chi tiết 44 byte header của tệp tin WAV ở trên mạng, trong bài này chúng ta không cần quan tâm lắm vì cứ biết từ byte thứ 45 là dữ liệu là được rồi ( vì mặc định là sử dụng file âm thanh mono – 16Khz – 8bit rồi mà)

Lập trình

1 cách cực kì đơn giản là sử dụng ngắt timer để đều đặn truy cập thay đổi độ rung xung PWM

Khởi tạo project với tần số là 72Mhz , sử dụng chân A15 làm bộ phát PWM ( TIM2 – CH1), cấu hình pwm là 8 bit (tức đếm tới 255)

Bây giờ sẽ cần thêm 1 ngắt timer có tần số ngắt đúng bằng tần số lấy mẫu của âm thanh ( 16Khz), mình sẽ xài timer 3 và tính toán hệ số chia, bộ đếm sao cho khi timer tràn nó sẽ đếm được 1/16K = 0.0000625s = 0.0625ms = 62.5us
-> Chọn hệ số chia là 36 -> mỗi xung đếm 0.5us -> đếm 125 xung là được 62.5

Đừng quên chuyển sang tab NVIC và kích hoạt ngắt timer 3

Sinh code và kích hoạt timer, pwm trong hàm main

Hàm ngắt timer 3 có nhiệm vụ lấy dữ liệu trong mảng âm thanh đưa vào thay đổi độ rộng xung của PWM, hãy nhớ dữ liệu bắt đầu từ 44 nhé ! Mình sẽ đặt tên cho mảng dữ liệu chưa âm thanh là uint8_t const amthanh[]={…….};

Kết quả ( mình sử dụng vđk có bộ nhớ lớn hơn để demo lâu tí chứ nếu các bạn xài stm32f103c8t6 thì được cùng lắm 8s thui)

Sử dụng với DMA

DMA sẽ giúp giải phóng CPU khỏi ngắt timer giúp tối ưu hiệu suất của chip, các bạn có thể thoải mái làm việc khác trong khi vẫn đang phát nhạc. Lúc này, timer3 thay vì tạo ra tín hiệu ngắt vào CPU thì sẽ tạo ra tín hiệu trigger vào DMA

Tắt ngắt Timer 3 và vào tab DMA Setting để bật DMA TIM UP và cấu hình như sau:

Hướng di chuyển của data rõ ràng là M2P rồi (memorry to peripheral), ưu tiên để cao nhất.
Dộ dài của mảng dữ liệu là uint8_t ( tức là 1byte) còn độ dài của thanh ghi độ rộng xung là 4byte (word) nên chúng ta phải setup cho đúng nhé !

Sinh code và xóa hàm ngắt timer đi ! trong hàm main tiến hành khởi tạo lại:

Vậy là xong, rất đơn giản phải không ! ngoài ra các bạn có thể bắt 1 tín hiệu callback khi âm thanh phát hết bằng hàm tạo callback

Như vậy hàm DMA_ngat sẽ tự động được gọi mỗi khi DMA truyền xong data ( phát xong âm thanh), giờ minh sẽ viết hàm DMA_ngat để cho nó phát lại âm thanh khi phát xong

Chúc các bạn thành công !

 

Từ tác giả:

Nếu có bất kì thắc mắc nào trong bài viết, vui lòng để lại comment dưới mỗi bài ! Mình sẽ không trả lời thắc mắc của các bạn ở facebook hay email !

Nếu trong phần code bạn nhìn thấy nhưng thứ kiểu như &amp; thì đó là lỗi hiển thị, cụ thể 3 kí tự < > & bị biến đổi thành như thế
&amp; là &
&lt;  là <
&gt; là >

Giới thiệu Đào Nguyện 80 bài viết
DIY,chế cháo, viết blog chia sẽ kiến thức về lập trình,điện tử - IoT. Rất mong được giao lưu, kết bạn với các bạn cùng đam mê. Địa chỉ Facebook: https://www.facebook.com/nguyendao207

9 bình luận

  1. anh ơi cho em hỏi 2 hàm này viết vào đâu vậy anh. HAL_DMA_RegisterCallback(&hdma_tim3_up,HAL_DMA_XFER_CPLT_CB_ID,&DMA_ngat); và hàm void DMA_ngat(DMA_HandleTypeDef * _hdma)

    và cho em hỏi đối số như này &hdma_tim3_up hay là như này ạ &hdma_tim3_ch4_up.

  2. cho mình hỏi có nhất thiết tần số lấy mẫu ADC phải là 44.1Khz ko nhỉ ? nếu như lấy cao hơn thì chất lượng âm tốt hơn đúng k nhỉ ? có nhược điểm và ưu điểm gì khi lấy mẫu tần số cao hơn k nhỉ

Đã đóng bình luận.