直播软件搭建中推流端—声音采集_服务硬件_视频会议

直播软件搭建中推流端—声音采集

未知

2021-11-02 16:00:20

0次

直播软件搭建中推流端的采集一般分为两种，一种是音频采集，一种是图像采集，音频和图像的采集合成后就变成视频，当然也有一些直播平台会采用纯音频采集或纯图像采集。本文重点为大家讲解一下音频采集的相关知识。

一、什么是音频采集

1.直播软件搭建中的音频采集其实就是你录制的声音通过模拟信号采集成PCM编码的原始数据，然后在通过编码器压缩成MP3、AAC之类的数据分发出去。

2.常见的音频压缩格式有MP3、ACC、OGG、WMA之类的。

二、音频采集技术

1.那么音频采集有几个技术点再跟大家介绍一下，分别为采样率、位宽、声道数、音频帧。首先采样率就是把模拟信号转化为数字的过程，采样率越高，记录这一段音频的数据量就越大，但是音频的质量也就越高。

2.直播软件搭建中音频采集的位宽其实就是采样时每一个采样点都需要一个数值来表示是大小，这个数值的大小，可以4位、8位、16位、32位，位数越多表示质量越精细，声音也就越好，但是数据量也会成倍的增大。而我们一般采集过程中使用的位宽一般是8位或16位。

3.声道数很好理解，就是单声道和双声道。音频的采集和播放时可以叠加的，因此可以从多个音频源去采集声音，并且输入到不同的扬声器中，如5.1的环绕等，所以说声道一般表示声源的数量，或回放时扬声器的数量，声道数为1或2时，就分别称为单声道和双声道。也是比较常见的声道参数。

4.直播软件搭建中音频采集的音频帧没有一个明确的概念，因为音频和视频不一样，视频每一帧都是一个图像，而音频可理解成一种声波，音频数据属于一种流式数据，本身没有没有帧的概念，但是在实际应用和开发中，为了音频算法，一些传输和处理，音频帧的时长为2.5毫秒或60毫秒之间的一个数据量为一阵，同时这个时间称为采样时间，其实采样时间是一个范围，具体没有一个特别的标准，所以是根据编码器及具体的应用来指定的，然后通过这几个点我们就可以计算出音频帧的大小。

5.我们举例来说，假设采样率是8000Hz，双通道，位宽为16bit，音频帧为20ms为一帧，一帧的数据大小就是8000*8*16*0.02=5120bit=640byte。这就是音频帧的计算，当然音频采集还有一系列应对的挑战，例如回音消除、噪音消除、还有混音算法等，都是要在直播软件搭建的前处理及编码中要考虑的事情。

上一篇：直播流程图—导播台

下一篇：高级成像系统/绿幕

栏目索引

时光剪影文化