AAC ADTS/LATM格式总结

2024-03-13 12:32
文章标签 总结 格式 aac adts latm

本文主要是介绍AAC ADTS/LATM格式总结,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

ADIF格式:header() | raw_data_stream();header之后就是连续的raw_data_block,与ADTS不同,不允许从任意位置播放最近有做ADIF AAC播放,很多东西都在Decoder里面做好了,包括header的解析。driver只需要按固定大小读出送往decoder,根据decoder返回的剩余数据,重新拼装成一笔新的数据再送去decoder解即可,哎~~

一、ADTS格式:

ADTS的全称是Audio Data Transport Stream,是AAC音频的传输流格式。AAC音频格式在MPEG-2(ISO-13318-7 2003)中有定义,后来又被采用到MPEG-4标准中。

1. adts_sequence()

{

 while (nextbits() == syncword) {

 adts_frame();

 }

}

2. adts_frame()

{
 adts_fixed_header();

 adts_variable_header();

 if (number_of_raw_data_blocks_in_frame == 0) {

 adts_error_check();

 raw_data_block();

 }

 else {

 adts_header_error_check();

 for (i = 0; i <= number_of_raw_data_blocks_in_frame; i++) {

 raw_data_block();

 adts_raw_data_block_error_check();

 }

 }

}

3.

adts_fixed_header()

{
 syncword; 12 bslbf

 ID; 1 bslbf

 layer; 2 uimsbf

 protection_absent; 1 bslbf

 profile; 2 uimsbf

 sampling_frequency_index; 4 uimsbf

 private_bit; 1 bslbf

 channel_configuration; 3 uimsbf

 original/copy; 1 bslbf

 home; 1 bslbf

}

adts_variable_header()

{
 copyright_identification_bit; 1 bslbf

 copyright_identification_start; 1 bslbf

 frame_length; 13 bslbf

 adts_buffer_fullness; 11 bslbf

 number_of_raw_data_blocks_in_frame; 2 uimsfb

}

详细说明下ADTS头的重要数据部分:

syncword 同步字The bit string ‘1111 1111 1111’,说明一个ADTS帧的开始。

ID MPEG 标示符, 设置为1.

layer Indicates which layer is used. Set to ‘00’

protection_absent 表示是否误码校验

profile 表示使用哪个级别的AAC,如01 Low Complexity(LC)--- AACLC

sampling_frequency_index 表示使用的采样率下标

sampling_frequency_index sampling frequeny [Hz]

0x0 96000

0x1 88200

0x2 64000

0x3 48000

0x4 44100

0x5 32000

0x6 24000

0x7 22050

0x8 16000

0x9 2000

0xa 11025

0xb 8000

0xc reserved

0xd reserved

0xe reserved

0xf reserved

channel_configuration 表示声道数

frame_length 一个ADTS帧的长度包括ADTS头和raw data block.

adts_buffer_fullness 0x7FF 说明是码率可变的码流

number_of_raw_data_blocks_in_frame

表示ADTS帧中有number_of_raw_data_blocks_in_frame + 1个AAC原始帧.

所以说number_of_raw_data_blocks_in_frame == 0 表示说ADTS帧中有一个AAC数据块并不是说没有。
(一个AAC原始帧包含一段时间内1024个采样及相关数据)


二、封装AAC为ADTS帧

 一个AAC原始数据块长度是可变的,对原始帧加上ADTS头进行ADTS 的封装,就形成了ADTS帧。通常我们将得到的AAC原始帧进行封装后写入文件,用常用的播放器如千千静听即可播放,这是个验证AAC数据是否正确的方法。

进行封装之前,需要了解相关参数,如采样率,声道数,原始数据块的长度等。

下面是把AAC原始数据帧加工为ADTS帧,根据相关参数填写组成7个字节的ADTS头。


The ADTS header is defined below -

unsigned int obj_type = 0;

unsigned int num_data_block = frame_length / 1024;

// include the header length also

frame_length += 7;

/* We want the same metadata */

/* Generate ADTS header */

if(adts_header == NULL) return;

/* Sync point over a full byte */

adts_header[0] = 0xFF;

/* Sync point continued over first 4 bits + static 4 bits

* (ID, layer, protection)*/

adts_header[1] = 0xF9;

/* Object type over first 2 bits */

adts_header[2] = obj_type << 6;//

/* rate index over next 4 bits */

adts_header[2] |= (rate_idx << 2);

/* channels over last 2 bits */

adts_header[2] |= (channels & 0x4) >> 2;

/* channels continued over next 2 bits + 4 bits at zero */

adts_header[3] = (channels & 0x3) << 6;

/* frame size over last 2 bits */

adts_header[3] |= (frame_length & 0x1800) >> 11;

/* frame size continued over full byte */

adts_header[4] = (frame_length & 0x1FF8) >> 3;

/* frame size continued first 3 bits */

adts_header[5] = (frame_length & 0x7) << 5;

/* buffer fullness (0x7FF for VBR) over 5 last bits*/

adts_header[5] |= 0x1F;

/* buffer fullness (0x7FF for VBR) continued over 6 first bits + 2 zeros

* number of raw data blocks */

adts_header[6] = 0xFC;// one raw data blocks .

adts_header[6] |= num_data_block & 0x03; //Set raw Data blocks.


在CMMB中,采用AAC音频压缩标准,默认状况下,编码参数如下:双声道,采样率24KHZ,帧长变长,码流可变码率的码流,一般采用的AAC profile为AAC-LC。将从CMMB复用帧解析的一个AAC原始帧封装为ADTS帧的方法如下:

uint8 aac_buf[ADTS_FRAME_SIZE]={0x0ff,0x0f9,0x058,0x80,0,0x1f,0xfc};

从上述7个字节分析音频参数如下:

synword--0xfff

ID:0x1--- 1--- MPEG2 identifier,

LAYER--00

protection_absent ---01

profile--01 1 Low Complexity profile (LC) AAC-LC

smaping_freuency_index---0110-->0x06--->采样率24KHZ

channel_configuration --- aac_buf[3] = 0x08---->2---->双声道。。

adts_buffer_fullness--->0x7ff 码率可变的码流

现插入长度参数 wDataLen;

void OnAudioAacFrame(byte* data, uint16 wDataLen)

{
 unsigned int num_data_block = wDataLen / 1024;

 uint16 frame_Length;

 frame_Length = wDataLen + 7;

 /* frame size over last 2 bits */

 aac_buf[3] |= (frame_length & 0x1800) >> 11;// the upper 2 bit

 /* frame size continued over full byte */

 aac_buf[4] = (frame_length & 0x1FF8) >> 3;// the middle 8 bit

 /* frame size continued first 3 bits */

 aac_buf[5] |= (frame_length & 0x7) << 5;//the last 3 bit

 aac_bug[6] |= num_data_block & 0x03; //Set raw Data blocks.

 memcpy(&aac_buf[7],data,wDataLen);

 //形成一个ADTS帧写入文件。

 fwrite(aac_buf,wDataLen+7,sizeof(byte),f_audio);

}


三.LATM格式
 LATM 的全称为“Low-overhead MPEG-4 Audio TransportMultiplex”(低开销音频传输复用),
是MPEG-4 AAC制定的一种高效率的码流传输方式,MPEG-2 TS 流也采用LATM
作为AAC 音频码流的封装格式之 LATM格式也以帧为单位,主要由AudioSpecificConfig(音频特定配置单元)与音频负载组成。
AudioSpecificConfig 描述了一个LATM 帧的信息,音频负载主要由PayloadLengthInfo(负载长度信息)和PayloadMux(负载净荷)组成。
AudioSpecificConfig 信息可以是带内传,也可以是带外传。所谓带内传,就是指每一个LATM 帧,都含有一个AudioSpecificConfig 信息;
而带外传,则每一个LATM帧都不含有AudioSpecificConfig 信息,而通过其他方式把AudioSpecificConfig信息发送到解码端,
由于AudioSpecificConfig 信息一般是不变的,所以只需发送一次即可。由此可见,
AudioSpecificConfig 信息采用带内传输可适应音频编码信息不断变化的情况,
而采用带外传输,可以节省音频传输码率。带内或带外传,由muxconfigPresent 标志位决定。例如流媒体应用中,
muxconfigPresent 可设置为0,这样LATM帧中将不含有AudioSpecificConfig 信息,LATM帧通过RTP包发送出去,
AudioSpecificConfig 可通过SDP文件一次性传送到解码端。

AudioSpecificConfig 主要参数

numSubFrames 子帧的数目

numProgram 复用的节目数

numLayer 复用的层数

frameLengthType 负载的帧长度类型,包括固定长度与可变长度

audioObjectType 音频对象类型

samplingFrequency 采样率

channelConfiguration 声道配置

音频负载由若干子帧组成,每个子帧由PayloadLengthInfo和PayloadMux组成,
与ADTS帧净荷一样,音频负载主要包含原始帧数据。

AAC打包成TS流通常有两种方式,分别是先打包成ADTS或LATM。ADTS的每一帧都有个帧头,在
每个帧头信息都一样的状况下,会有很大的冗余。LATM格式具有很大的灵活性,每帧的音频配置单元既可以带内传输,
又可以带外传输。正因为如此,LATM不仅适用于流传输还可以用于RTP传输,
RTP传输时,若音频数据配置信息是保持不变,可以先通过SDP会话先传输StreamMuxConfig(AudioSpecificConfig)信息,
由于LATM流由一个包含了一个或多个音频帧的audioMuxElements序列组成。
一个完整或部分完整的audioMuxElement可直接映射到一个RTP负载上。

下面是一个audoMuxEmlemt

AudioMuxElement(muxConfigPresent)
{
 if (muxConfigPresent)
 {
 useSameStreamMux;
 if (!useSameStreamMux)
 StreamMuxConfig();

 }
 if (audioMuxVersionA == 0)
 {
 for (i = 0; i <= numSubFrames; i++)
 {
 PayloadLengthInfo();
 PayloadMux();
 }
 }
}

可以很简单的把ADTS帧转换为LATM帧,根据ADTS头的信息,生成StreamMuxConfig,
将ADTS中的原始帧提取出来,前面加上PayloadLengthInfo做为LATM的音频帧。
按照上述格式打包生成AudioMuxElement,作为RTP的负载传输.


四、CMMB中的LATM

 当CMMB中音频压缩标准为AAC时,默认采用LATM封装。StreamMuxConfig采用带外传输。
StreamMuxConifg中的若干默认参数如下:audioMuxVersion:0标志流语法版本号为0,
allStreamsSameTimeFraming标志复用到PayLoadMux()中的所有负载共享一个共同的时基音频子帧.

audioObjectType:2 AAC-LC

freameLengthType:0 帧长度是可变的

latmBufferFullness:0xFF 码率可变的码流


参考:

[1]ISO/IEC 13818-7(2003 MPEG-2 AAC, Second Edition)

[2] ISO13818-7(2006 Fourth edition AAC)

[3] RFC 3016 (rfc3016) - RTP Payload Format for MPEG-4 Audio-VisualStreams

[4] AAC音频压缩编码标准的ADTS与LATM格式分析

[5] GYZ 234-2008: CMMB复用实施指南

[6]ISO/IEC 14496-3 2005 (MPEG-4 PART-3)(LATM)

这篇关于AAC ADTS/LATM格式总结的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/804889

相关文章

MySQL中查询和展示LONGBLOB类型数据的技巧总结

《MySQL中查询和展示LONGBLOB类型数据的技巧总结》在MySQL中LONGBLOB是一种二进制大对象(BLOB)数据类型,用于存储大量的二进制数据,:本文主要介绍MySQL中查询和展示LO... 目录前言1. 查询 LONGBLOB 数据的大小2. 查询并展示 LONGBLOB 数据2.1 转换为十

在Java中实现线程之间的数据共享的几种方式总结

《在Java中实现线程之间的数据共享的几种方式总结》在Java中实现线程间数据共享是并发编程的核心需求,但需要谨慎处理同步问题以避免竞态条件,本文通过代码示例给大家介绍了几种主要实现方式及其最佳实践,... 目录1. 共享变量与同步机制2. 轻量级通信机制3. 线程安全容器4. 线程局部变量(ThreadL

SpringBoot 异常处理/自定义格式校验的问题实例详解

《SpringBoot异常处理/自定义格式校验的问题实例详解》文章探讨SpringBoot中自定义注解校验问题,区分参数级与类级约束触发的异常类型,建议通过@RestControllerAdvice... 目录1. 问题简要描述2. 异常触发1) 参数级别约束2) 类级别约束3. 异常处理1) 字段级别约束

Spring Boot 与微服务入门实战详细总结

《SpringBoot与微服务入门实战详细总结》本文讲解SpringBoot框架的核心特性如快速构建、自动配置、零XML与微服务架构的定义、演进及优缺点,涵盖开发环境准备和HelloWorld实战... 目录一、Spring Boot 核心概述二、微服务架构详解1. 微服务的定义与演进2. 微服务的优缺点三

Java通过驱动包(jar包)连接MySQL数据库的步骤总结及验证方式

《Java通过驱动包(jar包)连接MySQL数据库的步骤总结及验证方式》本文详细介绍如何使用Java通过JDBC连接MySQL数据库,包括下载驱动、配置Eclipse环境、检测数据库连接等关键步骤,... 目录一、下载驱动包二、放jar包三、检测数据库连接JavaJava 如何使用 JDBC 连接 mys

JavaSE正则表达式用法总结大全

《JavaSE正则表达式用法总结大全》正则表达式就是由一些特定的字符组成,代表的是一个规则,:本文主要介绍JavaSE正则表达式用法的相关资料,文中通过代码介绍的非常详细,需要的朋友可以参考下... 目录常用的正则表达式匹配符正则表China编程达式常用的类Pattern类Matcher类PatternSynta

Mysql常见的SQL语句格式及实用技巧

《Mysql常见的SQL语句格式及实用技巧》本文系统梳理MySQL常见SQL语句格式,涵盖数据库与表的创建、删除、修改、查询操作,以及记录增删改查和多表关联等高级查询,同时提供索引优化、事务处理、临时... 目录一、常用语法汇总二、示例1.数据库操作2.表操作3.记录操作 4.高级查询三、实用技巧一、常用语

利用Python脚本实现批量将图片转换为WebP格式

《利用Python脚本实现批量将图片转换为WebP格式》Python语言的简洁语法和库支持使其成为图像处理的理想选择,本文将介绍如何利用Python实现批量将图片转换为WebP格式的脚本,WebP作为... 目录简介1. python在图像处理中的应用2. WebP格式的原理和优势2.1 WebP格式与传统

C++ 函数 strftime 和时间格式示例详解

《C++函数strftime和时间格式示例详解》strftime是C/C++标准库中用于格式化日期和时间的函数,定义在ctime头文件中,它将tm结构体中的时间信息转换为指定格式的字符串,是处理... 目录C++ 函数 strftipythonme 详解一、函数原型二、功能描述三、格式字符串说明四、返回值五

SQL中JOIN操作的条件使用总结与实践

《SQL中JOIN操作的条件使用总结与实践》在SQL查询中,JOIN操作是多表关联的核心工具,本文将从原理,场景和最佳实践三个方面总结JOIN条件的使用规则,希望可以帮助开发者精准控制查询逻辑... 目录一、ON与WHERE的本质区别二、场景化条件使用规则三、最佳实践建议1.优先使用ON条件2.WHERE用