利用python判定流媒体mp3名目
项目中利用mp3名目举办音效播放,碰着一个mp3文件在措施中死活播不作声音,最后发明它是wav名目标文件,却以mp3末了。要对资源举办mp3名目判定,那么如何判定呢,用.mp3后缀必定不靠谱,我们知道扩展名是可以任意修改的,得从编码名目判定,要领如下:
-
mp3编码
MP3文件是一种流媒体文件名目,所以没有文件头。像AVI、WAV这种有文件头的名目,很好判定,他们都是RIFF开头的,只要举办RIFF字符串比拟,就可以查出是否是AVI、WAV,而mp3就只能阐明编码名目了。这里或许说mp3编码法则一下,具体的可用参考这篇文章
MP3 文件概略分为三部门:TAG_V2(ID3V2),音频数据,TAG_V1(ID3V1)
a). ID3V2 在文件开始的位置,以ID3开头,包括了作者,作曲,专辑等信息,长度不牢靠,扩展了ID3V1 的信息量,非必须
b). 一系列的音频数据的帧,在文件的中间位置,个数由文件巨细和帧长抉择;每个帧都以FFF开头,的长度大概不牢靠,也大概牢靠,由位率bitrate抉择;每个帧又分为帧头和数据实体两部门;帧头记录了mp3 的位率,采样率,版本等信息,每个帧之间彼此独立 。
c). ID3V1在文件末了的位置,以TAG开头,包括了作者,作曲,专辑等信息,长度为128Byte,非必需。
ID3V2
包括了作者,作曲,专辑等信息,长度不牢靠,扩展了ID3V1的信息量。
Frame
.
.
.
Frame
一系列的帧,个数由文件巨细和帧长抉择
每个FRAME的长度大概不牢靠,也大概牢靠,由位率bitrate抉择
每个FRAME又分为帧头和数据实体两部门
帧头记录了mp3的位率,采样率,版本等信息,每个帧之间彼此独立。
ID3V1
包括了作者,作曲,专辑等信息,长度为128BYTE。
也就是说,按照TAG_V2(ID3V2),音频数据,TAG_V1(ID3V1)三布局中的开头信息,便可以判定出是不是mp3编码的文件。
2.python代码
# coding: utf-8
import os
#mp3filePath是否是mp3名目标
def isMp3Format(mp3filePath):
#读取文件内字符串
f = open(mp3filePath, "r");
fileStr = f.read();
f.close();
head3Str = fileStr[:3];
#判定开头是不是ID3
if head3Str == "ID3":
return True;
#判定末了有没有TAG
last32Str = fileStr[-32:];
if last32Str[:3] == "TAG":
return True;
#判定第一帧是不是FFF开头, 转成数字
# fixme 应该轮回遍历每个帧头,这样才气100%判定是不是mp3
ascii = ord(fileStr[:1]);
if ascii == 255:
return True;
return False;
#遍历folderPath看看是不是都是mp3名目标,
#是就true,不是就是false, 并返回是mp3的list,不是MP3的list
def isMp3FolderTraverse(folderPath):
mp3List = [];
notMp3List = [];
isAllMpFormat = True;
for dirpath, dirnames, filenames in os.walk(folderPath):
for filename in filenames:
path = dirpath + os.sep + filename;
isMp3 = isMp3Format(path);
#判定是不是mp3末了的 而且 是mp3名目标
if isMp3 == False and str.endswith(path, ".mp3") == True:
# print("--warning: file " + path + " is not mp3 format!--");
notMp3List.append(path);
isAllMpFormat = False;
else:
mp3List.append(path);
return isAllMpFormat, mp3List, notMp3List;
if __name__ == '__main__':
isMp3Format("s_com_click1.mp3");
isAllMp3, mp3List, notMp3List = isMp3FolderTraverse("sound");
print isAllMp3;
print mp3List;
print notMp3List;