毕业论文
计算机论文
经济论文
生物论文
数学论文
物理论文
机械论文
新闻传播论文
音乐舞蹈论文
法学论文
文学论文
材料科学
英语论文
日语论文
化学论文
自动化
管理论文
艺术论文
会计论文
土木工程
电子通信
食品科学
教学论文
医学论文
体育论文
论文下载
研究现状
任务书
开题报告
外文文献翻译
文献综述
范文
基于旋律的音乐检索系统设计与实现(7)
(1)如果在MIDI文件里标明了哪个轨道是主轨道,则选择主旋律轨道,忽略其它轨道。该方法虽然准确,但主要问题在于,并不是每个MIDI文件都标明了主旋律轨道。
(2)保留所有轨道,对所有轨道进行处理。该方法虽然不会遗漏主轨道旋律,但由于包含的旋律过多,匹配的速度大大下降。而且其它轨道的旋律会影响对主旋律的匹配,导致匹配的准确性下降。
在实际中,系统采用的方法是:首先去掉音符数量较少的轨道,因为这样的轨道不可能表达主旋律。然后将剩余的轨道数据合并到一起,当出现同一个!!寸刻有多个音符的时候,只选择那个音强最强的音符。
3.5 主旋律的特征提取
(1)细化轮廓特征
许多文献对音乐的记忆特性进行了研究,旋律的变化比精确的旋律更易于记忆。旋律的变化是指相邻音符的音高和音长变化。人们很难准确的把握每个音符的音高和持续时间,但是对音高和音长的变化却能准确的哼唱出来。然而许多研究中将相邻音符音高和音长的变化分为U, D, R三种情况,误差很大。因此系统中对旋律轮廓进行了细分,使用5级轮廓表达音乐的旋律,即:上升、跳升、下降、跳降和重复,并以“u;U;d;D; R”表示。通过对MIDI音乐进行统计,相邻音符的音阶差大多在[-2,2]之间,音长比大约在[[0.8,1.2]之间。在实际中发现,使用3级轮廓图的系统将会返回较多的结果,需要较长的哼唱时间,而使用5级轮廓图既能够清楚的区分旋律的变化又避免了返回过多的检索结果,取得了比较理想的效果。可能表达主旋律。然后将剩余的轨道数据合并到一起,当出现同一个时刻有多个音符的时候,只选择那个音强最强的音符。
其中M为音阶差,N为音长的比值。
(2)音长计算方式
采用“音符起点一音符起点”是指从一个音符的起始时刻到下一个音符的起始时刻之间的间隔。实验中发现:人们在哼唱的时候,对于每个音符的开始时间把握的很好。而且,当节奏比较慢或者某些音符比较长时,哼唱者并没有耐心去唱完整个音符,经常会提前结束。因此,系统将“音符起点一音符起点”作为每个音符的长度,大大提高了检索的准确程度。
3.6 特征文件的生成
考虑到处理速度的原因,MIDI数据库文件并不是在每次哼唱的时候进行处理的,而是预先处理成特征文件,当匹配检索时再加以调用。因为如果每次哼唱的时候都处理一遍MIDI数据库文件,会花费很多的时间,而且会重复处理同一首歌;而如果预先生成特征文件,每次匹配的时候只要将哼唱歌曲的特征和特征文件中的特征进行匹配即可。当有新的MIDI歌曲加入数据库时,只要对这些新的MIDI进行处理并加入到原来的特征文件即可。
3.7 本章小结
本章首先讨论了MIDI文件格式作为数据库音频储存格式的优点,然后进一步对MIDI音频文件格式作了详细的分析,最后介绍了从MIDI中提取旋律特征的具体方法和如何生成特征文件。
4 输入音频旋律的特征提取
4.1 音频信号的初步处理
4.1.1 信号的预加重
对于哼唱输入的音乐信号,由于其平均功率谱受到声门激励和口鼻辐射的影响,高频端大约在800Hz以上按6dB/倍频程跌落,以至于音乐信号的频谱中,频率越高相应的成分越小。因此要对音乐信号进行预加重处理来提升高频部分。在实际中,预加重处理是通过具有6dB/倍频程的提升高频特性的预加重数字滤波器来实现的。它是一阶的数字滤波器,如公式3.4所示:
(4.1)
共14页:
上一页
1
2
3
4
5
6
7
8
9
10
11
12
13
14
下一页
上一篇:
MATLAB铁路监控视频的超分辨率技术研究
下一篇:
仿生模式识别方法及应用的研究+文献综述
基于TCP/IP技术的转向架振动测试系统设计
基于PM2.5浓度的健康出行路径规划及实现
基于涡旋电磁波的新型雷达成像技术研究
基于相关滤波器的长期跟踪算法研究
基于ZigBee协议轨道交通环...
基于QT的图像处理系统设计
基于LBG算法的语音信号的矢量量化方法设计
浅析施工企业保理融资成...
从企业eHR建设谈管理信息...
遥感土地用变化监测国内外研究现状
大规模MIMO系统的发展研究现状
PCI+PID算法直流力矩电机速...
小型通用机器人控制系统设计任务书
《水浒传》中血腥暴力研...
高效课堂教师问卷调查表
提高小學语文課堂朗读教...
MNL模型历史城区居民活动...