基于深度学习的声音识别技术
立即咨询
从声音特性角度来看,声音可以划分为语音、音乐、环境音三大类,
而目前主流的语音识别及声纹识别技术都是针对语音信号处理的,技术发展得已经相对成熟了。
PFU上海集团长期致力于环境音AI识别技术的研发。
针对需要辨别特定声音的应用场景,我们事先采集声音样本,进行AI深度学习和训练。
让识别引擎自我学习,最终在实际现场中,能够识别,甄别特定种类的声音。
在人工智能国际性权威竞赛DCASE 2018中取得过总冠军(声音识别领域)。
可以将一个复杂的环境中的声音进行辨别和分类。
(需要事先对辨别的声音进行学习,一种声音大约需要200个声音样本)
【DCASE2018 Task4 世界冠军】
异常音识别
针对异常音捕捉较困难的场景,
采用正常音学习和训练的方法,识别异常音的技术。
【DCASE2020 Task3 世界第6名】
三种和道路安全密切相关的声音事件AI识别。
把声音事件的AI识别和视频监控的图像分析相结合,
解决了以前仅靠图像识别所不能解决的问题!
预测以上六种机械发出的声音里面是否包含异常音,
检测技术对于实际现场业务的适用性强!
基于深度学习的声音识别技术
立即咨询