Google数据集audio set 使用教程

Audioset 官网

前言

注意这个数据集是依托于youtube的,不是一键下载文件全都有的。
所以使用起来略有一些繁琐。不过放心,我这里已经找到了很多工具,可以方便使用。

下载数据集索引

进入 https://research.google.com/audioset/download.html
下载 Unbalanced train
这是一个csv格式
打开后会发现
形如这样
Aclv9drugo0, 50.000, 60.000, "/m/03q5_w,/m/09x0r"
从左到后是youtube视频id,音频开始时间,结束时间,最后就是label了。

label 的索引

进入这里
https://github.com/audioset/ontology
打开ontology.json文件,这里有label的编码和对应的实际意义。
例如我想要所有包含piano声音的片段
搜索Piano,得到对应 id 是 /m/05r5c

piano.png

如此便可从csv文件中筛选出需要的视频id.

下载音频/视频

这段代码会帮你根据id分析出视频的下载地址,mp4,flv等格式
https://github.com/zarkiel/Youtube
最后提取对应时间的音频片段即可。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
    passiontim阅读 172,913评论 25 708
  • 跳跃,旋转 漫开的随心所欲 涂上心情的神奇 绚烂成花般的笑脸 指尖触摸不到的幸福 ...
    颜弋阅读 224评论 0 1
  • 赏肉,万紫千红总是春,多肉花开正当时。 唯有先感动自己才能感动他人。 请原谅,有的名子记不清楚了。 这盆状态不错,...
    红色康乃馨_5792阅读 356评论 0 0
  • Actions 描述了用户所会作出的操作。 Action 有两种形式: action和actionAndWait,...
    吸血鬼日记阅读 3,766评论 1 5