内含超 100 万小时多语种录音,MLCommons 推出大型音频数据集

xxn 阅读:58418 2025-02-10 20:02:42 评论:0

IT之家于2月10日报道,AI工程联盟MLCommons在1月30日发布了名为Unsupervised People's Speech的数据集。该数据集将超过100万小时的音频资料聚集在一起,为AI在音频发展方面的未来奠定了坚实的基础

Unsupervised People's Speech数据集的音频资源来源于 Archive.org,由MLCommons与HuggingFace合作开发,尚未经过数据推理和预处理。

该数据集 总容量超过48TB。尽管以美式英语为主,Unsupervised People's Speech还涵盖了多种语言;其中大部分音频的时长在1至10分钟之间,仅有14个音频时长超过100小时。

广告声明:文中包含的外部链接(如超链接、二维码、访问口令等)旨在提供更多信息,帮助读者节省筛选时间,结果仅供参考。

声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

搜索
排行榜
关注我们

扫一扫关注我们,了解最新精彩内容