内含超 100 万小时多语种录音，MLCommons 推出大型音频数据集

xxn 阅读：58418 2025-02-10 20:02:42 评论：0

IT之家于2月10日报道，AI工程联盟MLCommons在1月30日发布了名为Unsupervised People's Speech的数据集。该数据集将超过100万小时的音频资料聚集在一起，为AI在音频发展方面的未来奠定了坚实的基础。

Unsupervised People's Speech数据集的音频资源来源于 Archive.org，由MLCommons与HuggingFace合作开发，尚未经过数据推理和预处理。

该数据集 总容量超过48TB。尽管以美式英语为主，Unsupervised People's Speech还涵盖了多种语言；其中大部分音频的时长在1至10分钟之间，仅有14个音频时长超过100小时。

广告声明：文中包含的外部链接（如超链接、二维码、访问口令等）旨在提供更多信息，帮助读者节省筛选时间，结果仅供参考。

声明

1.本站遵循行业规范，任何转载的稿件都会明确标注作者和来源；2.本站的原创文章，请转载时务必注明文章作者和来源，不尊重原创的行为我们将追究责任；3.作者投稿可能会经我们编辑修改或补充。