慧听热销数据:上万小时中文方言数据

发布日期:2025-04-17

该数据库总有效时长>11000 小时,数据采样率为16 kHz,采样精度是16bit,为单通道录音,并以PCM非压缩文件格式存储。

总共采集了>20000人的语音数据,所有发音人可以说地道方言,发音自然流利。

语音采集设备是智能手机,采用基于Android、IOS两种系统的多种品牌型号手机进行录制。

录音环境以室内录制为主。

全部录音数据与录音文本均由标注团队成员细心校对,保证句错误率低于5%。

该数据库覆盖方言区内的主要城市,数据库规模大,录音质量好,数据标注质量高,可用于语音识别系统训练、测试、语音分析、方言研究等多种用途。

    • 新闻标题