ASR-CMN-002-v1慧听中英混合语音识别数据库
发布日期:2021-06-18
                                中英混合语音识别数据库在国内多个省市完成录制,共采集2000人的语音数据。发音人来自中国多个方言地区,男女比例均衡,年龄从18~65岁,发音自然流利。所有录制内容是中英文混合句,其中的中文部分用普通话发音。
具体采集地区如下表:
| 序号 | 方言区 | 地域范围 | 
| 1 | 北方官话区 | 北京、东北三省、河北、山东、河南等 | 
| 2 | 西南官话区 | 重庆、四川、云南、贵州、湖北 | 
| 3 | 粤语区 | 广东、广西 | 
| 4 | 吴语区 | 上海、江苏、浙江 | 
| 5 | 闽语区 | 福建、海南、广东潮汕地区 | 
| 6 | 赣语区 | 江西 | 
| 7 | 湘语区 | 湖南、广西北部 | 
该数据库总有效时长1000小时,数据采样率为16kHz,采样精度是16bit,为单通道录音,并以PCM非压缩文件格式存储。
录音采集设备是高端智能手机。
录音环境均为真实场景,分为三类:办公室/宿舍/家、餐厅/咖啡厅、街道。
全部录音数据与录音文本均由标注团队成员细心校对,保证句错误率低于5%。
该数据库能够反映中国各地大众水平英语发音的特点,在多种真实场景中录制,采集人数多,语音数据规模大,数据标注质量高,可用于真实场景语音识别系统训练、测试、语音分析、中英混合发音研究等多种用途。
相关数据
                                        - 
                                                    
                                                    评价:{{item.assess}}
