提供服务
To Provide Services

语音数据库制作

语音数据库文本设计
语音识别数据录制以及文本及语言现象标识
语音合成数据库录制以及音节、音素切分及韵律层次标注
各语种(含小语种)、国内主要方言

音乐数据制作标注

音乐音频制作
哼唱识别库
歌曲曲谱和内容标注
歌曲人声旋律MIDI制作

语音质量评测

评测文本设计
MOS评测、对比评测
各语种(含小语种)、国内主要方言
评测软件工具开发

文本数据标注

文本设计
文档归类、关键词、NER\磁性、Chunk标注等
各语种(含小语种)

配音

音宣传片配音
方言配音

图像数据标注

按定制要求标出图中目标

其他数据制作

手写识别库

热销数据
Sales data
    • 该数据库总有效时长3000 小时,数据采样率为16K,采样精度是16bit,为单通道录音,并以PCM 非压缩文件格式存储。 总共采集了3000人的语音数据,所有发音人具有明显口音,朗读自然流利。 男女性别比接近1:1。语音采集设备是智能手机,采用基于Android 系统的多种品牌型号手机录制; 录音环境有室内、室外多种真实场景。录音数据与文本均由标注团队成员细心校对,句错误率低于2%。
    • 中英混合语音识别数据库在国内多个省市完成录制,共采集2000人的语音数据。发音人来自中国多个方言地区,男女比例均衡,年龄从18~65岁,发音自然流利。所有录制内容是中英文混合句,其中的中文部分用普通话发音。
    • 近场命令词语音识别数据库总共采集了350人的语音数据。录音人群年龄分布为4岁~75岁,录音人口音覆盖北方官话、西南官话、粤语、吴语、闽语、赣语、湘语几大方言区,且录音人性别比均衡、发音自然流利。
    • 轻口音普通话语音识别数据库在北方地区完成语音采集工作。该数据库总有效时长200小时,数据采样率为16 kHz,采样精度是16bit,为单通道录音,并以PCM非压缩文件格式存储。
    • 中国人英文语音语音识别数据库采集了200人的语音数据。所有发音人来自中国八个方言地区,朗读自然流利。每位发音人的录音数据为纯英文句,发音内容是日常口语。
    • 多语种语音识别数据库的采集工作在国外多个国家完成。所有发音人的母语均为对应录制语种,性别比例均衡,发音自然流利,年龄段是15~70岁。

 

慧听新闻
新浪微博

慧听数据是个很强大的数据库网站,有过万的数据采集和标注人员。