1,027人唤醒词语音数据_朗读(麦克风)
唤醒词语音数据_朗读(麦克风),基于给定的唤醒词朗读并录制,覆盖慢速、匀速、快速三种语速。此数据集标注了文本内容、口音、出生地、性别等多种属性,由1027名来自中国8个不同省份的人员录制,准确性高,为语音识别相关研究及应用提供了丰富的资源,经多家AI公司验证:有助于模型面对真实世界的多样性时能够表现出色。我们严格遵循数据保护法规和隐私规定,确保数据采集、存储和使用的过程中维护用户的隐私和合法权益,所有数据均遵循GDPR,CCPA,PIPL。
数据规格
格式
48kHz,16bit,未压缩wav,单声道
内容分类
20个常用唤醒词
录音条件
专业录音棚
录音设备
高保真麦克风
录音人信息
共计1027名中国人,其中48%为男性,52%为女性
国家
中国
语言
中文普通话,英语;
标注特点
标注文本内容、口音、出生地、性别
样例展示
0:00/ 0:00
小艺小艺
0:00/ 0:00
小艺小艺
0:00/ 0:00
小艺小艺
0:00/ 0:00
小艺小艺
0:00/ 0:00
小艺小艺