数据需满足下列需求:
语料 |
每人450句 |
性别 |
男女比例1:1,可上下浮动5% |
年龄 |
18~25岁60%,26~45岁35%,46~60岁5%,可上下浮动2% |
语言 |
湖北方言(武汉)(武汉详细地区) |
地域分布 |
见下方要求 |
录音环境 |
相对安静的环境,无回声() |
录音工具 |
安卓:iOS=3:1(手机型号要求,设备的提供,) |
音频格式 |
16kHz 16bit |
正确率 |
句正确率98% |
交付内容 |
采集并标注 |
录音人需要是湖北武汉本地人,能够正常流利地使用武汉方言。
a. 录音人必须是熟练使用相应方言的本地人。
b. 口齿清楚,态度认真,避免说话结巴、大舌头、嗓音嘶哑等病理性发音的人。
c. 参加录音的人(或其监护人)必须事先了解录音要求(录音方法、录音环境、朗读要求、合格指标)。
d. 每人只能录制一份该项目录音。如出现一人录制多份数据的现象将取消相应报酬。
e. 录制人员对录音人的录音号段做好分配,避免号段重复使用。
1) 录音要求:
a.录音设备及软件:该项目使用手机采集。手机应该尽可能覆盖当前市面上的主流机型。
手机需要摆放好,录制过程中不能移动。录制前先清理好手机内存,防止录制还没有完成时手机内存不足。
需自备一台笔记本电脑(需要安装Cool Edit或者Adobe Audition,以便及时查看录音文件的波形图、语谱图等)和无声鼠标。使用无声鼠标是为了避免录入鼠标点击声,导致数据不合格。
录制前先进行试录,确认手机上的录音文件没有截幅的情况。
b.录音环境:安静的室内,不能有其他人说话声、笑声,及其它噪音(鼠标点击声、敲击键盘声、空调声、音乐声、汽车声、风声、撞击声、突发噪音等),无回音。
不能在空旷的场地采集,例如:教室、礼堂、厕所、酒店大厅等。