接触SPPAS有一段时间了,总是不得要领,实话讲,总是运行不出来,最近发现更新后,又试了一下,终于运行成功!但是目前只是试验的英语,使用这个工作对于标注工作有一个很大的效率提升,但是后期还要有更多的要学习的地方,比如汉语的使用?是否可以自己制作词典?比如标注后的标注方式转化,因为这里用的是SAMPLE标注,是否可以使用PRAAT本身的标注?在此只是把自己如何安装,以及如何使用的过程记录下来。未完持续。
1. 安装过程
安装之前需要安装4个环境组件,包括:(以下选自SPPAS的官方网站:http://aune.lpl.univ-aix.fr/~bigi/sppas)
During the installation, click three times on the "Next" button and then on "Finish".
Click here to download wxPython
During the installation, click on the "Next" button and then on "Finish".
Click on the sox-VERSION-win32.exe. Click Next, Install and Close. Then, open the Explorer and go to into the sox installation directory location. Select the file "sox.exe" and the .dll files. Copy these files into C:\WINDOWS\
Choose the "Binary for Windows (zip)" file in the "Quick download" menu.
Extract the archive (in the "C:\WINDOWS\Programs Files" directory for example). Then, open the Explorer and go to into the installation directory. Open the "bin" directory then select the file "julius.exe". Copy this file into C:\WINDOWS\ .
2.然后在http://aune.lpl.univ-aix.fr/~bigi/sppas/download.php里下载最新版本的SPPAS工具,并解压缩。解压之后,打开目录里的sppas.bat,就可以运行了。
使用:
1. 打开之后的界面是这样的,有一个SPPAS的主窗口,另外有一个Python的运行监视窗口,主要的操作在SPPAS的主窗口里。
2. 准备声音文件和文本文档,声音文件就是普通的录音文件,.wav格式,最好是以句子的形式,至于对于篇章的声音文件,效果如何,在此并未测试。另外每一个声音文件同文件名对应一个文本文档,里面是这句话的文本,格式为UTF-8。
3. 添加声音文件至SPPAS主窗口里,然后选择右下角的几个选项,Tokenization,PHonetizatiion, Alignment里都选择EN,代表是英语句子。然后点最右下角的执行按钮。和声音文件同目录里就会产生标注好的文件。
原文:http://blog.csdn.net/shaopengfei/article/details/18351809