在构造测试文本。
在终端文件夹~/mtworkdir/mosesdecoder/lixiang中:
/home/xdj/mtworkdir/mosesdecoder/scripts/tokenizer/tokenizer.perl -l en <b.en> b.tok.en
home/xdj/mtworkdir/mosesdecoder/scripts/tokenizer/tokenizer.perl -l en <b.cn> b.tok.cn
/home/xdj/mtworkdir/mosesdecoder/scripts/recaser/train-truecaser.perl --corpus b.tok.en --model b.model.en
/home/xdj/mtworkdir/mosesdecoder/scripts/recaser/train-truecaser.perl --corpus b.tok.cn --model b.model.cn
/home/xdj/mtworkdir/mosesdecoder/scripts/recaser/truecase.perl --model b.model.en<b.tok.en>b.true.en
/home/xdj/mtworkdir/mosesdecoder/scripts/recaser/truecase.perl --model b.model.cn<b.tok.cn>b.true.cn
/home/xdj/mtworkdir/mosesdecoder/scripts/training/clean-corpus-n.perl b.true cn en b.clean 1 80
原文:http://www.cnblogs.com/XDJjy/p/5270213.html