remove </s> <s>
Jachym Kolar
jachym at kky.zcu.cz
Fri Apr 30 13:54:38 PDT 2004
Hello Nick,
you should use the script continuous-ngram-count.
E.g.:
continuous-ngram-count order=3 trainingtext | \
ngram-count -read - -write-vocab vocabulary -tolower -write output -lm lmfile
Regards,
Jachym
Cituji z e-mailu od Nick Romanyshyn <Nicholas.Romanyshyn at colorado.edu>:
> Hi,
>
> I'm using ngram-count to make a language model, but I don't want </s> or
> <s>
> to be included in the language model. I coudn't find anything in the
> documentation about how to keep this from happening. Could somebody point
> me
> to the code where </s> and <s> are inserted?
>
> Thanks,
> Nick Romanyshyn
>
>
More information about the SRILM-User
mailing list