Commit db26e325 authored by Cassio Batista's avatar Cassio Batista 🐢

3gram lm added

parent 46b983ff
This diff is collapsed.
# Modelo de Linguagem
LapsLM1.0: Modelo de linguagem n-grama construído com o toolkit SRILM. Para
treino foram utilizadas frases dos corpora CETENFolha, Spoltech, OGI-22,
Westpoint, LapsStory e LapsNews, totalizando 1,6 milhões de frases. O dicionário
utilizado no treino foi o UFPAdic3.0 com 64.972 palavras. O modelo possui
perplexidade 169 e a técnica de suaviação (smoothing) utilizada foi a Kneser-Ney
discounting.
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment