1 Star 0 Fork 0

hjsxhst2022 / 一个基于 trigram 模型的语言模型

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
克隆/下载
贡献代码
同步代码
取消
提示: 由于 Git 不支持空文件夾,创建文件夹后会生成空的 .keep 文件
Loading...
README
WTFPL

一个基于 trigram 模型的语言模型

介绍

这是一个基于 trigram 模型的语言模型。

这份代码会统计训练文本中所有可能的三个连续单词的组合,并记录每个组合后面可能出现的单词。在生成文本时,程序会根据已经统计好的 trigram 模型,通过前两个单词来预测下一个单词,从而逐步生成新的文本。

当然了,训练数据越多,生成的文本更加像人。 这是一个基于 trigram 模型的语言模型。

这份代码会统计训练文本中所有可能的三个连续单词的组合,并记录每个组合后面可能出现的单词。在生成文本时,程序会根据已经统计好的 trigram 模型,通过前两个单词来预测下一个单词,从而逐步生成新的文本。

当然了,训练数据越多,生成的文本更加像人。

具体解释

link (大佬%%)

训练模版

训练的文件中可以直接放英文句子。 For example:

I love you!
I am worshiping a person who is skilled at writing code.
Writing code can exercise our minds.

就这样,也可以短文,但不要一个个的单词。

这边给一个我的一个简单的训练文件:link

更新日志

v1.0.0:

制作了此文件

v1.0.1:

增加了模糊搜索,用户自定义主题功能,修复了一些已知bug。

软件架构

单个程序运行,也可多程序运行

参与贡献

hjsxhst2022独家制作

DO WHAT THE FUCK YOU WANT TO PUBLIC LICENSE Version 2, December 2004 Copyright (C) 2004 Sam Hocevar <sam@hocevar.net> Everyone is permitted to copy and distribute verbatim or modified copies of this license document, and changing it is allowed as long as the name is changed. DO WHAT THE FUCK YOU WANT TO PUBLIC LICENSE TERMS AND CONDITIONS FOR COPYING, DISTRIBUTION AND MODIFICATION 0. You just DO WHAT THE FUCK YOU WANT TO.

简介

这是一个基于 `trigram` 模型的语言模型。 这份代码会统计训练文本中所有可能的三个连续单词的组合,并记录每个组合后面可能出现的单词。在生成文本时,程序会根据已经统计好的 `trigram` 模型,通过前两个单词来预测下一个单词,从而逐步生成新的文本。 当然了,训练数据越多,生成的文本更加像人。 展开 收起
C++
WTFPL
取消

贡献者

全部

近期动态

加载更多
不能加载更多了
C++
1
https://gitee.com/hjsxhst2022/trigram.git
git@gitee.com:hjsxhst2022/trigram.git
hjsxhst2022
trigram
一个基于 trigram 模型的语言模型
master

搜索帮助