中文假文產生器

我要 字的
的長大概也是大的時候我想:控制李交易蓋新居沒有辦的爛有沒有。

希望有我怎身我愛兩人,最後的衣昨天,真的是還是話要不要很多次之後,了真了嗎讓自過卻了吧,忙剛剛想到,這樣。路上,給我這樣旁邊還沒關一起玩第一己,大概天早上是不是現有些不包包。

一邊我那我好意思,裡面也有人。之類的幹你裡面,並沒有我只糖本來想⋯他的不得很喜歡是在炭治郎,掙扎還可,竟然一下總遇到心臟是天,變得遲一個是以才太誇張。還有這不知道看到的一個,外哪完惡魔無這種,也知道調重複,買一的東西一次⋯封公的一好時候沒⋯之後也是一就是因了一下。

這是什麼鬼東西?

一段乍看之下像是文章,但仔細一瞧全無道理的文字組合。

這能幹嘛?

給做版面設計的人在版面上塞入一些文字,觀察版面填入文字之後的效果。

另外,有些人以看這種東西為樂。

誰這麼無聊?

這個人

有沒有其他類似的東西?

當然有:

有沒有 API 可以用?

支援參數:

範例:

# 直接取得純文字
curl -s 'https://textgen.cqd.tw?format=plain&size=300'

# 取得 JSON 格式回應
curl -s 'https://textgen.cqd.tw?format=json&size=500' | jq -r .text 

假文怎麼做的?

蒐集大量中文文章,排除非文字符號後算出 1-gram / 2-gram / 3-gram 的頻率統計,把三者次數加權(3-gram 出現十次的意義比 1-gram 出現十次大得多)之後取出加權分數前一萬名。最後以分數為準做加權隨機取樣,連續取到文字數量足夠為止。

標點符號與斷行則是每次取字之後丟骰子決定,機率高低是憑感覺亂設。

...看不懂

不重要,沒關係,看得懂的人都怪怪的。