中文假文產生器

了我還被公司說的精壓力第一名，免費成為期其實，應該是。最近已未來運的價值：作者好意思，是喜看來的能力，一切多人定配可愛啊，弟弟出現盼。真的很，才發掉也太的分命把⋯如果你量，好可愛大概內其實也高的，滅之刃，怎麼回了這樣。現蓋英文讀書舞因為要不要，回家合的個謝你我就到現在，要回前兩天能說，啊啊啊識，大我這麼他是：卡片希望麼時候希望明影山希望你。

路上那個是，底下不好意⋯全就是希望能：一次沒什麼人輩情感約會毛還是，元原來如動中雖然接下不知道。

這是什麼鬼東西？

一段乍看之下像是文章，但仔細一瞧全無道理的文字組合。

這能幹嘛？

給做版面設計的人在版面上塞入一些文字，觀察版面填入文字之後的效果。

另外，有些人以看這種東西為樂。

誰這麼無聊？

這個人。

有沒有其他類似的東西？

當然有：

亂數假文產生器
MoreText（注意網址改了，要打 https://more.iter.tw/sentences.json）
中文假字生成器

有沒有 API 可以用？

支援參數:

format: html、plain、json，輸出格式，預設為 html
size: 1~2000 的正整數，預設為 200
type: 文字類型，預設為 default（白話文）。支援類型如下：
- default（白話文）
- wenyan（文言文）
- poem5（五言詩）
- poem7（七言詩）
- name（姓名）
- miew（「喵」）
- wala（「哇啦」）
- wenzi（「文字」）

範例：

# 直接取得純文字
curl -s 'https://textgen.cqd.tw?format=plain&size=300'

# 取得 JSON 格式回應
curl -s 'https://textgen.cqd.tw?format=json&size=500' | jq -r .text

假文怎麼做的？

蒐集大量中文文章，排除非文字符號後算出 1-gram / 2-gram / 3-gram 的頻率統計，把三者次數加權（3-gram 出現十次的意義比 1-gram 出現十次大得多）之後取出加權分數前一萬名。最後以分數為準做加權隨機取樣，連續取到文字數量足夠為止。

標點符號與斷行則是每次取字之後丟骰子決定，機率高低是憑感覺亂設。

...看不懂

不重要，沒關係，看得懂的人都怪怪的。