中文假文產生器
出現的一次果沒都有⋯的很後應該個不讓你例如做的,也有不是其實我怎麼會沒有,這麼久,得自己的關可以開活動,是感覺上河道。人們成這樣⋯這樣很演員,都會要注意。到了會有這果真的,自的還是比實現疾。喜歡你一,間不是日:這邊我提醒為的我第一沒關係咒術的,中並且我們就⋯的時會不的活了大家,難怪用一。大知道跟他:小時第一名其妙,朋友吃還是在很擔心因為自,己的開⋯
看到的很可,印象在不懂個,練貓貓天花參考台灣我的可能,把孩子我買生打算,起的是我我比係明天主要是,什麼都有也很可圖看到。
這是什麼鬼東西?
一段乍看之下像是文章,但仔細一瞧全無道理的文字組合。
這能幹嘛?
給做版面設計的人在版面上塞入一些文字,觀察版面填入文字之後的效果。
另外,有些人以看這種東西為樂。
誰這麼無聊?
這個人。
有沒有其他類似的東西?
當然有:
有沒有 API 可以用?
支援參數:
- format:
html
、plain
、json
,輸出格式,預設為 html - size: 1~2000 的正整數,預設為 200
- type: 文字類型,預設為
default
(白話文)。支援類型如下:default
(白話文)wenyan
(文言文)poem5
(五言詩)poem7
(七言詩)name
(姓名)miew
(「喵」)wala
(「哇啦」)wenzi
(「文字」)
範例:
# 直接取得純文字
curl -s 'https://textgen.cqd.tw?format=plain&size=300'
# 取得 JSON 格式回應
curl -s 'https://textgen.cqd.tw?format=json&size=500' | jq -r .text
假文怎麼做的?
蒐集大量中文文章,排除非文字符號後算出 1-gram / 2-gram / 3-gram 的頻率統計,把三者次數加權(3-gram 出現十次的意義比 1-gram 出現十次大得多)之後取出加權分數前一萬名。最後以分數為準做加權隨機取樣,連續取到文字數量足夠為止。
標點符號與斷行則是每次取字之後丟骰子決定,機率高低是憑感覺亂設。
...看不懂
不重要,沒關係,看得懂的人都怪怪的。