Insult.AI
AI 公然侮辱刑度通靈系統
預測罰金
0 元
這個專案怎麼做的
網路上有一張「罵人價目表」在流傳,但它其實並不準確。我們收集 100 筆真實公然侮辱判決,訓練隨機森林 AI 來預測更貼近現實的罰金。
問題來源
網路上的「罵人價目表」將侮辱字詞簡化對應固定罰金,但實際判決會考慮累犯、坦承態度、犯後悔意等多個案情因素。
資料來源
從臺灣地方法院蒐集 100 筆公然侮辱案件判決,逐筆整理:侮辱字詞、案情因素(累犯、態度等)、最終罰金或拘役天數。
模型方法
資料前處理後用「隨機森林」演算法訓練,讓多個決策樹各自學習判決規律,最後投票決定罰金預測結果。
100 筆判決
→
數值化
→
隨機森林
→
罰金
各個決策樹投票決定結果
100 筆資料限制
✓ 常見字詞預測準確
✗ 未見過的情況易失準
同樣的罪
5 千元
法官 A
同樣的罪
2 萬元
法官 B
?
模型
🔍 實作細節
- 特徵工程:把判決文書轉成數值(累犯 0/1、拘役天數×1000 轉罰金、用 spaCy 分詞侮辱字詞)
- 演算法:隨機森林是「三個臭皮匠勝過一個諸葛亮」的概念,多棵決策樹投票
- 誤差:模型平均絕對誤差 7240 元左右,仍需改進
⚠️ 目前的限制
- 資料量:只有 100 筆判決,無法覆蓋所有情況
- 未知情況:遇到模型未見過的字詞或案情組合時,易退化成「用字數決定罰金」
- 法官不一致:同樣的罪名,法官間判決差異大,這也是民眾感覺司法不公的原因之一
✨ 未來改進
- 語境分析:考慮侮辱字詞使用背景與意圖
- 更多資料:爬蟲取得更多判決書進行訓練
- 完整判決書:不只用特定欄位,而是全文分析