Insult.AI

AI 公然侮辱刑度通靈系統

常用 / 有趣字詞 點一下就直接加入輸入框

否認

良好

模型載入中...

預測罰金

0 元

此工具為研究與示範用途,非法律意見或裁判結果保證。

這個專案怎麼做的

網路上有一張「罵人價目表」在流傳,但它其實並不準確。我們收集 100 筆真實公然侮辱判決,訓練隨機森林 AI 來預測更貼近現實的罰金。

問題來源

網路上的「罵人價目表」將侮辱字詞簡化對應固定罰金,但實際判決會考慮累犯、坦承態度、犯後悔意等多個案情因素。

資料來源

從臺灣地方法院蒐集 100 筆公然侮辱案件判決,逐筆整理:侮辱字詞、案情因素(累犯、態度等)、最終罰金或拘役天數。

模型方法

資料前處理後用「隨機森林」演算法訓練,讓多個決策樹各自學習判決規律,最後投票決定罰金預測結果。

100 筆判決
數值化
隨機森林
罰金

各個決策樹投票決定結果

100 筆判決 → 轉成數字特徵 → 訓練多棵決策樹 → 預測罰金
100 筆資料限制
✓ 常見字詞預測準確
✗ 未見過的情況易失準
資料量 100 筆雖有限,但常見字詞仍可大致準確
同樣的罪
5 千元
法官 A
同樣的罪
2 萬元
法官 B
?
模型
法官判決本身不一致,模型無法完全複製

🔍 實作細節

  • 特徵工程:把判決文書轉成數值(累犯 0/1、拘役天數×1000 轉罰金、用 spaCy 分詞侮辱字詞)
  • 演算法:隨機森林是「三個臭皮匠勝過一個諸葛亮」的概念,多棵決策樹投票
  • 誤差:模型平均絕對誤差 7240 元左右,仍需改進

⚠️ 目前的限制

  • 資料量:只有 100 筆判決,無法覆蓋所有情況
  • 未知情況:遇到模型未見過的字詞或案情組合時,易退化成「用字數決定罰金」
  • 法官不一致:同樣的罪名,法官間判決差異大,這也是民眾感覺司法不公的原因之一

✨ 未來改進

  • 語境分析:考慮侮辱字詞使用背景與意圖
  • 更多資料:爬蟲取得更多判決書進行訓練
  • 完整判決書:不只用特定欄位,而是全文分析