詩で突破?AIの意外な弱点が明らかに
Update: 2025-11-24
Description
AIの安全対策に思わぬ脆弱性が発見されました。イタリアの研究チームによると、悪意ある指示を「詩的な表現」に変換するだけで、多くのAIモデルのガードレールを迂回できてしまうとのこと。通常の文章では8%しか突破できなかったのに、詩にすると62%、モデルによっては90%以上の成功率に。最新モデルは対策されていますが、AI全体に共通する課題として、安全性評価の見直しが求められています。技術と安全対策のイタチごっこ、まだまだ続きそうです。
Comments
In Channel























