Quantcast
Channel: ブレークスルー・テクノロジー10 – MITテクノロジーレビュー
Viewing all articles
Browse latest Browse all 799

LLMでLLMの「脱獄」防げ、アンソロピックが防御策で新手法

$
0
0
アンソロピックが、大規模言語モデルの不正利用を防ぐ新手法を開発した。悪意ある指示への応答を遮断する防御壁により、「脱獄」の成功率を86%から4.4%に抑制することに成功している。

Viewing all articles
Browse latest Browse all 799

Trending Articles