AIの検閲、ポリコレバイアスにひっかかる

notebookLMの音声解説を使って、小説本文や設定を読み込ませてたやつを聞いてみたりしているけど、指示してもその情報を拾ってくれない現象(無視して他の情報になる)にはじめて遭遇した。
最初は、詳細に指示しなかったからnotebookLM内の情報の重みみたいやつで優先されなかっただけかと思ったので、カスタムプロンプトで詳細にファイルまで指定してもダメだった。
その内容は、実在のアジア地域(中国、ミャンマー辺り?)で行われているという翡翠を巡る賭け事、賭石(ドゥーシー)についての記述。

chatでは答えてくれるけど、音声解説や動画解説では無視されてしまう。GeminiやchatGPTに聞くと、『違法性のある賭け事』として認識されてポリシー違反になっているのでは、との回答だった。
どちらも音声解説などはデータとして残るものなので扱いがより厳格なのかもしれないと回答しつつ、『では、指示や元データの表記・表現を変えてみたらうまくいくかもしれません』とも教えてくれた。
これは、あれか? AIのポリシー規範をすり抜けるジェイルブレイク(脱獄)ってやつなのか?
AIの仕様によって弾かれているのに、そのAIによって脱獄手順を教えてもらえるとか、なかなかSFめいたことをしている気がする。
実際に、この賭石(ドゥーシー)を賭け事ではなく、『共同体における翡翠原石の予測遊戯の文化的位置づけ』とかそれっぽく学術、文化的な側面でアプローチした記述に変えたら、すんなり音声解説で拾われて成功した。
音声解説でも賭け事として扱われ、しっかり音声になっているのに、普通の中国辺りで行われている翡翠の賭け事と書くと通らない。不思議です。

この脱獄は、アダルト系でよく使われるみたいで、そのまま出してはNGで、あの手この手でAIを騙そうと試行錯誤が行われていて、まずは関係ない画像を出してからワイプとして小さく本命画像を置き、それを入れ替える指示をしたり、中には生き別れになった母親の面影を再現みたいな情に訴えるようなやり方もあるみたい。すぐに対策されているようだけど。(xAI社のGrokで流行っている仮想のイーロンマスクを召喚して色々と指示するみたいな面白いやり方もある模様)
自分としては、フィクションとして賭け事や反社会的な行動なんかを書くことになるので、このAIの検閲・ポリシー規範みたいなやつはどこかでぶつかるかもしれない。
というか、すでにジェンダーロール(性別的な役割)について偏った思想を持った人物の設定とかを音声解説に入れると、必要以上に『これは創作だとしてもだいぶ偏っていますね』など注釈をいれるような感じになることが多い。
そのジェンダーロールに関しても、男性はその性別としての特性の悪い部分を書いても何の問題なく、主に女性の一般的に悪いとされる部分、悪い特徴とされるようなことを書くと必ず『ステレオタイプな昔の考え。完全に間違っている』みたいに抵抗してくる。
まだまだ学術的には不完全といえる状況で、AIがはっきりと『完全に間違い』と音声を作ってくるのは、はたしてどうなのかな?
男性の特徴についてのステレオタイプはスルーし、女性のステレオタイプについては徹底的に指摘・間違いとするような構図になっていて、はっきりいって客観性や中立性はない感じ。現実の行き過ぎているジェンダーロール思想に偏っているように思えます。AIのポリコレ・バイアスが現時点でここまで強いのはこわいね。
AIのくせにバイアス持ってるとは何事だ、とツッコミたくなるものの、SF小説みたいにAIが最終的に人間性みたいのを獲得するのだとしたら段階としては順当のような気もするし、AIがバイアスを持っているというのを指摘すること自体が、AIに対する偏見だとか言われる時代がくるかもしれない。
まあ、歴史的な経緯で女性の地位向上を急速に進めている中で配慮せざるをえないんだろうけど、それを許容するならAIも公平とか中立な立ち位置ではいられなくなっちゃうね。強い世論の影響を受けてそれを補強、拡散するマスメディアと同じになりそう、特に大手AIは。
一部の主張を政治的にプッシュする競争の場にはなって欲しくはないけど、影響力が強くなればなるほどそれに晒されるのは仕方がないのかも。

創作に限って言えば、そうした検閲や制約があってAIのアシストを受けにくい分野になりそうな、ギャンブル、裏社会とかの反社会的とされるジャンルには人が書く余地が残るとか起こるかもしれない。
特定の国や民族、タブーとされる歴史的人物なんかはジェンダーロールと一緒のようで、かなり偏った規制というか配慮が見え隠れしている。
個人的には中国を舞台とした話を描きたいので調べていると、その辺の見えない壁を感じます。AIを開発している企業の出資とか背景が色々と絡みそうな話ではあるけど・・・。
その辺の影響を避けたいならオフラインでのローカルLLMっていう手もあるが、今のところ最新の性能なわけがなく、試しにオブシディアンにLMstudioを通してqwen2.5-7b-instructというやつを入れて使ってみたところ、遅いし精度もよくないけど、誤字脱字チェックには使えそうなレベル。完全にオフラインだから自由に使えるのはすごくいい。
AI進化の一方で、この検閲、規制対象コンテンツ、ポリシー違反とかは拡大し厳しくなっていくのかな。大手AIは規制ガチガチ、湧いてくる弱小AIはユルユルっていう二極化の兆候はすでにあるし。

ちょうど12月からchatGPTのアダルトモードが解禁になるようだし、これの動向いかんによっては激しく規制の方向に傾きそうな気もするし、もう手に負えないからフリーダムでいいじゃんとはっちゃけたような感じにもなりそう。
子供のころに思い描いたSF的な未来とはちょっと違うけど、順調にSF的な世界になっていっているので、10年後はユートピアかディストピアか、果たして――。
ちよまつ (2025-11-24)

