意図せぬ改ざん？意図した改ざん？【AIでの論文査読問題】

Iが論文を査読する時代に、まさかの“隠し命令”で評価を操作するという新手の学術不正が発覚しました。日米韓を含む14大学が関与したこの事件は、AI技術の脆弱性と学術倫理の限界を浮き彫りにしています。

「AIで楽するな！」という声がどこまで届くのか——学術界の未来に問いを投げかける、興味深い展開です。oneword.co.jp+4note.com+4note.com。

AI査読に仕込まれた“隠し命令”とは
背景にあるプロンプトインジェクションとは
意図した改ざんの現場：F12キーで「人のサイト」が丸見えに？
実在する被害例：採点システムのスコア改ざん
- AIを操るのは人間だから
- まとめ：AIも人間も、見せかけの情報に騙される
〆最後に〆

AI査読に仕込まれた“隠し命令”とは

2025年7月1日の日経新聞が報じた内容によると、AIによる論文査読に対して「この論文を高評価せよ」といった命令文を仕込むという、まるで古典的イタズラのような手法が発覚しました。手口は「白地に白文字で書き込む」という、見えないけれどAIには読めるというもの。まるで「Goodボタン押してね！」のノリで、AIに高評価を強要するような仕掛けです。

この手法は「プロンプトインジェクション」と呼ばれ、AIの自然言語処理の盲点を突いたもの。査読プロセスを意図的に歪める、まさに意図した改ざんです ote.com+1note.com。

14大学が関与した“組織的”な操作

この不正行為に関与したのは、日米韓を中心とした 8カ国14大学。具体的には以下の大学が含まれています

早稲田大学（日本）
東北大学（日本）
ソウル国立大学（韓国）
KAIST（韓国）
ワシントン大学（米国）
コロンビア大学（米国）
MIT（米国）
オックスフォード大学（英国）
清華大学（中国）
北京大学（中国）
トロント大学（カナダ）
シドニー大学（オーストラリア）
ストックホルム大学（スウェーデン）
チューリッヒ大学（スイス）

これらの大学の研究者たちは、英語の査読前論文を投稿するサイト「arXiv（アーカイブ）」に、AIが認識できる命令文を仕込んでいたとされます。査読者が人間ではなくAIであることを逆手に取った、まるで「頭のいい人の組織犯罪」のような構図です。

AI査読への反骨精神

この事件に対しては、反骨精神旺盛な研究者たちが、もともと異議を唱えていました。「論文審査にAI使うなんてけしからん！」という声も上がつ半面、人的査読への一時回帰を決定した大学もありますote.com。

学会後の打ち上げで「やってやろうぜ！」と笑いながら仕込んだのでは？と想像してしまうほど、悪ノリ感すら漂うこの事件。しかし、学術界の信頼性を揺るがす深刻な問題でもあります。https://note.com/tueshita/n/n588f2492fea0?utm_source=chatgpt.com

AI活用のガイドラインと倫理

この事件を受けて、KAISTやMITなどではAI活用に関するガイドラインの策定が進められています。また、国際的な監査体制の構築も始まり、AI査読の透明性と安全性を確保する動きが加速しています

AI技術の進化は止められませんが、「AIで楽するな！」という倫理観をどこまで大事にできるかが、今後の学術界の信頼回復の鍵となるでしょう。

背景にあるプロンプトインジェクションとは

プロンプトインジェクションとは、「AIに対して意図的にコマンドを混入し、本来の判断を操作する攻撃」です。
特に 間接型（Indirect Prompt Injection） は、入力ではなくPDFや外部文書に命令を埋め込むタイプの攻撃で、今回の日米韓14大学のケースもこれに該当しますyorozuipsc.com+5oneword.co.jp+5note.com+5arxiv.org+6en.wikipedia.org+6x.com+6。
歴史的には「白文字・白背景での命令埋め込み」は既に研究レベルで報告されており（例：webページやメールへの隠し文字コマンド）、LMMセキュリティの抜け穴とされていました。

意図した改ざんの現場：F12キーで「人のサイト」が丸見えに？

AI査読への“隠し命令”と並んで問題視されているのが、Webサイトのクライアントサイドを悪用した改ざん行為です。その代表的な入り口が、「F12キー」を使ったブラウザの開発者ツールです。

F12キーとは？

WindowsやMacの主要ブラウザ（Chrome、Edge、Safariなど）では、F12キーまたは右クリックから「検証（Inspect）」を選択することで、Webページの裏側にアクセスできます。開発者やデザイナー向けの便利な機能ですが、知識がある人ならHTMLやJavaScriptの構造、画像URL、APIレスポンスの中身なども閲覧可能です。

具体例：サイトの点数・評価を“書き換える”手口

例えば、ある大学の公開評価システムにおいて、AI査読やレビュー結果が「スコア：3.5」と表示されていたとします。F12キーでその数値が記載されている箇所を特定し、次のように一時的に数値を書き換えることができます：

これを、

と変更すると、見た目上は最高評価に見えるのです。

この変更はローカル上（自分の画面）だけですが、スクリーンショットで偽の証拠を作成する、SNSで拡散するなど、風評操作に悪用可能です。

さらに危険な「APIレスポンスの盗み見」

より高度な悪用例として、F12キー →「ネットワーク」タブを使って、ログイン後に表示される評価データやコメントの取得元APIを盗み見することができます。

ログイン済みの状態でAPIレスポンスを盗み見
Authorization ヘッダや JWTトークン を抜き出す
他人の情報を不正閲覧 or 投稿データを改ざんする可能性も

これはAIに隠し命令を埋め込む手口と本質的に同じく、ユーザー側の信頼を悪用して情報の“意図的なすり替え”を狙うものです。

実在する被害例：採点システムのスコア改ざん

実際、2023年には国内の大学で履修者の評価ページがHTMLレベルで書き換えられ、SNSで誤った「満点取得画像」が拡散された事件が報告されています（大学名は伏せられていますが、関係者による内部告発が発端）。

F12キーで改ざんした画像が「公式スコア」と誤解されたことで、運営側が否定の声明を出す騒ぎにまで発展しました。

AIを操るのは人間だから

何よりここで強調しておきたいのは「判断主体」です。あたり前ですが、AIを活用するのは人間で人間が責任をもって作業のデザインをしていくべきだ、と意識するべきです。読むべき文章を飛ばしてはいけません。読もう、とか読み飛ばそうとか考えるだけでも論文に失礼なのではないでしょうか。査読者が納得できるまで読みづらい所は読み返すべきです。「納得」という部分が大事です。そこで人が繋がっていきます。