最初に作った自動化は、見事に失敗した

AIに全部任せようとして、存在しない論文を集めてしまった話。どこで判断を手放してはいけなかったのか。

正直に書きます。最初に組んだ論文収集の自動化は、失敗でした。

欲張って、全部任せた

最初の私は調子に乗っていました。「AIにテーマを渡せば、関連論文を集めて要約まで全部やってくれるはずだ」と。検索も、選定も、出典の確認も、まとめてAIに丸投げするプロンプトを書きました。

数秒で、きれいな論文リストが出てきました。タイトルも著者も要約もそれっぽい。感動しました——その日までは。

存在しない論文を引用していた

引用しようと一本の論文を探したら、見つかりません。著者名で検索しても、タイトルで検索しても出てこない。AIが生成した、もっともらしいだけの架空の論文だったのです。

しかも一本ではありませんでした。リストの何割かが、実在しない、あるいは著者やタイトルが微妙に間違ったものでした。気づかずに使っていたら、と思うと冷や汗が出ます。

どこで間違えたか

原因ははっきりしています。確認という判断まで、AIに手放したこと。

AIは「それらしい文章を作る」のは得意ですが、「それが実在するか」を保証はしません。出典の真偽は、一次情報にあたる人間が握るべき判断でした。そこを丸投げした時点で、仕組みは破綻していたのです。

作り直して学んだ線引き

そこで設計を変えました。

  • 検索は、実際の論文APIから取る。AIに「探させる」のではなく、実在するメタデータだけを土台にする。
  • AIには、取得済みの実在データの絞り込みと要約だけをさせる。ゼロから生成させない。
  • 最終的に読む・引用する判断は、必ず自分でする

つまり、雑務(整理・要約)は渡し、判断(何が本物で、何を読むか)は握る。この線引きにたどり着いたのは、派手に失敗したおかげでした。

失敗は、共有する価値がある

うまくいった話より、こうしてつまずいた話のほうが役に立つことがあります。同じ罠にはまる人は、きっと私だけではないからです。

AIと創るとき、楽をしていいのは雑務だけ。判断を手放した瞬間に、足をすくわれます。これは、身をもって覚えました。

#失敗談#ハルシネーション#試行錯誤