誰がログ

歯切れが悪いのは仕様です。

NHKの生成AIに関する放送・記事への補足

はじめに

先日の記事

生成AIの話題で今夜ちょろっとテレビに映る予定 - 誰がログ

で予告したNHK「サタデーウオッチ9」の生成AIに関する特集は無事放送されました。

下記の記事にもあるように、NHKプラスで5月24日(土)まで配信を見ることができます。

www3.nhk.or.jp

この記事では簡単な補足などを書いておきます。

取材・視聴の感想

取材・撮影は全体として大変丁寧で、事務的な調整をはじめ、事前・当日・事後の取材・インタビューなどのやりとりもスムーズにできました。

少し意外だったのは上記のNHKの記事と放送の内容は一言一句同じというわけではなく、異なりもあるということでした。両者を合わせると、自分が思っていたよりはいろいろなことを取り上げていただいたという気がします。

先週末は英語学会の国際春季フォーラムという研究大会に参加していたのでこの記事を書く時間もなかなか取れなかったのですが(放送もリアルタイムでは視聴できませんでした)、翌日何人かの方に学会で見たよという声をかけてもらいました。あの短時間でもこうだったのでやはり多くの人が見るチャンネルなんだなと思います。

この生成AIの特集のほかの箇所については詳しくは知りませんでしたので、そのほかの紹介されている事例もいろいろ面白かったです。生成AIにあまりなじみがない人にも分かりやすい内容なのである程度触っている人にはそれほど目新しい内容はなかったかもしれませんが、SNSなどwebでの反応を見るとこうやってまとめるステップは重要なのではないでしょうか。この量でこれだけのトピックを取り扱おうとすると生成AIの仕組みの解説をこれ以上詳しくやるのは難しそうです

変なところが気になって、自分の専門ではないですし話の流れ上仕方ない表現なのかもしれませんが、「哲学など答えがないテーマ」という表現はだいぶ紋切り型な感じでどうなのかなと思ってしまいました。この文脈でも「哲学など」という表現はいらないのでは。

補足

まず、放送・記事の内容に不満があるとか不足があるというわけではありません。上にも書いたように、この時間の中ではだいぶ具体的に取り上げてもらえたなというのが実感です。

ただもう少し私のケースについて詳しく説明しておくと、レポートを読んではじめて問題に気付いたわけではなく、そもそもレポートの出題の際に、1) 生成AIは使用しても構わないこと、2) 架空の文献を挙げるなどの問題があること、3) その対策、について説明し、それでもそういう事例が出てきたという話なのです。

このことについてはこのブログですでに書きました。

大学での授業や論文指導に関する生成AI雑感(2024年度版) - 誰がログ

あと今年度の評価の方法についても、元々各回に授業内課題を設定していて評価の割合を全体の50%にしていたのを100%にしたということですし、従来の期末レポートに相当する文章を授業内で少しずつ作成してもらうというのもこれまでと同じなので、授業のやり方をがらっと変えたというわけではありません。

言語学のデータ収集に関する話も、期待してやったというよりは現段階でどれくらいのことができるか試してみたというものです。上記の記事にもその話を少し書いていますし、下記の記事で公開しているポスター資料にはどの生成AI・モデルを使ったか、そのほかの手法で集めた例などが載せてあります。

言語学フェス2025の発表ポスター公開(「言語学er」みたいな表現の研究) - 誰がログ

話の流れ上生成AIが架空の例とurlを出してきたというダメなところにフォーカスされていますが、指定した条件に沿ってcsvファイルにまとめるという指示については適切に柔軟にできていますし、語基と接辞の分離についても(この現象だと表記で簡単に判断できるとは言え)うまくできているという点はやはり生成AIの面白いところだと思います。あと、何回か試すとうまくWebから用例を持ってくることもありました。このうまくいくときとうまくいかない(そしてでっち上げる)ときのぶれが面白くもあり難しいところでもあります。

もう少し言いたかったこと

個人的には、なぜ生成AIの使用を推奨しているのかということに関する、研究の視点からの話が重要だと考えているのですが、そこには触れられなかったのでここに書いておきます。放送では学生・教育の視点からの話が紹介されていましたね。

ごくごく簡単に言うと、研究の世界は人手不足なので生成AIに(一人当たり)何人力かになってもらいたいということです。

こういう話をすると大学の運営や研究費の話がまず頭に浮かぶ人が多いでしょう。もちろんそれも関係がある重要な話なのですが、私がインタビューの中でむしろ強調したのは、研究が進展し続けているということです。もちろん研究が進展することによってある程度片が付くということもあるのですが、少なくとも私が知る研究分野では研究の進展によって新しい問題が出てきたり、新しい研究テーマ・トピック・領域ができるなんてことが良くあります。研究が進展・発展すればするほど研究に携わる人がそれまで以上に必要になるという分野は多いのではないでしょうか。研究が進めば進むほど人が足りなくな(ってい)るというのをいろいろな場面で実感しています。

これは昔からずっと個人的に気にかかっていることで、ほかの場や文脈で(システマチックレビューのような)文献レビューカテゴリーの重要性や、これまでの研究成果をコンパクトにまとめなおす機能としての教科書などの重要性を私がちょこちょこ口に出すのは、すべてこの問題意識が根源にあります。

おわりに

落ち着きがない人間だという自覚がありますので、放送されている部分ではあまり挙動不審な動きをしていなくて良かったです。

生成AIと教育・研究の関係については今年度の授業が一区切りついた後に何か書くことを考えています。

生成AIの話題で今夜ちょろっとテレビに映る予定

大学での生成AIに関する事例についてNHKの取材を受けました。

その内容の一部が今日5月17日(土)放送の「サタデーウオッチ9」という番組内で紹介されるということです(何か大きなニュースが飛び込んできたら変更になるかもしれませんが)。

すでに記事にもなっているようです。

www3.nhk.or.jp

自分に関わるところ以外の内容も気になりますので、楽しみです。

放送を視聴して内容を確認したら後日補足の記事でも書こうかと考えています。

実際に映るのはほんと少しのようですし、(言語学に興味のある方は映っている例が気になるかもしれませんが)全体的にかなり一般的な話をしたのでおそらく言語学の話は出てこないでしょう。

追記(2025-05-19)

補足の記事を書きました。

dlit.hatenadiary.com

自分のはてなブログを生成AIに読んでもらえないか試したらやっぱりできなかったので今後どうしようかな

はじめに

下記の記事を読んではてなブログも生成AIが直接読むことはできないというのを知って驚いたので実際にこのブログでも試してみました。

生成AIの「URLを読む処理」について考えてみる。 - フジイユウジ::ドットネット

結果としてはやはりその通りだったのですが、ChatGPT, Claude, Geminiでは応答が違って面白かったのでついでに記録しておきます。

しかし自分が書いたブログを読んで調べてもらえないというのは仕組みや理屈が分かってもちょっと変な感じがしますね。Obsidianを使い始めてからは下書きがすべてObsidianにありますし、

Obsidianの下書きをはてなブログに投稿する手順(テンプレートの例付き) - 誰がログ

それ以前の記事もエクスポートして生成AIが触れるようにしておけば良いので過去に書いたものを自分で調べたりまとめたりするのに手間というほどではないのですけれど。

ブログの書き手としての個人的希望

私自身は、ブログに書いた内容がどのような形であれ必要な人(たとえば専門的な知識・情報を探している人)に届けば良いと考えていて、記事の内容にもよりますがブログを書く上でかなり優先順位が高いです。

SNSやはてブなどで書いた記事を宣伝するのも、必要な人に(いつか)届くためには幅広く知られていた方が良いというのが理由として大きいです。広く知られていれば、ほかの誰かが宣伝してくれるというようなことも起こります。

ですので、上の記事への反応にもいくつか見かけたように、はてなブログの設定で生成AIが直接ブログの内容を読めるような項目ができると嬉しいです。すでにweb検索については「検索を避ける(検索エンジンに登録させない)」という設定項目がありますよね。

個人の希望はそうであってもはてなブログ全体のPVが落ち込むと困るんだといようなことなのかもしれませんが、たとえばはてなブログProのオプションにするというような形なんかはどうでしょうか。Proプランを使っているものの私にとっては今のところ広告を表示させない(読み手のため)という点しかメリットがなく若干割高感があります。

私の書き手としてのスタンスについてはたとえば以下の記事などをご覧ください。

生成AIの反応

確認のためChatGPT, Claude, Geminiに自分のブログを調べてもらったら、直接読めないというのは一緒だったものの、回答がけっこう違いました。ちなみにお願いは「分散形態論について書いた記事をリストアップして」というものにしました。自分の専門のトピックなので一番何をどのように書いたか覚えているからです。

Deep Researchを使えばもっといろいろ調べられるのかもしれませんがそれは試していません。

ChatGPT (o4-mini)

「当サイトのrobots.txt により直接的なアーカイブ検索が制限されているため、主に検索エンジンのキャッシュ/外部への公開情報をもとにリストアップしています。」と言って2つ記事を探してくれました。情報は正確でしたが、数としては少なく(Claudeと比較すると明らか)個別記事のurlは付いていませんでした。

さらに「dlit.hatenadiary.com はrobots.txt によりクローラーがアーカイブページにアクセスできない設定になっているため、より古い投稿やカテゴリ別の一覧を自動取得することができませんでした」というような説明もあり、もっと調べたいならブログにあるアーカイブを見ると良いよというようなアドバイスも付いていました。

Claude (3.7 Sonnet)

5つの記事を探してきてくれて簡単な要約もし、そのうち4つには個別記事のurlが付いていました(実際の記事の数はもっとあります)。どの情報にもハルシネーションは見当たりませんでした。

ただ最初の回答は記事のリストアップのみだったのでどうやって調べたのか不思議に思って「このサイトではrobots.txt により直接的な検索が禁止されていると思うのですが、どうやって調べたのでしょうか。具体的なプロセスを教えてください。」と聞いてみたところ、「サイトに直接アクセスするわけではなく、web_search ツールを使用して検索を行いました。このツールは検索エンジンのAPIを通じて情報を取得します。robots.txtによる制限がかかっていたとしても、検索エンジンのインデックスに既に含まれている情報であれば、それらの情報を取得することができます。」とのことでした。

最初の回答の1つに個別記事のurlが付いていなかったので何か工夫したんだろうなというのは推測していたのですが、探せた数がChatGPTより多かった一方、直接は調べられなかったというのを最初の回答で言及しなかったのがChatGPTとの対比で面白かったです。

Gemini (2.5 Pro)

一番応答がシンプルだったので丸ごと載せます。「指定されたブログ(https://dlit.hatenadiary.com)にアクセスして情報を取得することができませんでした。そのため、そのブログ内の分散形態論に関する記事のリストを提供することができません。考えられる理由としては、サイトへのアクセス制限や技術的な問題などが挙げられます。」という回答でした。代替手段の提案もなく、生成AIの回答としては逆にそっけなさすぎる気もします。

Claudeの後に試したので検索エンジンのインデックスを利用したらできますかと提案してみたところ、やはりやってみたけど見つかりませんでしたという回答で、Googleの提供している生成AIなのに…と思ってしまいました(何か仕方ない理由があるのかもしれませんが)。

おわりに

もともと専門的な情報で今後も参照されるかもしれないものについては少しずつ個人サイトに移す予定ではあったのですが、今後もはてなブログが生成AIから直接は読めないという状況が続くのであれば、情報発信をどのようにするのかということ全体を考え直さなければならないのかもしれません。