誰がログ

歯切れが悪いのは仕様です。

はてなグループ日記のデータをインポートしました+処理に使った正規表現のメモ

はてなグループ日記のエクスポートデータをそのままインポートしたところ,いくつか気になるポイントがあったので一旦取り消し,いくつか処理をしてインポートし直しました。その処理の一環でインポートした日記はすべてカテゴリー「Hatena Group」に入れましたので,下記から一覧できます。

dlit.hatenadiary.com

記事に付いていたはてなブックマーク等は消えてしまいましたが,コメントもインポートされるのはやはり良いですね。コメント内の改行やリンクの処理がうまくいってないように見えますが,それほど問題はないようでしたので私の記事では特に処理せずそのままにしています(そのうち直すかも)。

おすすめ?記事

もともと記事数は少ないのですが,以前はてなブックマークが複数付いていた記事は下記ぐらいです。

dlit.hatenadiary.com dlit.hatenadiary.com dlit.hatenadiary.com dlit.hatenadiary.com

正規表現による処理

基本的なことができる方にとっては朝飯前のものばかりでしょうし,おそらくもっとエレガントな処理方法があるような気がします。私はそれほど詳しくなくて力技的解決が多いのであくまでご参考まで。あとエクスポートデータをもう一度もらうというのは難しいかもしれないので必ずファイルのバックアップを確保してから試して下さい。

エディタはAtomです。正規表現による検索・置換と改行の検索・置換はそれぞれ設定をONにしないとできないので慣れていない方はご注意下さい。

キーワードタグの削除

エクスポートデータをそのままインポートすると,旧はてなキーワードへのリンクがすべてはてなブログタグへのリンクになっていることに気付くと思います。直接HTMLで書き込まれているので,ブログのキーワードリンクの設定では外せないようです。

検索 (find):<a class="okeyword" href="http://d.hatena.ne.jp/keyword/.*?">(.*?)</a>
置換 (replace):$1

で一括置換を実行(?で最短一致にしないとたぶん置換の対象が広くなってしまってまずいのでご注意下さい)。“(.*?)”の部分が“$1”に入るのでタグの部分が削除される結果になります。

タイトルタグの削除

記事のタイトルと同じものが h3タグとして本文にも入っています。そのままでも気にならない人もいるかもしれません。

検索 (find):<h3 class="title">.*?</h3>
置換 (replace):何も入力しない

で一括置換。上と違い最短一致にしなくても処理は変わらないと思いますが念のため。これだと空行ができてしまうので,私はさらにdivタグ+改行をdivタグに置換してむりやり空行を消しましたが,もっと楽な方法あるんでしょうか。

カテゴリーの追加

どうもインポートした記事をインポート実行後に探すのが難しいようなので,先にカテゴリー情報を付与してしまうことにしました。

検索 (find):STATUS: (.*)\nDATE: (.*)
置換 (replace):STATUS: $1\nDATE: $2\nCATEGORY: 付与したいカテゴリー名
(改行はLFを選択,\nが改行部分)

で一括置換。カテゴリーは先に作っておかなくても,インポートすれば自動的に作成されるようです。

なんでわざわざSTATUSの行まで入れて置換しているかというと(このやり方だと)DATEの行だけで置換するとコメントも検索対象になっちゃってコメントにもカテゴリー指定の文字列を入れてしまうからです。STATUSの値は,下書きがなければすべて“Publish”だと思うのでそのまま書いちゃっても良いと思いますが念のため。

そのほか

タイトルに含まれている&や“”,’が変な処理になっていましたが,数が少なかったので手動で修正しました(本文は大丈夫なようです)。記事数が多い方は一括処理が良いかもしれません。

はてなグループ日記のエクスポートデータが届きました

2019/11/16日に日記データのエクスポートを依頼していたのですが,昨日届いていました。はてなの関係者の方々おつかれさまです&ありがとうございます。

試しにインポートしてみたのですが,キーワードリンク等いくつか処理をした方が良いことがありそうですので,キャンセルしました。それらが終わったら改めてインポートして公開,お知らせいたします。

一般的な語・表現と見た目が紛らわしい専門用語

これもいろいろなところでいろいろな分野について話題になっているのを見かけますが,日常でも用いられる語・表現と見た目が同じ(似ている)ために,かえって紛らわしくなっている専門用語というのはいろいろあります。

togetter.com

以前言語学の入門書としておすすめした定延利之『日本語教育能力検定試験に合格するための言語学22』

dlit.hatenadiary.com

に良い引用がありますので紹介します。

最も大きいと思える問題は、それらの文章に現れる専門用語が分からないことです。それも「能格言語」や「発語媒介行為」のような、見るからに分からない用語ならまだマシで、分からないということが最初からはっきりしていますから、あなたはさっさと辞典で調べたりできます。しかし、何となく分かっているつもりになっている用語が実は分かっていないという場合は悲惨です。(定延 (2002): 115,強調はdlit)

私が言語学関係の授業でよく言及するのは「記述 (desctiption)」でしょうか。学部の1年生に何のことか聞いてみると「口頭ではないこと」みたいな答えが返ってきて受験大変だったのかなあという気持ちになったりします。言語学概論とかの授業では「言語学は規範的ではなく記述的である」という話とセットにできるのでそんなに導入には苦労しないのですが。

言語学関連だとほかには「談話 (discourse)」とかときどき混乱するという感想が出ますね。あと私の授業ではそれほど出てこないのですが「焦点 (focus)」とか。「焦点」は専門用語に限定してもややこしいと注記されてしまうような用語なので二重にやっかいかもしれません。

さいきんのアクセス傾向とsmartnewsとか

あまり詳しいサービスやツールは使ってなくて,はてなブログ(Pro)のアクセス解析を見ているだけなのだけれど,さいきんアクセス数と流入元の関係が以前と変わったなと感じることがある。

たとえば,2日前と昨日書いた下記の記事の影響で,ここ3日間は1日に数千のアクセスがある(記事を書いてない日はだいたい1日100ちょっとぐらい)。

dlit.hatenadiary.com

dlit.hatenadiary.com

でも,上の記事ははてブの被ブクマ30ちょっと,下の記事は10ちょっとなんですよ。今のアクセス数は以前だと少なくとも50とか100をこえてないと行かない数字という感じ。私のブログでは被ブクマ数がすごく増えてもアクセス数自体はそれほどでも,ということも珍しくなかったりする。

こういう時はだいたいsmartnewsからの流入が多いようなので何らかの形で記事が載ったのだろう(smartnewsぜんぜん使ってないので詳細は分からず)。以前もGIGAZINEに記事のリンクが載った時とかはすごくアクセスが増えることがあった。

ちょっとおもしろいなと思うのは,smartnews経由でアクセスがすごく増えても,被ブクマ数にもTwitterでの言及にもあまり影響ないんですね。以前はこういうニュースサイト的なところに載ることと,はてブされることと,Twitterで言及されることはある程度リンクしていることが多かったと思うのだけれど。

もちろんここしばらくたまたまそういう事例が続いただけかもしれないし,こういうちょろっとだけ人目に止まるような記事にはよくあることなのかもしれないんですけどね。

【ネタバレあり】『アナと雪の女王2』雑感

わが家の4歳児が見る気になったようなので一緒に『アナと雪の女王2』(吹き替え)を見てきました。4歳児にとっては人生初の映画館だったのですが,前作を家でかなり見ていたこともあり楽しめたようでした。

ふだんあまりこういう記事は書かないのですが,たまには良いかなと。批評とか分析とかではなくほんとうに雑な感想です。また,ものすごく断片的に書きますので見ていない方は訳が分からないのではないかと思います。ただ,この作品についてはもう良いレビューがたくさん出ているでしょうしネタバレは気にせず書きますので未見の方はご注意ください

アナの成長の描き方とクリストフ,オラフの背景化

前作でも話題になった(ディズニー作品の)ジェンダー観や複数のコミュニティ間の争い(“戦争”),自然との付き合い方(ダムと環境)等,いろいろなテーマに意識を向けさせられる作品ではないかと思いますが,私にとって印象が強かったのは「アナの成長」の描き方でした。

意図的なものかどうかは分からないのですが,象徴的だと思ったのは,アナが岩壁を登ってどこかに辿り着くシーンです。あまり長く登るわけではないのですが,特に1人で洞窟から脱出するシーン。私は前作でアナが岩壁を登ろうとしてぜんぜん上に進めず,結局クリストフの助けを借りて先に進むシーンを思い出しました。最後の方,ダムの手前でちょっとしたところをよじ登るシーンもあって,ここではクリストフが下から押してくれるわけですが,1人で先に行くんです。ああ,アナは1人で登れる(先に進める)ようになったんだな,と。

一方,アナの成長の割を食っているように思えたのがクリストフとオラフです。前作ではクリストフとオラフがさまざまなシーンで具体的に助けてくれていたのですが,今作ではそういうシーンはかなり減っているように思います。

クリストフについては,大変な時にも結婚のことに気を取られて何やってるんだ的な感想も出ているようなのですが,アナの成長を描くために?背景化されている(途中けっこう長く退場させられたりします)としたら気の毒な気もします。トナカイを助けるシーンや最後のアナを助けるシーンではピンポイントで重要な働きもしているので役立たずキャラというわけではないような。

オラフについては,前作のあらすじを説明するシーンといい,ラストの「ぼく,ハッピーエンドって大好き」というセリフといい,どうもメタ的な立ち位置が印象的で。前作ではアナを助け出したりとかなり重要な仕事をしていました。「水の記憶」に関することでも,オラフの発言が決定的な手がかりとかになったわけではないのでは。

いわゆる「ディズニープリンセス」の作品では,『シンデレラ』のガス,『リトルマーメイド』のセバスチャンや『モアナと伝説の海』のヘイヘイ等,時にはトラブルも引き起こしつつ何かしら重要な働きをする非人間のキャラがよく出てくるのですが,今作のオラフは賑やかではありますが,ストーリー自体にはマイルドに関わっているように見えました。象徴的な存在ではあると思うんですけどね。

ホメオパシーとオラフ

北村紗衣氏がホメオパシーとジェンダーの観点からの批評を書いていて,

gendai.ismedia.jp

この記事への反応として「魔法がある世界なんだから良いんじゃない?」というものもけっこう見かけたのですが,映画を見ると確かに北村氏の危惧も分かるような気がしました。

北村氏も書いているように,オラフは「情報リテラシーがな」く,謎な怪しい話をいろいろどこかから仕入れていて何かあるとそれを披露するキャラとして描かれています。で,「水が記憶を持っている」というのもその内の1つで,それが言わば「まぐれ当たり」するわけですが,そのことについてそれほどネガティブに書かれているわけではありません。

ジェンダーと言葉づかい

id:saebouさんの下記のメモにエルサがアセクシャルだという言及があって,服装への指摘もあります。

saebou.hatenablog.com

エルサは前作から恋愛とかそういうものからは離れた描き方がされているという印象がありましたので,言語の研究者としては,エルサの言葉づかい(正確に言えば日本語への翻訳)はどうなっているんだろうというのが事前に気になっていたのですが,前作と変わらずエルサはいわゆる「女ことば」特有の表現とされるものを使っていました。具体的には名詞述語に「だ」を付けずに直接終助詞の「よ」を付けたりするのとか平叙文の終助詞の「の」とかです。正確にはイントネーションの問題等があるのでこればかりはwebでセリフ一覧とかを見るだけでは分からないなと思っていたのですが,音声で聞いた結果,やはり「女ことば」を使っていると言って良いかと思います。

今回は吹き替えを見たので,英語の方のセリフの語彙や音声がジェンダーに関してどのようになっているのか分からないのですが,たとえば英語の方ではジェンダーニュートラルな言葉づかいなのに日本語訳では「女ことば」ということがもしあれば,翻訳としての問題にプラスして,作品の内容からも問題が出てくるのではないかと思ったのですがどうなんでしょうか。

もちろん,その辺りの事情を踏まえて意図的に「女っぽく」しているという可能性もあるでしょうし,英語と日本語の違いを踏まえる必要もあります。前作からの連続性とか,いろいろ事情があるかもしれません。

そのほか

特にアートハランのところでは,四大元素のクリスタルとかファイナルファンタジーじゃん!と思ったり,エルサが魔法で足場を作りながら跳んでいくところを見て「ロックマンみたい」と思ったりとかしてました。足場を作るシーンはもしかしたら前作でアナを間違って魔法で傷つけてしまう冒頭のシーンに引っかけてたりしますかね。

追記(2020/02/22)

この記事をアップした少し後に下記の記事を見て気が重くなっています(現在は内容は読めなくなっているようです)。私は非公開になる前に1回だけ読めたのですがひどいですね。

dairy.nada-h.co.jp

関連

dlit.hatenadiary.com

dlit.hatenadiary.com