hirax.net::Keywords::「理科」のブログ



1999-05-03[n年前へ]

「私と好みが似てる人」 その2 

ログ解析の6ヶ月点検

 本サイトが公に公開されるようになってから6ヶ月経った。新車でも購入してから半年経てば、6ヶ月点検があるのだから、本サイトについても6ヶ月点検を行ってみたい。

 まずは、週別のアクセス量変動を挙げてみる。

1998/12/13-1999/4/24の週別アクセス量
Overall Accesses

 アクセス数は割に順調に伸びているようである。1999/02下旬辺りにネットワーク不調とログ解析失敗などによるデータ欠損が見られるが、それ以外ではほぼ線形に増加している。1999/4上旬に増加の傾きが変化しているのはinfoseekにページを登録したことによるものと考えられる。

 次に、時間別アクセス量である。以下に示すのは、1999/4/18-24の時間別アクセス量である。
 これを見ると、深夜3時位にアクセス数がぐんと減ることがわかる。深夜3時位に眠りにつく人が多いのだろうか。
 そして、早朝5時過ぎからアクセス数が増えていくことがわかる。5時過ぎくらいから活動を始める人も多いようだ。そして、昼の12時辺りにひとつピークがある。これは、企業の昼休み時間にアクセスしている人達によるものだろう。次に15時位に大きなピークがある。これは、何だろうか?まさか、おやつの時間ではあるまい。企業ユーザーが一服しているのだろうか?小さい18時辺りのピークも、企業ユーザーの就業時間の終わりを示すものと思われる。
 そもそも、こういった昼間の時間別アクセス数から見えてくるユーザーというものは、時間に縛られる企業ユーザーになってしまうのだろう。

1999/4/18-24の時間別アクセス量

 さて、次はアクセス数のサイトランキングである。ただし、ここでのサイト=IPアドレスであり、ドメイン解析は行っていない。したがって、同じドメインからアクセスがあっても、IPアドレスが異なれば違うサイトとして計算している。そのため、proxyを使っているような所が、ランクインしやすいということになる。もちろん、proxyを使っていれば、実際よりアクセス数は少なくなるわけだが、今回の比較においては、明らかに同じサイトと判断される分有利なのである。
 それでは、最近4週間分のトップ10を示してみる。

1999/3/28-4/24のアクセス量における週別サイトランキング
Rank4/18-244/11-174/4-103/28-4/3
1KyotoPneTMeshNet厚木阪大レーザー核融合研KyotoPneT
2東大情報システム工学研キヤノン裾野Hewlett Packerdキヤノン裾野
3セイコーインスツルメンツオーイーシーキヤノン裾野千葉大情報数理
4Fermi-lab岡山理科大 電子工学ホンダエンジニアリングPSINet
5OCN北大 電子科学研究所ベッコアメ福岡シチズン
6アスキーNTT PC-Com 諏訪鹿児島大 情報工学東北大加齢医学研
7明治大学総合情報ネットワークワコーデジタルアーツ生協インターネット大阪
8RICOHIIJ4U藤沢インターネット九州大学医 耳鼻咽喉科
9WEB静岡龍谷大情報NetworkSystem通商産業省InfoPepper府中
10KansaiMultimediaServiceOCN千葉館山アレスネットDTI熊本

 トップ1に4回中2回も位置しているのはKyotoPneTである。このサイトは京都周りのネットワーク総合体のようだ。色々集まっている分、アクセス数が多いのだろう。
 それでは、週別にコメントをつけてみたい。
3/28-4/3 医学関係が2つランクインしている。おや、九州大学医学部耳鼻咽喉科と言えば、私の一番大好きな「今日の必ずトクする一言」で有名な「バーチャル耳鼻咽喉科」と同じサブドメインである。
4/4-10 通商産業省は公益機関のランクインが少ない中でなかなか健闘している。阪大レーザー核融合研究所はこの2週後のFermi研究所と関係あるのだろうか?
4/11-17 MeshNetの厚木からアクセスされている方が一位である。個人のアクセスというのは非常に嬉しい。この週は個人の方が多い。喜ばしいことだ。
4/18-24 常連だったキヤノン裾野が消え、RICOHがランクインしている。このあと、WEBページは会社の顔色- WEBページのカラーを考える 2 - (1999.04.26) でRICOHのWEBのデザインに苦言を呈しただけに、反応が気にかかるところである。おやおや、ASCIIもランクインしている。

 それでは、3ヶ月前に「私と好みが似てる人」 - analog Windows版用のサブドメイン解析ソフトを作る- (1999.01.24) の時に調べたドメインランキングとの比較をしてみる(こちらは、ドメインランキングであって、今回のサイトランキングとは異なる。今回の場合、同じ人がアクセスしても、IPアドレスが異なれば、違う人としてカウントしていることになる)。

1: canon.co.jp (キヤノン)
2: sony.co.jp (SONY)
3: atr.co.jp (株式会社国際電気通信基礎技術研究所)
4: infocom.co.jp (日商岩井)
5: waco.co.jp (ワコービジネス)
6: odn.ad.jp (オープンデータネットワーク)
7: nttpc.ne.jp (ISP事業者向けネットワーク提供サービス)
8: att.ne.jp (日本AT&T株式会社)
9: saitama-u.ac.jp (埼玉大学)
10: kokushikan.ac.jp (国士舘大学)

 今回と共通してトップ10入りしているのはキヤノンとワコーである。前回も今回も技術系のサイトばかりである。私が技術マニアであるからしょうがないか。それこそ、「私と好みが似てる人」達なのだろう。

次は「できるかな」内の人気ランキングである。こうしてみると、

など、面白いものである。/dekirukana/java/を読んでいるのは「踊る大捜査線」をキーワードにして辿りついた方だろう。/dekirukana/snif/が人気があるのは、セキュリティー意識が高いせいか、あるいは好奇心が高いせいか、どちらだろうか?。
#reqs: %bytes:      last date: file-----: ------: --------------: ---- 4185: 18.07%: 99/05/15 07:49: /   13:  0.04%: 99/05/12 13:51:   /? 1855:  2.18%: 99/05/15 02:33: /dekirukana/java/ 1093:  1.24%: 99/05/15 07:38: /dekirukana/server/  839:  1.74%: 99/05/15 07:08: /dekirukana/snif/  789:  0.68%: 99/05/15 04:01: /dekirukana/dorae/  762:  0.58%: 99/05/15 02:36: /dekirukana/screensave/  633:  0.83%: 99/05/15 05:32: /dekirukana/photoshop/  623:  1.20%: 99/05/15 07:20: /dekirukana/whois/  577:  0.99%: 99/05/15 04:20: /dekirukana/1999/  543:  0.64%: 99/05/14 22:53: /dekirukana/tire/  501:  0.80%: 99/05/15 01:55: /dekirukana/digicame/  435:  0.52%: 99/05/15 00:51: /dekirukana/e55/  435:  1.22%: 99/05/15 02:23: /dekirukana/ufo/  427:  0.37%: 99/05/15 04:15: /dekirukana/ocilo/  392:  0.43%: 99/05/15 06:53: /dekirukana/screensave2/  373:  0.50%: 99/05/15 05:23: /dekirukana/fem2/  321:  0.63%: 99/05/15 02:49: /dekirukana/wavelet/  320:  0.56%: 99/05/15 05:28: /dekirukana/ekisyo2/  279:  0.32%: 99/05/14 22:30: /dekirukana/hamaphoto/  267:  0.37%: 99/05/14 23:25: /dekirukana/real97/  264:  0.36%: 99/05/15 02:28: /dekirukana/karaoke/  263:  0.16%: 99/05/15 02:25: /dekirukana/ocilo2/  260:  0.41%: 99/05/15 01:15: /dekirukana/moire3/  256:  0.81%: 99/05/14 21:07: /dekirukana/onkai2/  256:  0.44%: 99/05/15 01:48: /dekirukana/sacchan/  252:  0.29%: 99/05/15 05:52: /dekirukana/toolplus/  247:  0.24%: 99/05/15 03:02: /dekirukana/server2/  243:  0.63%: 99/05/15 00:17: /dekirukana/bunsukai/  216:  0.42%: 99/05/15 06:52: /dekirukana/haidi/  195:  0.06%: 99/05/15 00:24: /dekirukana/1999_2/  194:  0.41%: 99/05/15 04:05: /dekirukana/kamogawa/  186:  0.38%: 99/05/15 01:02: /dekirukana/bunpu/  185:  0.39%: 99/05/15 04:21: /dekirukana/ufo2/  185:  0.28%: 99/05/15 05:30: /dekirukana/ekisyo/  180:  0.38%: 99/05/15 07:42: /dekirukana/moire2/  171:  0.33%: 99/05/15 02:48: /dekirukana/wavelet2/  169:  0.17%: 99/05/14 20:48: /dekirukana/rocket/  164:  0.16%: 99/05/15 04:04: /dekirukana/dorae2/  160:  0.31%: 99/05/14 15:03: /dekirukana/probe/  155:  0.14%: 99/05/15 07:08: /dekirukana/tamago/  144:  0.20%: 99/05/14 21:53: /dekirukana/onkai/  141:  0.23%: 99/05/13 20:15: /dekirukana/  126:  0.26%: 99/05/15 01:34: /dekirukana/harddisk/  124:  0.18%: 99/05/15 02:03: /dekirukana/watari/  122:  0.29%: 99/05/14 20:49: /dekirukana/webcolor2/  121:  0.59%: 99/05/15 01:29: /dekirukana/moire/  118:  0.10%: 99/05/14 14:08: /dekirukana/hori/  118:  0.18%: 99/05/14 09:21: /dekirukana/bunsukai2/  116:  0.10%: 99/05/14 21:05: /daily/9904.html  105:  0.19%: 99/05/15 07:34: /dekirukana/favicon/  105:  0.24%: 99/05/15 06:29: /dekirukana/log9905/   99:  0.20%: 99/05/14 20:49: /dekirukana/webcolor/   98:  0.05%: 99/05/15 07:08: /dekirukana/photoshop2/   79:  0.38%: 99/05/14 09:58: /index_e.html   61:  0.01%: 99/05/13 18:27: /dekirukana/fem2/math/   46:  0.01%: 99/05/12 19:50: /dekirukana/fem2/math/indexlnk1.html   42:  0.07%: 99/05/12 19:53: /dekirukana/fem2/math/indexlnk4.html   37:  0.03%: 99/05/12 19:51: /dekirukana/fem2/math/indexlnk2.html   33:  0.08%: 99/05/13 18:28: /dekirukana/fem2/math/indexlnk3.html   32:  0.02%: 99/05/14 14:22: /dekirukana/toolplus/readme/readme.html   31:  0.05%: 99/05/12 19:54: /dekirukana/fem2/math/indexlnk5.html   25:  0.06%: 99/05/15 00:22: /dekirukana/harddisk/math/   21:  0.03%: 99/05/12 19:49: /dekirukana/onkai/math/ 4070: 55.84%: 99/05/15 05:52: [not listed: 34 files]
 こうしてみると、興味が発散している作者であることがよくわかる。
 次にログ解析をするのは、おそらく半年先だろう。 その時、健やかに育っているのだろうか?

1999-10-31[n年前へ]

ビックエッグの力学 

ドームを支える空気圧の謎

 この回は(トンデモ話)であり、中途半端であるのだが、反省を込めてこのままにしておく。直すのが、面倒くさいわけではないので、念の為。

 日本シリーズ'99をやっている(いた)。私は野球は特に好きでも嫌いでもないが、野球場でビールを飲むのは大好きだ。そういえば、今年はドーム決戦である(だった)。ドームといえば元祖「東京ドーム」だろう。「東京ドーム」のWEB

を、眺めていると、こういう記述がある。
 東京ドームは、空気膜構造によるエアドーム。つまり内部気圧を外気より0.3%高くして、400トンもの超特大楕円形の屋根を膨らませるのがドーム建築のポイントなんだ。
 ところで、この気圧差0.3%は、ビルの1Fと9Fぐらいの違いがある。とはいえ中と外の違いを体感することはほとんどない。

 たった、0.3%の空気圧の差で400トンを支えるとは、ものスゴイ。すぐには納得できない数字である。別に疑い深い私でなくても不思議に思うことだろう。

 そこで、確かめてみることにした。まずは、東京ドームの面積をx(m) * x(m)としてみる。すると、持ち上げることのできる重さ(トン)は、

  • 0.3 / 100(%から比へ) * 100(hPaからN/m^2へ) * x * x / 1000(kgからトンへ)* 9.8(Nから重力へ)


と計算できる(この式には実は間違いがある。詳細は後で...)。その結果を示してみる。

東京ドームのサイズに対する「持ち上げることのできる力」の計算結果
横軸=サイズ(m), 縦軸=「持ち上げることのできる力」(トン)

 先の、Webから東京ドームのサイズを見てみると、x = 180mである。すると、持ち上げられる天井の重さは100トン程度であるということになる。おやおや、先の「400トンの天井を持ち上げる」というのとはずいぶん違う。これでは、天井を支えきれない。

東京ドームのサイズ

 そこで、高さによる大気圧の差を導入し、天井近くの高い場所では「外部の気圧が低い」という条件を導入してみる。0.3%というのは地上での比で、天井のある上空ではさらに差があるとしてみるのだ。うーん、強引である。

 さて、ここから後は(実は前も)トンデモ話になっているので眉に唾をつけて読んで欲しい。それを指摘して下さった、読者からの手紙への返事(とほぼ同じ内容)を下に示しておく。

青木さんへの手紙> 高さによる圧力の差は、高さの異なる二点間に存在する空気> の重さに見合ったものです。したがって、ドームの内部でも> 高いところほど圧力は低くなっている筈です。 その通りだと思います。WEB中で「うーん、強引である。」と書いたのはまさにその理由です。 それにも関わらず、強引な論法を続けたのは、文章の最後に「謎は解けないのに、東京ドームは存在している。 少し、くやしい。 」と書いた理由と同じです。まるで、「宇宙人が水道橋の駅前駐車場にUFOを停めて、サラ金に入って行くのを目の当たりにしている」ような、気持ちなのです。くやしいと強引になるのです。あぁ、何て人間らしいのでしょうか... また、計算をしていた時に少し勘違いをしていました>もし、ドームの内外の温度が等しければ、地上でも天井でも内外の差圧は>同じになるはずです。と仰るとおり、差圧は等しいわけですが、それを0mにおける大気圧に対するパーセンテージに直すと、高度が高くなればなるほど、そこの気圧に対してはパーセンテージは高くなります。計算をしていた時にその「パーセンテージが高くなる」ことを「差圧が高くなる」ことと同じに扱うという間違いを犯してしまいました。もちろん、基準の気圧が小さくなっているので、パーセンテージが高くなっても本当は差圧は変わらないわけです。「考えることを手抜きしていた」と言ってもよいかもしれません。要反省です。>ドーム内の温度が高ければ空気の密度> が減少し、天井の位置での差圧はより大きくなり、天井を支> えるのに有利に働きます。これは、浮力によって天井が持ち> 上げられていると考えても同じ事です。> という訳で、ドーム内外の温度差が逆転する夏と冬とでは天> 井を支えるのに必要な圧力を変えなければならないと思うの> ですが本当はどうなんでしょうか。 これは面白そうですね。そういえば、学生時代に地殻物理学を専攻していたのですが、夏と冬の大気圧の違いから、地殻歪の大きさに関係づけて、地震の予言をするなら、「冬に発生する」といった方が良い、話(もちろんかなり冗談で)をしていた先生がいました。その先生に「今回のトンデモ話」がばれたら、大目玉をくらうこと間違いなしです。 ビックエッグの謎は深まるばかりです。それでは、また。------------------------------------------------------------------ch3coohさんへの手紙> > >12/(100*100)*1000= 1.2g/cm2となります。> > >> > >地上での大気圧は約1Kg/cm2なので、上の値は> > >1.2%程度となり、 ここが疑問だったのですが、これは1.2%でなくて、0.12%ですね。なるほど、0.3%よりも小さいですね。実に納得です。 さて、他の方からの指摘もあり、私の計算には> >0.3 / 100(%から比へ) * 100(hPaからN/m^2へ) * x * x > / 1000(kgからトンへ) * 9.8(Nから重力へ)> に1013(標準気圧 hPa)がかかっていないことが気になりました。 という間違いがあることがわかりました。全てはここが原因だったようです。 全ての疑問が解決しました。いやぁ、お恥ずかしい。また、他にも色々と面白い情報ありがとうございます。

 ひとつわかったことは、間違いをすると読者からの手紙が沢山来るといううれしくもつらい事実であった。ここから、あとは封印したい思いで一杯なのだが、自戒を込めてこのままにしておく。しつこいようだが、直すのが面倒なのではない。

 それでは、高さによる大気圧の差を計算してみる。理科年表から15℃の「標準大気の場合の高さと気圧の表」を見てみる。 ちなみに、東京ドームの温度は、「ガス熱源による冷暖房システムにより、夏期は28℃の冷房、冬期には18℃程度の暖房が行われている」とある。今回の計算は外気の温度が15℃で、内部は冬期には18℃程度の温度に調整されているものとしておこう。
 標準気圧は海抜0mで1013mbであり、200mでは989.5mbである。理科年表が古いのでPascal値でなく、mb表示になっている。

 これから、1m当たりのmb変化を計算すると、0.12mb/mとなる。比率に直すと、0.012%/mということになる。例えば、「ビルの1Fと9Fぐらい」の高さの差は30m位であろうから、それを大気圧の比に直すと、99.6%位となり、先の記述と大体合う。

以下に、高度に対する大気圧の差(の比 %)を示してみる。

高度に対する大気圧の比
横軸=高さ(m), 縦軸=大気圧の比(%)

 このグラフで30mの場所を見てみると、99.6%位というわけだ。これが、先のWEB上の「この気圧差0.3%は、ビルの1Fと9Fぐらいの違いがある。」という説明と合うわけである。

次に必要なのはドーム外部と内部の大気圧の比から、力に直してみる。基準面からの高さ0mにおける気圧を1hPaとして、1hPa = 10^2 N/m^2 = 10^2 m^-1 kg s^-2という単位換算を使うと、持ち上げることのできる重さは、

  • (100-大気圧の差(の比 % )) / 100(%から単なる比へ) *9.8(重力に換算) / 1000(kgからトンへ)* 100(hPaからN/m^2へ) * x^2(ドームの面積)
という式で計算できる。

 東京ドームの高さは「グラウンド面から 61.69m」とあるので大雑把に100mとしてみる。

天井の高さを100mとした時の、東京ドームのサイズに対する「持ち上げることのできる力」
横軸=東京ドームのサイズ(m), 縦軸=「持ち上げることのできる力」(トン)

 この計算結果によれば、東京ドームのサイズを180mとした時には、「持ち上げることのできる力」は400トン位になっている。ということは、先のWEBの記事と大体一致するわけである。

 しかし、この計算では致命的な欠陥がある。天井の高度が低いときには、400トンを持ち上げるためにはもっと高い「ドーム内部の圧力を必要とする」ことだ。

 例えば、0.3%空気圧の差の条件で、「天井の高度」に対する「持ち上げることのできる力」を計算してみると、次のようになる。

「東京ドームのサイズ」と「天井の高度」に対する「持ち上げることのできる力」
横軸=「天井の高度」(m), 縦軸=「持ち上げることのできる力」(トン)

 これでは、天井の高さが下がるとますます天井の重さを支えきれなくなってしまう。それに、そもそも天井をどうやって持ち上げたのだ?屋根を持ち上げるインフレートという作業はどうやって行ったのだろう?

 今回の計算は謎が増えただけかもしれない。謎は解けないのに、東京ドームは存在している。
 
 少し、くやしい。

2000-04-24[n年前へ]

ボクのテレビは白黒だった 

Benhamのコマを作ってみよう


 「O plus E」のバックナンバーを眺めていると面白い記事があった。1985/7のNo.68に畑田豊彦氏が書かれている「生理光学 -各種運動知覚現象 -」である。視覚周りの色々な話が書かれていた連載である。なぜ、こういう記事を読んでいるかというと、少し前の、

で視覚特性の資料を探した時に、この畑田豊彦氏の連載を見つけて以来、どうもはまってしまっていたのである。

 特に今回面白く感じたのはBenhamのコマ(Benham's top)である。Benhamのコマというのは次のような画像を「コマ」にして回転させるというものだ。次に示すのは、「Oplus E」に掲載されていた杉浦康平氏デザインのBenhamのコマである。
 

杉浦康平氏デザインのBenhamのコマ その1

 このような画像を回転させると、白黒の模様しか描かれていないのに、何故かほのかに色づいた模様が見える。それが、Benhamのコマである。人間の視覚特性のために、白黒模様から色を感じてしまうのである。こういった「おもちゃ」で子供の頃に遊んでいたように思うのだが、すっかり忘れていた。きっと、理科の時間などにこういった「おもちゃ」で遊んでいたはずなのに、記憶の彼方に飛んでしまっていた。こういう記事を読み返さないと、たぶん忘れたままになってしまっていただろう。

 ところで、プリンターをお持ちの方は、このWEBページを印刷して、コマを作成してみると面白いと思う。白黒プリンターで印刷しても、コマさえ作れば、アラ不思議、その回転するコマは色づいて見えるのである。モノクロプリンターでもカラー模様が印刷できるわけだ(人間が感じるところまで含めれば)。

 他にも「O plus E」に掲載されていた杉浦康平氏デザインのBenhamのコマを示しておく。
 

杉浦康平氏デザインのBenhamのコマ その2

 さて、このBenhamのコマを私も作成してみようと思う。もちろん、実際にコマは作成して楽しんでみたのだ。しかし、せっかくなので、動画ファイルの形で簡単に見ることができるようにしてみた。WEB上で簡単に見ることができるBenhamのコマである。

 先の、「杉浦康平氏デザインのBenhamのコマ その1」を回転させるのではなく、時間的に変化する動画にしてみるのだ。といっても、こう書いただけでは判りにくいので、図で示してみる。まずは、作成した動画の各「コマ(このコマは静止画の意味)」を見てみよう。
 

今回作成したBenham's topの各コマ(このコマは静止画の意味)
1
2
3
4
5
6

 これが、「杉浦康平氏デザインのBenhamのコマ その1」を時間的に変化する動画にしてみたものだ。この図で4,5,6コマめが、先のA,B, Cに対応しているわけである。

 これをある程度高速で連続的に眺めると、この白黒模様が色づいて見えるはずである。まずは、これらの画像をアニメーションGIF画像にしたものを次に示す。とはいっても、作っては見たが再生スピードがどうにも遅い。これでは、色づいて見えるどころではない。このBenhamのコマをアニメーションGIFにする計画はひとまず挫折である。
 

今回作成したBenham's topをGIF画像にしたもの
(再生スピードが遅すぎて失敗 - 私の環境では - )

 そこで、先の画像をAVIファイルにまとめたものを作ってみた。こちらの方ならスピードはなんとか満足できている(少なくとも、私の環境では)。AVIファイルということで、Windows以外の環境では不便だと思うが、動画変化ツールは色々あるから大丈夫だろう(多分)。
 人によって、どの速さの場合が一番色づいて見えるかどうかは異なるだろうから、三種類の速度のものを作成してみた。それをここにおいておく。ちなみに、再生ソフトの設定を「自動繰り返し」にする必要がある。

 これらの各動画像を眺めて比較してもらうと、白黒の画像が色づいて見えるのが判ると思う。ちなみに、私の場合は、真ん中から左の縦線の辺りが黄色っぽく見え、右の縦線の辺りが青っぽく見える。この動画に関しては、カラーディスプレイで見る必要がない。白黒ディスプレイで見て頂いて構わない。それでも、色づいて見えるはずである。

 さて、WEB上で情報を探してみると、面白い話があった。

によれば、かつてNHKの教育放送で白黒テレビを用いて、このBenhamのコマを放送する実験がされたようだ。白黒テレビを用いてカラー放送をしようとするわけである。白黒しか表現することができないデバイスである白黒テレビも、それを眺める人間というデバイスの特性を考慮に入れてやれば、カラー放送が「できる」わけだ。実に夢があり、(人の感性を主眼にしているという意味において)先進的な実験である。こういう実験の話を聞くと、うれしくなる。

 昔、ウルトラマンをTVで見ていた頃、白黒TVで見ていた。その頃は、カラータイマーの色は私にはよく判らなかった。ボクのテレビは白黒だったからだ。ウルトラマンのカラータイマーの点滅をこのBenhamのコマのパターンで放送したりしたら、とても面白かったのにな、と思うのである。
 

2000-09-17[n年前へ]

円周率は約3で良いか 

「円周率を約3にするのなら、授業の名前も約算数とか約数学にすべきである。言葉の厳密な意味にかかずらう文化系としてはっきりとそう訴えておく。」from 朝日新聞の朝刊「eメール時評」いとうせいこう。この意見は、「そんなこと、最初からそうだ」ってことが判っていない「典型的な勘違い」だと思う。シミュレーションや計測をすると、そういうことが理解できていない人達に限って、盲目的に信じてしまう傾向があるが、それとどこか似ている。文化系とか理科系とかそんなこと関係なくて、単にいとうせいこうが「何かを絶対視したがってる」だけ。ゲーデルの爪の垢を煎じて飲んでみるのも良いのではないだろうか?だけど、いとうせいこうの「ノーライフキング」は古田足日の「盗まれた町」を受け継ぐ児童文学の名作だと思う。いや、古田足日の「盗まれた町」があまりにも早すぎた作品だったと言うべきか。

2001-02-19[n年前へ]

ひとりで書いてるだけだから。 

ヘッポコ文章を直したい


   面白い情報を探しにと「お笑いパソコン日誌」を眺めていると、「ウエヤマの事件簿」の「他人の日記をオモチャにしよう!」が紹介されていた。「お笑いパソコン日誌」に〜『できるかな?』風ネタであります〜と紹介されてあった通り、実に私好みの話だった。ウエヤマ氏が「自分で書いてる日記の文章」を解析して、文字の出現頻度を調べてみたものである。

 「できるかな?」は画像や科学の関連の話が多いように見える。しかし、実はそれだけではなくて文章や日記に関する話も多い。例えば、これまでに出てきた話を振り返ってみると、

に始まり、と続く、「文学の世界を眺めてみよう」という話など、あるいは「WEBページで見かける文体の特徴を解析しよう」としたなど、あるいは「WEB日記の文化を眺めて見たい」というなどの話があった。「技術サイト」という分類をされることも多い本サイトではあるのだけど、非技術的な話に強引に技術的な話を持ち込みたくなったり、技術的な話なのに何故かとても私的で非技術的な話が入ってしまったりするのが、良くも悪くも「できるかな?」の特徴だろう。もちろん、良いことでは全然無いのだけれど、こうでも書かないと悲しい気分になってしまうので、「良くも悪くも」と書いているのである。

 そういったhirax.netの特長ならぬ特徴は私が書く文章が下手なせいなわけで、そんなヘッポコ文章から脱出するべく、私の書く文章の特徴を調べて反省してみることにした。もちろん、自分のヘッポコ文章だけを眺めてみてもしょうがない。他の素晴らしい文章を書く書き手と比較しなければならないだろう。そこで、今回はいくつかの文章を品詞解析し、その結果の特徴を調べることにする。そして、書き手による文章の特徴が眺めながら、私のヘッポコ文章の欠点を調べ、さらには誰もが思わず涙がこぼしてしまうような素晴らしい文章を書けるようになりたい、と思うのである。
 

 さて、まずは目標を決めよう。私がヘッポコ文章を脱出してどんな文章を目指すかを、何より先に決めなくてはならない。となれば、あまりにも大それた目標ではあるのだが、やはり日本の文豪、夏目漱石は外せないだろう。そして、その教え子でもある寺田寅彦もやはり外すわけにはいかない。一応私も理系のはしくれ、日本の理系文章の流れを作ったこの二人を目標にしなくてなんとしよう。ヘッポコ文章を脱出していきなり、夏目漱石と寺田寅彦というところに無理があるが、そんなことを考えていては駄目なのである。「少年よ大志を抱け」とクラーク博士も言ったのである。もう少年と言うにはどう考えても年齢的に無理があるのだが、気持ちはまだまだ少年で目標は大きく持ってみたいと思うのである。

 そして、もう一人の目標は「ちゃろん日記(仮)」をマイペースに書き続ける「ななゑ」さんである。私は彼女の書く文章を読むたびにとても素晴らしい理系的センスが感じ続けているのである。しかも、理系的でありつつも笑いと涙のペーソスたっぷりの「ちゃろん文体」という独自の確固とした文体を築いているところも尊敬していたりするのである。

 というわけで、今回の文章の比較は

  1. 夏目漱石
  2. 寺田寅彦
  3. ちゃろん日記(仮) ななゑ
  4. 「できるかな?」 jun hirabayashi
の四人の書き手の文章を適当に二つずつピックアップして、その文章を品詞解析して簡単に特徴を眺めてみることにした。各書き手に対して、それぞれピックアップした文章はである。なお、夏目漱石と寺田寅彦は「青空文庫」から入手した。そして、これらの文章を日本語形態素解析システム茶筌&perlで解析後、Excelでさらに解析・表示を行ってみることにしよう。

 ところで、形態素解析とはどのようなものだろうか。まずは、例を挙げよう。例えば、

私が好きな書き手達は、夏目漱石、寺田寅彦、ななゑさんです。
という文章を茶筌で分解すると、
  1. 私 名詞-代名詞-一般
  2. が 助詞-格助詞-一般
  3. 好き 名詞-形容動詞語幹
  4. な 助動詞
  5. 書き手 名詞-一般
  6. 達 名詞-接尾-一般
  7. は 助詞-係助詞
  8. 、 記号-読点
  9. 夏目 名詞-固有名詞-人名-姓
  10. 漱石 名詞-固有名詞-人名-名
  11. 、 記号-読点
  12. 寺田 名詞-固有名詞-人名-姓
  13. 寅彦 名詞-固有名詞-人名-名
  14. 、 記号-読点
  15. ななゑ 名詞-固有名詞-人名-名
  16. さん 名詞-接尾-人名
  17. です 助動詞
  18. 。 記号-句点
というようになる。このように各文章を品詞毎に分解して、その出現分布から特徴を調べてみるのである。なお、今回注目した品詞は
  1. 読点
  2. 形容詞
  3. フィラー
  4. 感動詞
の四つである。この四つを選んだ理由は、読点は明確な決まりがないだけに書き手の感覚が入りやすいと思われ、形容詞、フィラー・感動詞に関しては書き手の気持ちが素直に現れやすいと思われるからである。ちなみに、フィラーとはから引用すれば、「あのー」「えー」といった語句ということになる。まずは各文章が書き手によってどのくらい特徴づけられるかのイメージを掴むために、形容詞の出現頻度とフィラーの出現頻度を軸にとり、各文章を二次元の世界に配置してみた結果を図示してみよう。
 
形容詞の出現頻度とフィラーの出現頻度を軸にとって、
各文章を二次元の世界に配置した結果

 結構、同じ書き手による文章が同じような位置に配置されることがわかると思う。ちゃろん日記(仮)などは、二つの独立した文章がほとんど同じ位置に配置されている。もう、ちゃろん文体は安定しまくっていて完成されているのである。そしてまた、「文豪」夏目漱石の場合も、「我が輩は猫である」と「坊っちゃん」がかなり近い位置に配置されていることがわかる。

 なるほど、結構書き手による特徴はこんないかにも雑な解析でも評価できるものなのかもしれない(あくまで「遊び」だけどね)。そして、形容詞の出現頻度などは、「雪だるまがいる景色」と「自然と生物」以外は大体同じようなものである。寺田寅彦の「自然と生物」は妙に形容詞の出現頻度が高いところが面白いところである。私の「雪だるまがいる景色」はあまり技術的な話ではなくて、確かに形容詞が多そうな話ではあるのだが、一体「自然と生物」はどうだっただろうか?

 ちなみに、「できるかな?」からの二つの文章は共にフィラーが一個も出てこない。その他の6つの文章にはフィラーが出てくるのであるが、何故か「できるかな?」の二つの文章にはフィラーが含まれていないのである。この差がなければ、寺田寅彦の二編と「できるかな?」はかなり似た場所に位置するのであるが、このフィラーは特に違うのである。

 さて、上の図ではフィラーと形容詞の出現頻度だけを眺めてみたが、読点、感動詞の出現頻度も加えて、クラスター分析を行ってみた。つまり、「読点・形容詞・フィラー・感動詞」の出現分布が似ているものを分類してみたわけである。クラスター分析にはExcelアドイン工房「早狩」の統計解析アドインを使用させて頂いた。ちなみに、クラスターの結合はウォード法を用い、非類似度計算法には標準化ユークリッド平方距離を使用した。その結果が下の図である。
 

クラスター分析の結果

 このクラスター分析の結果を示す図は近い文章をまとめていったものを示している。つまり、文章の「近さ」あるいは「似ている度」を示しているのである。ちゃろん日記(仮)の二編は本当によく似ていて、また夏目漱石の書いた二編も互いに似ている。そして、それより「近い度」は低いが「新宿駅は電気羊の夢を見るか?」は「科学について」に近くて、「雪だるまがいる景色」は「自然と生物」に近い。おして、さらに似ているものを探せば、ちゃろんの二編と「新宿駅は電気羊の夢を見るか?」・「科学について」は似ているといえなくもない、さらに言えばその四編と夏目漱石の二編が似ている。

 ここでは、四人の書き手がいるということが私には判っているので、あえて四つのクラスターに分解してみると、

1.
    • 「雪だるま」がいる景色
    • 自然と生物
    2.
    • 新宿駅は電気羊の夢を見るか?
    • 科学について
    3.
    • ちゃろん日記1998(仮)11月上旬
    • ちゃろん日記1999(仮)6月上旬
    4.
    • 我が輩は猫である
    • 坊ちゃん
という風になる。やはり夏目漱石とちゃろん日記に関してはこんなチープなごく少数の品詞解析でも、「作者の文体が同じである」と解析されてしまうのである。なかなか、スゴイとは思わないだろうか?数多くの解析をしてみるのもなかなか面白いと思う。高校生のレポートくらいだったら、これで何とか書けそうである。

 しかし、その一方で考えてみれば寺田寅彦の名随筆と「できるかな?」のヘッポコ文章が「文体が近い」と解析されてしまっているわけなので、実はこの解析の信頼性はかなり低いと言わざるを得ないところもあるのである。いや、もしかしたら「文体は同じやけど、内容が全然違いますがな」というような冷たいアドバイスを解析結果は言わんとしているのかもしれないが、もうそれは哀しすぎる事実なので考えたくないのである。

 さて、そう言えば一番最初の図で「できるかな?」と寺田寅彦の差はフィラーの出現分布だったわけであるが、「大学の講義における文科系の日本語と理科系の日本語-- 「フィラー」に注目して --」では、「聞き手への働きかけのあるフィラーが多いということは聞き手への配慮が大きいということにつながる」と書いてあった。ということは、フィラーの出現分布は聞き手への配慮に比例するというわけで、「できるかな?」の文章にフィラーが出てこない、ということは読み手に対する配慮がない、なんてことなのかなと思ってしまったりするのである。

 そんなことを考え出すと、ホラどうせひとりで書いてるだけだから読み手のことなんか考えていないのさと、思わず涙がこぼれてしまうような哀しい気持ち、になったのである。う〜む、最初は誰もが思わず涙がこぼしてしまうような素晴らしい文章を書けるようになりたいと思ったったのに、何でこんな結論になるんだろう?

 答え: それは文才がないからです。ハイ。
 
 



■Powered by yagm.net