ヴォイニッチ手稿とぶぐばぐぶぐばぐ


ヴォイニッチ手稿がまたもや解読されたという。こないだのロシアに数学者につづいて今度は、イギリスの中世の文献の専門家だそうな。ちょっと英語圏の動向を追ってみたけど、ラテン語の人たちが「お前まじでか」と言っているようなので、残念オチかもしれない。興味があったので英語の報道ほうを読んでみたけど、ちと自分にはわからなかった。2行しかないのかね?

 

ヴォイニッチ手稿の解読ついに成功?そこには婦人病の治療法が描かれていた!?(英研究者)
karapaia.com/archives/52245622.html

 

ロシアの数学者たちが「ヴォイニッチ手稿の言語構成の解読に成功」との報道。使われている言語の60%は英語とドイツ語であることが判明。そして内容の一部には「ケシからアヘンを採取する方法論」が含まれる模様
indeep.jp/russian-mathematicians-proved-the-meaning-of-the-voynich-manuscript/

なんかロシアの数学者達のほうが、まだアプローチがちゃんとしてる感。

 

ラテン語と古ギリシャ語

日本人がその語の成り立ちを考えたときに漢文の影響を排除できないように、英語も古典ギリシャ語やラテン語を無視することはできない。e.g. (exempli gratia / たとえば)、化学や自然科学領域では死語とされているラテン語でさえもそれほど遠くない存在で、いまだそこここにある。

 

化学科の大学一年生は有機化学などでIUPAC命名法を習うが、きちんと命名法に従って記述されていれば化学式を連想することができる。ここで主につかわれるのは元素記号や学名がラテン語に由来していて、冠でギリシャ数詞がもちいられる。古ギリシャ語やラテン語のくびきからは現代社会でも効いている。

略語で意味を通じさせることができるのは、共有知、暗黙知があればこそである。

ちょいと古いがネットスラングで、afk(away from keybord)だの、wktk(ワクワクテカテカ)などがあるが、ゲーマーがタイプ速度を優先したのと、墓石などに刻むのに母音が落ちる方向に省力化されてきたのもの似たようなものかもしれない。

 

IUPAC命名法でいうところの2-プロパノールが慣用名イソプロピルアルコールで通じるのは、その双方で単語の背景に知っておくべき知識が暗黙的に共有されているからなのさ。

 

読まれるための文章と読まれないための文章

常用されていないのに、略語を使う理由は読まれないための工夫だと思われる。
はたしてヴォイニッチ手稿は読まれることを前提としたものか、読まれないために工夫したものなのか。

同じようにまだ解読されていないレヒニッツ写本などは、右から左にかかれている以外は素直なので読まれることを前提としているものだと思うが、正直ヴォイニッチ手稿はどちらなのか判別できない。

ラテン略語でかかれたのであれば、後人にも読まれるための文章として書かれたものであろう。しかし、それが、それがページセンテンスごとに意味を持つには、略語だとしてもページあたりの語彙数があまりに少ないと感じるのだ。表音文字であればなおさらである。exempli gratiaをe.g.と大胆にサイン化、表意化したとしても、その情報量は少なさは補えないんじゃなかろうか。

 

もし、これらが読まれないための工夫がされていた場合、それは暗号ということになるが、暗号であればさらに複号前の語より情報が落ちるのが常である。日本語のような表意文字の情報の圧縮度に比べたら大した情報を含んでいないじゃねぇかな。

個人的には文章のようにみえるものはただの文字楽譜だとおもうので、奏者にだけわかればよい、後人にも読み方さえ教えてあげれば読めるものとして残したのだと思うが・・・・・・、そういう個人的主張はおいておいて、仮にヴォイニッチ手稿に意味ある文章が略記されているパターンを考えてみる。

 

暗号と複号

暗号文より複合文のほうが情報が多くなるパターンを考えてみる。

「今日の5限の体育本当にめんどくさい。」という文意を伝えた女子高生同士のメモのやり取りが発掘されたとして、そのメモが「次・授業・だるい」としか書かれていなければ、欠落した「体育」という情報にたどり着くのは不可能に近いが、メモの共有者同士では、次の授業が体育であると暗黙的共有があるので、意思疎通ができる。

そのような、暗黙知をテキスト化して、暗号表にする方式がある。

事前に配っておいたスパイ手帳の3ページ目4番目の項目を実行しなさいとかを指示するだけであれば、北朝鮮工作員御用達の乱数放送みたいに数字をラジオ放送で流すだけで意思疎通ができるうえ、相手は複号用の鍵を手にいれるまでは推測でしか暗号を読むことはできない。

複号用のテキストに聖書のようなポピュラーな書籍を使うこともあるが、センテンスでの引用ができなくなるので、単語ごとの引用になる。この場合は、ほとんど暗号文と複合文のテキスト長はかわらなくなる。

125ページの3行目3番目の単語(P125L3W3)、32ページの12行目5番目の単語(P32L12W5)のように、羅列する。P45L12,P21L3W1,P21L4W4 のようになり、ヴォイニッチ手稿は異様な繰り返しの多さ、まるで音楽のシンコペーションのような特徴をみたしているので、可能性として、なくもないかもしれないけれど、年代からいっても「鍵の本」が失われているので、複号は無理だろうね。

単語の出現頻度などから推測はすることぐらいしかできない。まあ、その場合は、完全に読ませないための工夫がなされた暗号ということになるね。

 

まぁ、でもなぁ

突然だけど、

武具、馬具、ぶぐ、ばぐ、三ぶぐばぐ、合わせて武具、馬具、六ぶぐばぐ。

菊、栗、きく、くり、三菊栗、合わせて菊、栗、六菊栗。

 

これは、1718年より上演されている有名な歌舞伎演目の外郎売の一節。もし、これにまつわる、いろいろなものがロストして、ふいに、この文面だけ後世に伝わった場合、日本語の単語こそ使われてはいるが、そこから意味をすくい取るのは困難であろう。武具、馬具、ぶぐ、ばぐなんだから、2武具馬具なんじゃないかとか後世の研究者を悩ませるに違いない。

 

パイポパイポパイポのシューリンガン

シューリンガンのグーリンダイ

グーリンダイのポンポコピーのポンポコナーの長久命の長助

ここまでくると、もっと研究者を悩ませることになるだろう。落語の寿限無は既に発生年代不明になっているようで、米沢彦八(~1714)より後っぽいが、まあ、そんな感じ。

 

カエルピョコピョコミピョコピョコ。

 

 

ドリフの早口ことばとかを聞きながらおもうんだけど、やっぱり文字譜なんじゃないのぉ。あってもチャントぐらいだなぁ。シンコペーションの効いた繰り返しが多すぎるよ。

ちなみにイラストのほうには意味があるのは同意。

昔のこのブログ投稿。

線をひけばすぐわかるヴォイニッチ手稿のイラスト

ヴォイニッチ手稿に書かれたスペイン語

ヴォイニッチ手稿はどうみても楽譜

 

c.f.

有機化学論文のラテン語
chemistry4410.seesaa.net/article/135191973.html

 

ギリシャ語及びラテン語の数詞
www.nihongo.com/aaa/chigaku/suugaku/greek.htm

 

学術用語におけるラテン語の影響についての研究
ci.nii.ac.jp/naid/120005578685

 

IUPAC命名法
ja.wikipedia.org/wiki/IUPAC%E5%91%BD%E5%90%8D%E6%B3%95

 

学名
ja.wikipedia.org/wiki/%E5%AD%A6%E5%90%8D

 

外郎売
www.arcadia-enter.com/geiko-pro/school/04.html


電気自動車と大局観


イギリスとフランスの政府は2040年までにガソリン車の新車の販売禁止を打ち出した。中国政府も同じような措置を検討しているそうだが、世耕経済産業大臣は「いきなり電気自動車にいけるわけでもない」として、大局については先送りする方針をとった。なんというか、兵の練度は高く戦術はあるが戦略がないと敵対国から評されたかつての日本の軍部のようである。

 

経産相「いきなり電気自動車にいけるわけでもない」
www3.nhk.or.jp/news/html/20170915/k10011140721000.html

 

「いきなりスマートフォンにいけるわけでもない」と同じような経営判断が国レベルでなされている危機感。燃料自動車の部品点数は全部で10万点ほどある。これらを部品を大手メーカーに納入している零細業者も多い。

対して電気自動車の部品点数はわずか100点ほどしかないという(*1)。部品メーカー従属産業はその仕事を失うだろう。もし、電気自動車に世界がシフトするのであれば、そのトレンドを無視するのはとても危険なことである。既存の自動車メーカーはシャーシ屋さんになりさがる可能性がある。

すべての工業製品、ソフトウエア製品の部品は汎用モジュール化する方向にトレンドがあるのは明らかだが、それを無視して先送りするのはあぶねぇ話しだ。戦術どころか戦略も、ひょっとするとどうしたいのかというビジョンも怪しいんじゃねぇか。

 

自動車の歴史

  • 1769年 自動車 誕生
  • 1777年 電気自動車 誕生
  • 1886年 ガソリン自動車誕生
  • 1900年 ガソリン自動車の量産化(この頃は蒸気自動車が主流)
  • 1908年 T型フォード(自動車大衆化)

燃料自動車よりも電気自動車のほうが歴史があるんだね。

日本でみてみると人力車は都市圏では1926年頃、地方でも1935年頃から減少に転じたそうだ。紀元前からあった馬車を輸送市場から駆逐するのにガソリン自動車の登場から50年も必要としなかった。馬の寿命や、車夫の労働寿命を考えれば、衰退産業への新規流入が三世代続くこともないだろう。産業の置き換えに数十年も必要としなかったはずだ。

 

なぜ電気自動車か

ガソリンエンジンのエグゾーストノートが好きだという人は残るだろうし、現に石油発動機の愛好会のようなものもまだあるので、愛用する人は残り続けるだろう。

でも、これからが電気自動車なのは、自動運転などの電子制御が重要となり、それに必要なのがサーボーモーター(モーターの状態を検出でき制御できるモーター)だからだ。

駆動装置の総電気化には、バッテリーの蓄電技術だけでなく、ソフトウエア技術のブレイクスルーが必要なのだが、どちらも既に製品化される程度には練れてきている。そして、その技術は踏みあがりはパネェ勢いだ。

自動車より安全基準の厳格な飛行機で、アクチュエータが油圧式から電気式に切り替わりつつあるのは、なにも軽量化だけのためではない。燃料エンジンを電子制御しようとすると燃料注入量をコントロールするのは、アクセルを上手に踏めるロボットをつくるようなもので、昨今のソフトウエア技術を活かしきれないのである。燃焼度がどうなっているのかセンシングして、それを制御するなどせねばならず、複雑すぎるのだ。キープイットシンプル!

 

電気自動車の普及と予想

いま、日本の自動車台数、ハイブリット車台数、電気自動車台数をグラフにするとこんな感じ(*2)。電気自動車なんて雑魚もいいところ。

このうちEVだけ抜き出して、表示してみる。点線は近似式。

で、現在のEV車の販売台数推移の近似式を2040年まで伸展させてみる。

まあ、いまのペースなら2040年には110万台程度。結構のびる感じはするけれども、それでも市場の15%程度にしかならない。だが、近似式、現在の「y = 1113.4×2 – 4972.3x + 4204.5」これはあくまで電気自動車のラインナップがあまり揃っていない状態。なんのブレイクスルーも今後ないとした場合の伸展上だ。

 

だが、メーカーはそのような経営計画はしていない。

 

ルノー・日産、22年に完全自動運転/販売の3割 電動車に
www.nikkei.com/article/DGKKASDZ15I31_V10C17A9MM8000/

 

ルノー・日産、22年世界販売1400万台に 16年比4割増
www.nikkei.com/article/DGXLASDZ15HMM_V10C17A9000000/

 

ここから逆算すると、420万台。

日本の日産、三菱の3割というと、市場シェア14%の3割だから市場の4%ぐらい。24万台。

2022年に24台なら2040年に140万台ぐらいで、420万台ぐらいが流し込まれるなら2040年には3,000万台。
この数字だけ追えば「いきなり電気自動車にいけるわけでもない」という、言説にはある程度説得力がある。

 

いずれにしろ、まだ自動運転も日本では試験走行しかなされておらず、電気自動車向けのインフラ整備もなされていないので、あと5年ぐらいでどの程度社会環境に変革があり、その時の販売台数がどうなっているのかで、将来どうなるのか予測できるだろう。

いずれにしろ、電気自動車化による部品点数の変化は日本のものづくり偏重政策に重大な外部環境変化であり、テスラモーターズの登場からだけみても、いきなり市場環境が激変するかもしれないから大局的にはどうすべぇぐらいの先見性は欲しい。燃料バイクと電動バイクのほうがシェアのリプレイスとしては先行していそうなので、時間があったら調べたいな。

 

トヨタはテスラに手を出そうとして袖にされて、東芝とかNECがある駅に求人投下しているみたいだけど、ちと日本の自動車産業は足が遅いかもしれないね。というか日本の電機メーカーはソフトウエアに対して感度がにぶすぎるので、もうどうしょうもないのかもしれないけど。

政治のほうも、いくら政治が技術に遅行するといっても、ちょっと、心配になるレベル。

自動運転とかソフトウエア制御による環境判断の未来がこないわけはないので、いからインフラはそれに沿わしてつくっておかないと、古臭い耐久消費財に金を払い続けることになるぞ。ネットや電気をつかえないビルをいまから設計するようなもんだよね。

 

ロジスティクスの変化

かつては、人の足の移動距離に応じて宿場が整備され、それから電車による流通が整備され、そして現代はトラック流通網になっている。道路網はそれに添って整備されてきた。トラックが自動追従型の自動運転になったら?生活道路に、アシスト付き車椅子とか、小型モビリティが混在しだしたら?
生活道路のうち、この道は、電動モビリティ優先とかそういう、街設計は必要だよね。

いきなりはこないけど、くる気配はもう数十年ゆっくり前進してんだから、ゆっくりでいいから準備しようぜ。鉄腕ダッシュでソーラーカーが日本一周したのいつだよ。ドローンが宅配してくれる宅配網とか整備計画ぐらいはしてほしいなぁ。

 

参考

(*1)
電気自動車により変化する産業構造
allabout.co.jp/gm/gc/423948/

 

自動車誕生から今日までの自動車史(前編)
gazoo.com/article/car_history/130530_1.html

 

(*2)
日本における電気自動車のシェア!

日本における電気自動車のシェア!

 


AIに聞いてみた どうすんのよ!?ニッポン


AIに聞いてみたどうすんのよ!?ニッポンという番組がNHKで放映された。
www.nhk.or.jp/special/askai/

この番組は「40代ひとり暮らしが日本を滅ぼす」というキャッチコピーで、放映前からSNS界隈で問題視されていたけれども、案の定なかなかの問題作で放映後はさらにTwitterなどを中心に多くの声があがった。

 

 

最近、政治界隈でくりひろげられるマスメディアの残り少ない信用を積極的に売り飛ばしていくポストトゥルースやら、オルトファクトだかの流れ、喧伝、扇動はちょっと目に余るが、だがまあ、政治界隈はイデオロギーや信念に基づいたり利害が直接結びつくのでわからなくもない。だが、誘導したところで利益を得る人もすくないであろう社会分析系の番組、しかもスポンサーへの利益誘導が必要でもないNHKで、魂を売り飛ばしていくのはさすがにここまで来たか感がある。

 

 

センセーショナルな見出しをつけても、視聴率がちょと上向いて物議をかもすぐらいの効果しかないと思うけれども、なんかもうそれぐらいの挟持なんだなと憐憫。

 

 

番組内でAIからの提言とされた5項目

01.健康になりたければ病院を減らせ
02.少子化を食い止めるには結婚よりもクルマを買え
03.ラブホテルが多いと女性が活躍する
04.男の人生のカギは女子中学生の“ぽっちゃり度”
05.40代ひとり暮らしが日本を滅ぼす

 

はぁ・・・。

番組の問題点を簡単に指摘すると、擬似相関でしかないものを因果関係にあるかのような文脈に載せてそれをAIがこう言っていますと発信してしまっていることだ。

 

過去30年分の社会データを700万件分食わせてディープラーニングさせたそうだ。
この簡単な触りからしか、手法が推測できないが、ほんとただディープラーニングで相関係数を出して、相関度が高いところをforce-directed graph(力学モデル)とかでネットワーク表示させただけなんじゃないかと思う。データを食わせるために整形するのは大変だけれども、別段新しいことをやっているようには見えない。

 

 

技術人が相関関係と因果関係の違いや、擬似相関を知らない程度の知性で相関を出せるわけはないので、本の執筆者が編集者に売れるためにタイトルを勝手につけられて泣くというような強烈な編集ハラスメントが番組でもおこなわれたのだろう。

 

 

おそらく、ディレクションの段階で安易な誘惑に負けた(負された)んだと思うが、だからといって「健康になりたければ病院を減らせ」とかをAIからご信託がありましたとかやってしまうのはモラルとしてアウトだ。完全に暗黒面に落ちている。

 

相関関係

 

例えば、小学生の学年(Y軸)があがるほど身長が高くなる(X軸)という分布はこのようになる。
このような関係を強い正の相関があるといい、小学生の学年は因果関係で言うところの原因で、身長が高くなるというのは結果だ。
因果を取り間違えると、学年をあげたければ身長を伸ばせという論になる。

グラフは適当。 bl.ocks.org/mbostock/3213173

 

相関関係の強さ

例えば、高校生ぐらいになると身長の伸びも緩やかになるので学年と身長などになると相関関係が弱くなる。なってばらつきが出て来る。こういうのを弱い相関があるという。

 

 

 

 

無相関

で、社会人の年数と身長ぐらいになると、ほとんどこの2つの指標は関係なくなるのでたぶん無相関となる。もしかしたら世代的な意味で逆相関はあるかもしれないが、ばらつく。

 

 

 

 

擬似相関

で、小学生の「身長」と「読み書きできる漢字の数」などを調べるとこういうようなグラフになるはず。
本当は学年の変化(潜伏変数)があって、この年令が身長と漢字の数に交絡しているので、この2つに相関が生まれているのだ。

 

 

 

 

 

 

擬似相関は慎重に取り扱えれば直接は観測できないものの兆しを観測することができる。

たとえば中国にはザーサイ指標なるものがあるそうだ。
1.ある都市に肉体労働者が出稼ぎで集まってくる。
2.肉体労働者は塩分補給のためザーサイを買う。
3.出稼ぎにくるほど経済が成長している。

 

  • 1→3(相関、因果)
  • 1→2(相関、因果)
  • 2→3(擬似相関)

 

3を誰よりも早く予見したいがために、2を先行指標として調査するのだ。
風が吹けば桶屋が儲かるというような、三段論法だ。直接統計などを取りにくい、因子を観測するために先行指標としてよくわからないものを採用することはままあることだ。

 

 

で、最初の問題に戻る。

「経済成長にはザーサイを売れ」とやってしまうのは、因果も取り間違えているし、しかもそれただの擬似相関だしみたいなトンチンカンな議論になる。

しかも番組がAIが提言したとするものは、過去データから抜き出した(バックテストからの)相関であって、おそらくそれは未来(フォワード)にはマッチしないような項目ばかりなのがさらに頭を抱えたくなる。

 

 

それを踏まえて、身も蓋もなくマーケティングAIを腐しておく。

 

 

×健康になりたければ病院を減らせ

○病人を追い出したければ病床数を減らせ

日本の入院という仕組みが健康寿命を著しく悪化させるエビデンスだとするのであれば、もしかしたら、あたりの相関かもしれない。
終末期医療で無為に点滴などしないで、十二分に枯れさせてから看取るみたいな話しが石飛幸三さんの 「「平穏死」のすすめ」にあるように、もしかしたら、
結構リニアな潜伏変数かもしれない。
バナナの売れ筋については高齢者の嗜好の問題じゃないかな。

 

×少子化を食い止めるには結婚よりもクルマを買え

○車が売れた時代には子供が生まれた

これは過去30年のデータを食わせたからでしょう。
子供が増えた時代は車が売れてた時代なので、相関が出ますよね。
それよりも一個手前にあった付加価値額のところはかなり本質的なところで、社会統計でみるとこの付加価値額が日本はずっと落ちてきているんだよね。酷いんだ。日本の停滞のほとんどがここに起因していると言ってもいいぐらい。
より労働生産性と付加価値創造に転嫁できる社会なら安泰だよね。

 

×ラブホテルが多いと女性が活躍する
○女性の社会進出でラブホテルの需要が増えた

これもどうなんだろうね。
昔から女性は活躍してたわけで、女性の活躍を年収とかで量るより狭義になっただけだと思う。

 

×男の人生のカギは女子中学生の“ぽっちゃり度”
○女子高生の栄養バランスが悪化すれば男の人生なんかままならない

炭鉱のカナリアとは言い得たり、そのまま擬似相関の先行指標であろうと思う。

 

貧困と肥満は確か世界的にもかなり強い相関があったと記憶している。
肉や魚、野菜、果物などは比較的高価で摂食する機会が減り、安価に腹が膨れるお米やパン、小麦、芋が中心の食生活になるからだ。炭水化物が主となる食生活は肥満につながりやすい。

 

 

これら食生活にビビットに影響を受けるのが育ちざかりの女子中学生なのだろう。
男子中学生は二次成長期だから皮下脂肪じゃなくて筋肉で消化されちゃうから女子中学生より反応がぬるいのだろう。

 

で、「経済の悪化」という隠れている潜伏変数があったとして、
これに起因して、子育て世帯の家計の悪化、炭水化物食生活になって、太る。
そんなところではないだろうか。
擬似相関だが先行指標としては悪くない。
男の人生のカギはとかいう文脈に載せてしまうのが、最悪なだけだ。

 

×40代一人暮らしが日本を滅ぼす。
○40代一人暮らしが増えるような社会は滅ぶ。

擬似相関な上に因果を取り間違えている典型的な例だ。
年齢というファクターを無視して「成績をあげたければ身長を伸ばせ」ぐらいのトンチンカンさだ。

なんかよくわからないけど日本が滅ぶようなファクターがあって、
それが機能するような状況では、40代一人暮らしが増える。ただそれだけだ。

で、全部それらはつながっていて、結局のところ日本の場合は付加価値額の減少でしょ。
中小企業の産業別付加価値額の偏差を算出すれば、今何がおこっているのかわかるよ。

 

 

価値あるものを作り出して、それを何に再投資して、次の価値を作り出していくかっていう社会の営みで、種籾を食い荒らしたり、稚魚を根こそぎ乱獲するような強欲な奴がいれば、滅びのフラグがどんどんたつだけだべさな。

 

AIのせいで終わらせてはいけない。