数学カフェに参加しました
今日は土曜日。曇り時々晴れ。
7時半起床。
朝食を食べて、しばらくまったり。そして二度寝。
昼食。
13時~18時まで第33回 数学カフェに参加してました。
これから夕食。
その後は、お風呂入って洗濯して寝ます。
明日は、【訓練校1月生】Java基礎演習講座五日目サブ講師。
頑張る。
【今後の予定】
・2021年01月~ 職業訓練校Java&Python&Web技術者(3か月)
【詳細TODOリスト】
・03/24(AM) 訓練校01月生 データベースとWebシステム概論(JavaEE)
【今日の読書】
・多変量統計解析法 田中 豊
・平均・分散から始める一般化線形モデル入門 馬場 真哉
・Pythonで学ぶあたらしい統計学の教科書 (AI & TECHNOLOGY) 馬場 真哉
・心を知るための人工知能: 認知科学としての記号創発ロボティクス (越境する認知科学) 谷口 忠大
・物理学者のすごい思考法 (インターナショナル新書) 橋本 幸士
・統計学への確率論、その先へ―ゼロからの測度論的理解と漸近理論への架け橋 清水 泰隆
・代数幾何学入門:代数学の基礎を出発点として 永井 保成
・ランダム行列の数理と科学 渡辺澄夫
・認知バイアス 心に潜むふしぎな働き (ブルーバックス) 鈴木 宏昭
・絵で見てわかるSQL Serverの仕組み 平山 理(P.84/314読了)
・ベイズ統計の理論と方法 渡辺 澄夫
・経済・ファイナンスのための カルマンフィルター入門 (統計ライブラリー) 森平 爽一郎(P.21/215読了)
・ライブ講義 大学生のための応用数学入門 (KS理工学専門書) 奈佐原 顕郎
・心は量子で語れるか―21世紀物理の進むべき道をさぐる (ブルーバックス) ロジャー・ペンローズ(P.71/286読了)
・解析力学・量子論 第2版 須藤 靖(P.55/304読了)
・数理科学 2020年 11 月号 [雑誌]
・人工知能 機械学習はどこまで進化するのか (別冊日経サイエンス239) 竹内郁雄
・データ分析の力 因果関係に迫る思考法 (光文社新書) 伊藤 公一朗
・一般ゲージ理論と共変解析力学 中嶋 慧
・応用に役立つ50の最適化問題 (応用最適化シリーズ) 藤澤 克樹
今日は土曜日。曇り時々晴れ。
7時半起床。
朝食を食べて、しばらくまったり。そして二度寝。
昼食。
13時~18時まで第33回 数学カフェに参加してました。
これから夕食。
その後は、お風呂入って洗濯して寝ます。
明日は、【訓練校1月生】Java基礎演習講座五日目サブ講師。
頑張る。
【今後の予定】
・2021年01月~ 職業訓練校Java&Python&Web技術者(3か月)
【詳細TODOリスト】
・03/24(AM) 訓練校01月生 データベースとWebシステム概論(JavaEE)
【今日の読書】
・多変量統計解析法 田中 豊
・平均・分散から始める一般化線形モデル入門 馬場 真哉
・Pythonで学ぶあたらしい統計学の教科書 (AI & TECHNOLOGY) 馬場 真哉
・心を知るための人工知能: 認知科学としての記号創発ロボティクス (越境する認知科学) 谷口 忠大
・物理学者のすごい思考法 (インターナショナル新書) 橋本 幸士
・統計学への確率論、その先へ―ゼロからの測度論的理解と漸近理論への架け橋 清水 泰隆
・代数幾何学入門:代数学の基礎を出発点として 永井 保成
・ランダム行列の数理と科学 渡辺澄夫
・認知バイアス 心に潜むふしぎな働き (ブルーバックス) 鈴木 宏昭
・絵で見てわかるSQL Serverの仕組み 平山 理(P.84/314読了)
・ベイズ統計の理論と方法 渡辺 澄夫
・経済・ファイナンスのための カルマンフィルター入門 (統計ライブラリー) 森平 爽一郎(P.21/215読了)
・ライブ講義 大学生のための応用数学入門 (KS理工学専門書) 奈佐原 顕郎
・心は量子で語れるか―21世紀物理の進むべき道をさぐる (ブルーバックス) ロジャー・ペンローズ(P.71/286読了)
・解析力学・量子論 第2版 須藤 靖(P.55/304読了)
・数理科学 2020年 11 月号 [雑誌]
・人工知能 機械学習はどこまで進化するのか (別冊日経サイエンス239) 竹内郁雄
・データ分析の力 因果関係に迫る思考法 (光文社新書) 伊藤 公一朗
・一般ゲージ理論と共変解析力学 中嶋 慧
・応用に役立つ50の最適化問題 (応用最適化シリーズ) 藤澤 克樹
【第33回 数学カフェ】カメラと代数幾何学
講演者は東京大学大学院特任研究員の三浦真人さんです。
今回はZoomで、13:00~17:00までの時間参加しました。
以下は私の備忘録のノートです。
■第1部ピンホールカメラ模型
命題:ピンホールカメラ模型は射影空間における射影に他ならない。(Goal)
K=R(実数) or C(複素数)を数の集合とする。(体)
●有理写像・・・代数幾何で扱う代数的な写像。
まず代数的な関数とは四則演算を使ってかけるものを考える。以下に限る。
(1)多項式関数・・・足し算、掛け算、引き算が書けるK->Kの写像。(環)
(2)有理関数・・・・・多項式関数に加え、割り算もできる。分母が0の場合は定義できない。(体)
※代数的ではない関数例・・・解析関数(収束冪級数でかける関数)
次に多変数の代数関数を考えてみる。(K^n:n次元の数ベクトル空間)
有理写像は、K^n -> K^mの代数的関数のことを言う。
もちろん各要素の分母が0の場合は定義できない。
●ピンホールカメラ模型
3次元の空間を2次元に写し取る物をカメラと一般に呼んでいる。
ピンホールカメラは暗室の空間に穴をあけて、穴を通して入ってきた画像をスクリーンに
写し取る仕掛け。よってスクリーンの映像は反転して逆になる。
つまりピンホールカメラは、R^3 (x,y,z) -> R^2 (x/z, y/z)の有理写像でになっている。
※1 点の行先のみ(座標)を見ている。(明るさ、色は考えていない)
※2 前も後ろも移っている。陰に隠れるものも写ると考える。
つまりまずは純粋な有理写像だけを考える。
そこでの奇妙な現象、例えば平行線は遠くの先で交わって見える(消失点がある)。
3次元空間の写真上のどの点も消失点になっている。
この消失点は無限遠点なのか。。。
●射影空間
K上のn次元射影空間を考える。これはK^(n+1)の「方向」(1次元部分空間)の集合となっている。
これは、n+1個の数の比となっている。(斉次座標)
[a0 : ・・・・ : an] = [λa0 : ・・・・ : λan](λは0ではない)(ただしゼロだけの比は除く)
0次元の射影空間は、1点を表す。
P^n = K^n ⋃ P^(n-1)という交差のない合併で書ける。
で、K^nは0ではないという仮定から、(a0/an, ・・・, a(n-1)/an)と書ける。
定義: P^nにおいて同次多項式の共通零点として定まる図形のうち既約なものを(射影)代数多様体という。
●有理写像(射影空間版)
有理写像 P^n -> P^mは、k次の同時多項式を使って、ベクトルxからm次の多項式ベクトルの比として書けるもの。
※定義できない点もある。
●ピンホールカメラ模型(射影空間版)
P^3 -> P^2への有理写像である。
K^3 :(x,y,z) -> P^3 [x:y:z:1] => P^2: [x,y,z] -> K^2 : [x/z, y/z]
定義されないのは、[0:0:0:1]という1点だけ(カメラの中心)
定義:射影空間における射影とは、P^n -> P^m (m < n)の写像でベクトルxからAxへの変換で書かれるものとなる。
■第2部 n次元形状の再構成問題
複数枚の写真と手がかりから3次元の物体を再構成したい。(出発点)
ここから射影再構成 -> アフィン再構成 -> 計量再構成 -> より高次な情報の再構成(材質、運動)
と話が流れていく。
●幾何学とは何か
エルランゲン・プログラムの思想(クライン)。
「幾何学とは、空間Xと対称性の群Gの組(X,G)に対して不変な性質を調べる学問である」
例:
Euclid空間とEuclid合同変換群(平行移動と回転)。不変量として長さ、角度、体積など。。
●再構成問題における空間のモデル
P^n:射影空間に付加構造を考える。
H⊂P^n : 無限遠超平面(例えば、x_n=0)
Q⊂H : 絶対2次超曲面(例えばx_0^2 + ・・・ + x_n^2 = 0)
①射影空間(P^n, PGL(n+1, K))
PGL(n+1, K)は射影変換群(P^n -> P^n) [ベクトルx] -> [Ax] 全単射。
不変量は、図形の交わり方、接し方、穴の数(位相不変量)などが考えられる。
②アフィン空間(K^n, Aff(n,K))
Aff(n,K)はアフィン変換群(K^nの平行移動と一般線形変換)。
これがP^nの射影変換でH⊂P^nを保つものと同等である。
不変量は、平行性、体積の比、重心などが考えられる。
③ワイル空間(K^n, Sim(n,K))
Sim(n,K)は相似変換群。(K^nの平行移動と回転、拡大、縮小もOK)
P^nの射影変換でQ⊂P^nを保つもの。(Hも保つ。)
不変量は、長さの比、角度などが考えられる。
※K=Cで再構成できるとしたら、K=Rでも再構成できる。
※K=Cを考える意味は、交差のロバストネス(ベズーの定理に関連)がある。
※複素射影空間の解析的部分空間は代数多様体になる(Chowの定理、GAGAの定理)。
■第3部ピンホールカメラ模型の再論
ピンホールカメラは、φ:P^3 -> P^2のグラフと考えられる。
●トーリック多様体
T^n = (K^x)^n をn次元トーラスとする。
これはn個の0でない数の組のベクトルの集合である。
ベクトルsとtがあったら、それぞれのベクトル要素の掛け算が定義される。
またベクトルの逆変換もある。単位ベクトルもある。つまり群となる。
(脱線話として、群は対称性を扱うので、幾何学的に近い。)
ここで、T^n -> P^N (N >> n) の単射で、ベクトルtから[P0(t):・・・:PN(t)]への変換を考える。
各要素は(係数1)の単項式t1^a1・・・tn^anで、各ベキを取ったベクトルa=(a1,・・・an)を格子点とする。
この変換の像の閉包をn次元(射影)トーリック多様体と呼ぶ。
R^nのN+1個の格子点がトーリック多様体を記述する。(ザリスキー位相と関係?)
凸多面体は△。
技術的な過程:
△の内部の格子点は全て単項式に使われているものとする。=>正規性。
△に付随するトーリック多様体をP△⊂P^Nと書く。(N=|△∩Z^n|)
●射影空間
P^1 ⊃ R^1 ⊃ T^1は、[x:1] <- x=t <- t≠0となる。
●射影空間の直積
例:P^1 × P^1 [x:y] ×[z:w] = [xz: xw: yz: yw]というP^3への変換。(Segre埋め込み)
●射影のグラフ
ピンホールカメラ P^2 [x:y:z] -> P^1 [x:y]のグラフを考える。
P^2 -> P^2 ×P^1 : [x: y: z] ->( [x: y: z], [x:y] )のグラフを考える。
カメラの中心は映らなかったP^2点を高次元で表現して集中した交点を分散させる
(爆発:ブローアップ)させる。爆発は有理写像となる。
爆発は代数多様体の特異点を解消するのに使われる。
解消することによって代数多様体の中で滑らかに扱うことができる。
このような操作を行うことでカメラ自身が映らない問題を解消することができる。
■第4部 多視点幾何学(multiple view geometory)における再構成問題
ピンホールカメラの組(φ1, φ2): P^3 -> P^2 ×P^2 のグラフ
●点対応とマルチビュー多様体
r個のカメラに対する点対応。
様々な角度のカメラのシルエットが得られる。このシルエットの点対応が分からなければ
意味がないので、それらの点対応が分かっているものとする。
元々の点からのr個の点写像を考えて、その像の閉包(写っていない点も含む)は
代数多様体になる。これをマルチビュー多様体という。
(トーリック多様体は多面体で見ることが出来る多様体だが、一般にはマルチビュー多様体
はトーリック多様体とは限らない。)
●射影再構成の手続き
まずは点対応を見つける。
マルチビュー多様体を特定する。
カメラを再構成する。(逆写像も分かる。ただし射影変換を除く。)
射影変換を除くの射影空間は区別できず、再構成の過程からは分からないから。
現実のアルゴリズムはこれは難しい。現実のアルゴリズムでは、
点対応から部分空間対応を見つけ、"マルチフォーカルテンソル"を特定し、
カメラを再構成する。これは前者の方式と1:1であることが知られている。
ただしカメラが2台ある場合にはカメラとカメラを結ぶ線分上で動いているものは
区別できず特異点となる。(本来は1点に潰れていなければならない。)
この特異点の爆発により解消させる。この罰初による特異点解消は2通りしかない。
この2つのトーリック多様体は同型ではない。
一つは射影のグラフにはならない。よってもう一つを使う。
●射影再構成定理
一般的なr個の射影に対して射影構成は例外を除いて一意的に決まる。
例外とは、①次元が低い②画像が全て一次元のときに限る。
■所感
最初はカメラと代数幾何学ってどう繋がるのかなあって思いましたが、
その間に深い数学的理論が広がっていんだなあって少しびっくりしました。
勉強不足でトーリック多様体の処は少し理解が足りず、深く理解に至りませんでした。
三浦さんの手書きの板書は綺麗で、説明も丁寧でした。
どうもありがとうございました!
講演者は東京大学大学院特任研究員の三浦真人さんです。
今回はZoomで、13:00~17:00までの時間参加しました。
以下は私の備忘録のノートです。
■第1部ピンホールカメラ模型
命題:ピンホールカメラ模型は射影空間における射影に他ならない。(Goal)
K=R(実数) or C(複素数)を数の集合とする。(体)
●有理写像・・・代数幾何で扱う代数的な写像。
まず代数的な関数とは四則演算を使ってかけるものを考える。以下に限る。
(1)多項式関数・・・足し算、掛け算、引き算が書けるK->Kの写像。(環)
(2)有理関数・・・・・多項式関数に加え、割り算もできる。分母が0の場合は定義できない。(体)
※代数的ではない関数例・・・解析関数(収束冪級数でかける関数)
次に多変数の代数関数を考えてみる。(K^n:n次元の数ベクトル空間)
有理写像は、K^n -> K^mの代数的関数のことを言う。
もちろん各要素の分母が0の場合は定義できない。
●ピンホールカメラ模型
3次元の空間を2次元に写し取る物をカメラと一般に呼んでいる。
ピンホールカメラは暗室の空間に穴をあけて、穴を通して入ってきた画像をスクリーンに
写し取る仕掛け。よってスクリーンの映像は反転して逆になる。
つまりピンホールカメラは、R^3 (x,y,z) -> R^2 (x/z, y/z)の有理写像でになっている。
※1 点の行先のみ(座標)を見ている。(明るさ、色は考えていない)
※2 前も後ろも移っている。陰に隠れるものも写ると考える。
つまりまずは純粋な有理写像だけを考える。
そこでの奇妙な現象、例えば平行線は遠くの先で交わって見える(消失点がある)。
3次元空間の写真上のどの点も消失点になっている。
この消失点は無限遠点なのか。。。
●射影空間
K上のn次元射影空間を考える。これはK^(n+1)の「方向」(1次元部分空間)の集合となっている。
これは、n+1個の数の比となっている。(斉次座標)
[a0 : ・・・・ : an] = [λa0 : ・・・・ : λan](λは0ではない)(ただしゼロだけの比は除く)
0次元の射影空間は、1点を表す。
P^n = K^n ⋃ P^(n-1)という交差のない合併で書ける。
で、K^nは0ではないという仮定から、(a0/an, ・・・, a(n-1)/an)と書ける。
定義: P^nにおいて同次多項式の共通零点として定まる図形のうち既約なものを(射影)代数多様体という。
●有理写像(射影空間版)
有理写像 P^n -> P^mは、k次の同時多項式を使って、ベクトルxからm次の多項式ベクトルの比として書けるもの。
※定義できない点もある。
●ピンホールカメラ模型(射影空間版)
P^3 -> P^2への有理写像である。
K^3 :(x,y,z) -> P^3 [x:y:z:1] => P^2: [x,y,z] -> K^2 : [x/z, y/z]
定義されないのは、[0:0:0:1]という1点だけ(カメラの中心)
定義:射影空間における射影とは、P^n -> P^m (m < n)の写像でベクトルxからAxへの変換で書かれるものとなる。
■第2部 n次元形状の再構成問題
複数枚の写真と手がかりから3次元の物体を再構成したい。(出発点)
ここから射影再構成 -> アフィン再構成 -> 計量再構成 -> より高次な情報の再構成(材質、運動)
と話が流れていく。
●幾何学とは何か
エルランゲン・プログラムの思想(クライン)。
「幾何学とは、空間Xと対称性の群Gの組(X,G)に対して不変な性質を調べる学問である」
例:
Euclid空間とEuclid合同変換群(平行移動と回転)。不変量として長さ、角度、体積など。。
●再構成問題における空間のモデル
P^n:射影空間に付加構造を考える。
H⊂P^n : 無限遠超平面(例えば、x_n=0)
Q⊂H : 絶対2次超曲面(例えばx_0^2 + ・・・ + x_n^2 = 0)
①射影空間(P^n, PGL(n+1, K))
PGL(n+1, K)は射影変換群(P^n -> P^n) [ベクトルx] -> [Ax] 全単射。
不変量は、図形の交わり方、接し方、穴の数(位相不変量)などが考えられる。
②アフィン空間(K^n, Aff(n,K))
Aff(n,K)はアフィン変換群(K^nの平行移動と一般線形変換)。
これがP^nの射影変換でH⊂P^nを保つものと同等である。
不変量は、平行性、体積の比、重心などが考えられる。
③ワイル空間(K^n, Sim(n,K))
Sim(n,K)は相似変換群。(K^nの平行移動と回転、拡大、縮小もOK)
P^nの射影変換でQ⊂P^nを保つもの。(Hも保つ。)
不変量は、長さの比、角度などが考えられる。
※K=Cで再構成できるとしたら、K=Rでも再構成できる。
※K=Cを考える意味は、交差のロバストネス(ベズーの定理に関連)がある。
※複素射影空間の解析的部分空間は代数多様体になる(Chowの定理、GAGAの定理)。
■第3部ピンホールカメラ模型の再論
ピンホールカメラは、φ:P^3 -> P^2のグラフと考えられる。
●トーリック多様体
T^n = (K^x)^n をn次元トーラスとする。
これはn個の0でない数の組のベクトルの集合である。
ベクトルsとtがあったら、それぞれのベクトル要素の掛け算が定義される。
またベクトルの逆変換もある。単位ベクトルもある。つまり群となる。
(脱線話として、群は対称性を扱うので、幾何学的に近い。)
ここで、T^n -> P^N (N >> n) の単射で、ベクトルtから[P0(t):・・・:PN(t)]への変換を考える。
各要素は(係数1)の単項式t1^a1・・・tn^anで、各ベキを取ったベクトルa=(a1,・・・an)を格子点とする。
この変換の像の閉包をn次元(射影)トーリック多様体と呼ぶ。
R^nのN+1個の格子点がトーリック多様体を記述する。(ザリスキー位相と関係?)
凸多面体は△。
技術的な過程:
△の内部の格子点は全て単項式に使われているものとする。=>正規性。
△に付随するトーリック多様体をP△⊂P^Nと書く。(N=|△∩Z^n|)
●射影空間
P^1 ⊃ R^1 ⊃ T^1は、[x:1] <- x=t <- t≠0となる。
●射影空間の直積
例:P^1 × P^1 [x:y] ×[z:w] = [xz: xw: yz: yw]というP^3への変換。(Segre埋め込み)
●射影のグラフ
ピンホールカメラ P^2 [x:y:z] -> P^1 [x:y]のグラフを考える。
P^2 -> P^2 ×P^1 : [x: y: z] ->( [x: y: z], [x:y] )のグラフを考える。
カメラの中心は映らなかったP^2点を高次元で表現して集中した交点を分散させる
(爆発:ブローアップ)させる。爆発は有理写像となる。
爆発は代数多様体の特異点を解消するのに使われる。
解消することによって代数多様体の中で滑らかに扱うことができる。
このような操作を行うことでカメラ自身が映らない問題を解消することができる。
■第4部 多視点幾何学(multiple view geometory)における再構成問題
ピンホールカメラの組(φ1, φ2): P^3 -> P^2 ×P^2 のグラフ
●点対応とマルチビュー多様体
r個のカメラに対する点対応。
様々な角度のカメラのシルエットが得られる。このシルエットの点対応が分からなければ
意味がないので、それらの点対応が分かっているものとする。
元々の点からのr個の点写像を考えて、その像の閉包(写っていない点も含む)は
代数多様体になる。これをマルチビュー多様体という。
(トーリック多様体は多面体で見ることが出来る多様体だが、一般にはマルチビュー多様体
はトーリック多様体とは限らない。)
●射影再構成の手続き
まずは点対応を見つける。
マルチビュー多様体を特定する。
カメラを再構成する。(逆写像も分かる。ただし射影変換を除く。)
射影変換を除くの射影空間は区別できず、再構成の過程からは分からないから。
現実のアルゴリズムはこれは難しい。現実のアルゴリズムでは、
点対応から部分空間対応を見つけ、"マルチフォーカルテンソル"を特定し、
カメラを再構成する。これは前者の方式と1:1であることが知られている。
ただしカメラが2台ある場合にはカメラとカメラを結ぶ線分上で動いているものは
区別できず特異点となる。(本来は1点に潰れていなければならない。)
この特異点の爆発により解消させる。この罰初による特異点解消は2通りしかない。
この2つのトーリック多様体は同型ではない。
一つは射影のグラフにはならない。よってもう一つを使う。
●射影再構成定理
一般的なr個の射影に対して射影構成は例外を除いて一意的に決まる。
例外とは、①次元が低い②画像が全て一次元のときに限る。
■所感
最初はカメラと代数幾何学ってどう繋がるのかなあって思いましたが、
その間に深い数学的理論が広がっていんだなあって少しびっくりしました。
勉強不足でトーリック多様体の処は少し理解が足りず、深く理解に至りませんでした。
三浦さんの手書きの板書は綺麗で、説明も丁寧でした。
どうもありがとうございました!