notebook: コンピュータアルゴリズム第2: 講義案内

本講義ではコンピュータ・ソフトウェアの基礎を学びますが，より詳しく言うと「アルゴリズム」と呼ばれるものの基礎を学びます．

アルゴリズムとは?

アルゴリズムとは，計算機に何かをさせる手順を記述したもので，要するに，プログラムというのと同じことです．ニュアンスとしては，アルゴリズムは，明確に定められた問題に対するプログラムのことを言い，したがってこのプログラムは正しい・正しくない，というのが正確に議論できるようなプログラムのことをアルゴリズム言う，ということになっているようです．たとえば「整数の素因数分解をする」という問題は明確に定められているので，これを行うプログラムは「整数の素因数分解をするアルゴリズム」と呼ぶわけです．

一方たとえば，スクリーンセーバはプログラムには違いないでしょうが，そもそも何を持って「正しいスクリーンセーバ」というのかわかりませんから，スクリーンセーバのことを，プログラムとは読んでもアルゴリズムとは呼ばないのが普通です．もっともこの線引きも，「手書き文字認識」のような問題に当てはめると妥当かどうかよくわからなくなります．手書き文字認識も正解と不正解はどこかで曖昧になってきます．一方で，いくつもの「アルゴリズム」が提案されている問題でもあり，手書き文字認識をアルゴリズム研究の対象外というのも，おかしな話です．何か，少しでも難しいことを達成するプログラムに敬意を表して，アルゴリズムと呼んでいる，という程度に思っていてもよさそうです．いずれにせよ，ここでの主題ではないのであまり深入りするのはやめておきましょう．

中心極限定理によって確率を見つける方法

もうひとつのニュアンスの違いとしてはプログラムというと特定のプログラミング言語や，少なくとも計算機による実行というのが想定されているのに対し，アルゴリズムというのはもう少し計算機という実体や特定のプログラム言語の文法のようなものとは独立な，抽象的な概念である，という違いもあるようです．たとえば小学校のときに習った筆算での割り算は，プログラムの形では習いませんでしたが，要するに「この決められた手順に従うと，必ず答えが出る」という曖昧さのない手順という意味で，アルゴリズムと呼んでもよいものです．要するに，人間特有の，臨機応変で，なぜこのようなことを思いつくのかわからないけどなぜか解けてしまう，ということには一切期待しない「この手順(例: 筆算)で必ずこの問題(例: 割り算)は解ける」というような手順のことをアルゴリズムと呼ぶわけです．数学に出てきたガウスの消去法や，シュミットの直交化法のようなものも，アルゴリズムと呼んで差し支えないものでしょう．「ある問題はこの手順で必ず(個々の例題に対してなんら新しいひらめきを要することなく)解ける」ということをきちんと記述しようとすると，それがアルゴリズムということになります．

しかしそうは言ってもアルゴリズムを記述するにはそのためのわかりやすい表記が必要ですし，それには結局プログラムが一番便利で明確ということになります．というわけでさんざん御託を並べた挙句，「アルゴリズム＝プログラム」と考えても大して差し障りはない，というのが結論です．要するに，何か明確な問題を設定し，それを達成するプログラムを考えたり，そのプログラムが正しいことをできるだけ厳密に論証する，というのがアルゴリズムを学ぶということの第一歩です．

対象とする問題の例

もっとも初歩的な問題の例をあげておくと，

与えられたデータを大小関係の順に並べ替える
文字列から与えられた部分文字列を発見する(たとえばこの文章の中から「アルゴリズム」という文字列を発見する)．

などがあります．もう少し難しそうな問題の例としては，

必要な材料を構築し、それがどのように動作する加速度計

方程式 a1 x1 + ... + an xn = b を解く．ただし，ai と bは与えられた整数で，未知数 x1, ..., xn は 0または1の値をとる．解がなければないと言う．
与えれた整数を素因数分解する．
整数を係数とする多項式の整数解を見つける．なければないと言う．
将棋やオセロゲームの盤面が与えられて，必勝手があればそれを見つける．なければないと言う．

などがあります．これらも「明確に定義された問題」のひとつであることはすぐにわかるでしょう．

本講義の目的はアルゴリズムの基礎を学ぶことに主眼を置くので，具体的に取り上げるアルゴリズムは主に，最初にあげたような「初歩的な」ものが中心になります．そのようなアルゴリズムを取り上げて，それが正しいということを少し厳密に論証すること，アルゴリズムの記述を実際にプログラムとして実現して実行すること，などが最初の関門です．

計算量という概念

実は「正しいことの論証」以外にもうひとつ同じくらい基本的，かつ重要な概念があります．それはアルゴリズムの計算量という概念です．たとえば「与えられたデータを大小関係の順に並べ替える」という問題が計算機によって実行可能であるということは，誰が聞いてもほとんど当たり前のように思うことでしょう．しかしこのような自明と思えるような問題でも，工夫のないアルゴリズムではたちまち，実行時間が大きすぎて小さなデータしか処理できない，ということが置き得ます．授業でもそのようなことを実際に課題として体験してもらいます．速いアルゴリズムと遅いアルゴリズムでは処理時間に何千倍もの開きが出ます．それはつまり，大きなデータに対して実用上使えるアルゴリズムとそうでないアルゴリズムの差ということになります．整列の問題は歴史的にも，アルゴリズムの発明によって劇的な高速化が達成された問題のひとつです．似たような他の例としては，FFT (高速フーリエ変換)があります．

座標平面上のパスの最小距離を見つける方法

速いアルゴリズムを発明するというのは，個々の問題に対して新しいひらめきを要することですが，それ以前に基本として身につけておくべき概念が計算量という概念です．これは要するに，アルゴリズムが実行を開始して停止するまでに，どのくらい時間がかかるかというものです．もちろんそれは計算機によってもプログラミング言語によっても違います．そうかといって「やってみないと何もわからない」というのでは話になりません．ここでの目的は，良いアルゴリズムと悪いアルゴリズムの差を判定できるようになることであって，計算機やプログラミング言語の癖によってひっくり返ってしまうような微妙な差(現実的には微妙でないことも多いですが)を捕らえるのはあきらめています．そのようなアルゴリズム間の大きな差を，大雑把に比較するための，経験的，とはいっても数学的に厳密な，枠組みが「計算量」の概念です．大雑把とはいいながら，現実にアルゴリズムを設計する上で基本的で非常に有用な理論です．

易しい問題と難しい問題

アルゴリズムを学んだ結果，身に着けてほしい概念として重要なことの3つ目は，「世の中そうは言っても難しい問題だらけ」ということです．ここでいう難しい問題というのは「計算機にとって」という意味であって，人間が解法を思いつくのが難しい，というのとは違います．もちろん両者は結果的に重なる部分もありますが，ポイントは人間にとって難しいかどうかというような主観的な話ではないということです．難しい問題とはどういう問題で，それがどのように定式化されていて，そして一見簡単そうで実は難しいという数多くの問題を知ることが目標です．計算量について学ぶことはその第一歩です．

現在計算機によってできないことというのは枚挙に暇がありません．ロボットがよちよち二足歩行をしただけであれだけ騒がれるのですから，いかに計算機というものが未熟かがよくわかるというものです．ただ，そのような問題の難しさは計算機の本質的な限界によるものなのか，我々が安定した二足歩行の仕組みをよく知らないこと，つまり二足歩行を計算機に指導する方法を知らないこと，によるものなのかわかりません．同じような話としては，計算機による，人間が書いた文章(自然言語)の理解，自動翻訳，人間らしい自然な音声の合成，などの，いわゆる「人間っぽい処理の模倣」があります．これらは「計算機にとって絶対に難しい」といえるのかどうかにははっきりとはしません．我々人間がうまく教えるすべを知らない，何を教えていいかわからない，ということなのかもしれません．

一方そうではなく，計算機というものの本質的な限界を端的に示すような，「単純だが難しい問題」が数多く存在します．ここで難しいといっても二通りの意味があります．ひとつはアルゴリズムを使ってとくことが「絶対に不可能な問題」というものです．これは二足歩行や自然言語の理解などのように，「我々が人間の運動や脳の仕組みをもっとよく理解したらできるかもしれない」というようなものではなく，「必ず正しい答えを出すアルゴリズムを作ることは決してできないことが証明されている」という問題です．それを証明するにはアルゴリズムというものの範疇を正しく定義する必要があり，授業で，それらがどう定式化され，証明されているのかを学んでいただきたい．

もうひとつは，解けるには解けるが計算時間がかかりすぎる，というものです．ただご存知のとおり，あることにかかる計算時間というもの自体が日進月歩，ものすごい勢いで進化しています．10年前に「時間がかかりすぎた」計算が今はたちどころに終わるというような例は枚挙に暇がありません．ここでも，アルゴリズムの理論的な枠組みで捕らえられるのは，計算機の10年，いや， 100年の進歩でもひっくり返らないような，圧倒的に「時間のかかりすぎる時間」です．それを捕らえるのに，上で述べた計算量の概念が再び有効になります．

現時点では3つ目のカテゴリとして，「解けるには解けるが計算時間がかかりすぎる... と現時点では強く信じられている」という問題(NP完全問題)があります．これは，現時点で誰も，「効率よく」解くアルゴリズムを発見しておらず，おそらくそのようなものは存在しないだろうと誰もが信じているがその証明は誰も成功していない，という問題です．そして，少し残念なこととして，少し気の利いた高度な問題は，非常に多くがこのNP完全問題である，ということを学びます．一言で言えば，計算機によって，非常に大きなデータでも効率よく解ける問題，というのが意外と限られている，ということがわかるわけです．たとえば上で述べた問題のうちのひとつ: 「a1 x1 + ... + an xn = b を解く」はそのような問題のひとつです．これを，変数の数，つまり n を非常に大きくしても，どんな係数であっても効率的に解けるアルゴリズムは世の中の誰も知らず，実際に存在しないと信じられています．すぐにわかるとおり，この問題を「解く」こと自身は自明といってよいほど簡単です(2^nとおりの可能性を試せばよい)．ところがnが大きくなると全通り試すのは絶望的に時間がかかります．こんな一見簡単な問題ですらこんな状態ですから，もっとややこしい組み合わせの問題は多くがこの範疇に属するのではないかと想像がつきます．そのような感覚を実例とともに養ってもらうことも目標です．

These are our most popular posts:

グレブナー基底

当HPがいつもお世話になっている Azさんもパソコンを駆使され、グレブナー基底を活用された計算を多数行い、我々にいろいろな ... 整数環 Z を係数に持つ一変数の多項式環 Z［x］において、多項式 G（x）＝2x＋4 が生成するイデアルを H と置くとき、多項式 ... read more

紀要｜学習院高等科

また Hermitian 多項式を一般化した，Stichtenoth 多項式が存在することを例で示している． ... 前回（紀要3号）の続編であが，ここでも｢高次方程式特に3次方程式｣，｢因数定理｣，｢方程式z n－1＝0 の解と解の複素数平面上への表示｣の知識と理解が必要である． ... 四次以下の方程式は，係数から出発し，それらに四則演算とベキ根をとる算法( n√ )とを行って，解をすべて表わすことができる（解の公式） .... 本論考においてわれわれは，第2論文以降どのような議論が第1論文の基礎の上に築かれたのかを追究していく． read more

ジョルダン標準形3 - 数理ファイナンス[MathematicalFinance]

前々項の準備ではべき零行列について触れたが、続いて行列の多項式である。 ... スカラーを要素とするn+1個のn次正方行列Aiを係数として、ひとつの変数xのn次多項式を作ることも考えられる。 ... 何故ならこの後xに行列Aを代入するからである。 ... もうひとつベクトルが必要となるので、前項でやった手続きを進もう。 ... われわれがとりあつかってきたスカラーを要素とした行列は変数xのべき数をつねに0とした多項式と考えれば、xの多項式を要素とした行列はより一般的な議論が展開できる土壌であることは十分予想 ... read more

曲線あてはめ - Wikipedia

現実の実験データは直線的ではないことが多いため散布図、近似曲線を求める必要性は極めて高いが、統計学の教科書が数多くある中、理論的な解説をした成書が殆どない分野である。 ... 我々が考えるべき問題は、、(1-1)あるいは(1-1)の関数Sの極値問題に他ならない。一般に、 ... 多項式曲線を連結したスプライン曲線が滑らかな曲線となるには、連結する両方の多項式曲線で端末条件を同一にする必要がある。 ... ここで、なぜ近似ではなく多項式の次数を高くして正確に当てはめようとしないのかという疑問が生じる。 read more

notebook

2012年5月8日火曜日

コンピュータアルゴリズム第2: 講義案内

アルゴリズムとは?

対象とする問題の例

計算量という概念

易しい問題と難しい問題

These are our most popular posts:

グレブナー基底

紀要｜学習院高等科

ジョルダン標準形3 - 数理ファイナンス[MathematicalFinance]

曲線あてはめ - Wikipedia

0 件のコメント:

コメントを投稿

2012年5月8日火曜日

コンピュータアルゴリズム第2: 講義案内

アルゴリズムとは?

対象とする問題の例

計算量という概念

易しい問題と難しい問題

These are our most popular posts:

グレブナー基底

紀要 ｜ 学習院高等科

ジョルダン標準形3 - 数理ファイナンス[MathematicalFinance]

曲線あてはめ - Wikipedia

0 件のコメント:

コメントを投稿

紀要｜学習院高等科