情報数学 II (2000 年度後期, 情報電子 3 年)


目次


各周期関数による音声データ

以下の各音声データは、基本的な周期関数である三角波、ノコギリ波、 方形波を用いて、特定の音声データを作成したものです。

そして、そのグラフは、それらの音声の先頭部分 (0.01 秒間) の部分 を表示したものです。赤い曲線で書かれているのが元となる周期関数で、 実際の音声データファイル (WAV format, サンプリング周波数 22050Hz, 16bit 量子化) には、四角で表されている点のデータのみが納められて います。

聞き比べてみてください。

  1. 三角波
    三角波による音声データ (WAV 176444Byte: 4 秒)
    三角波のグラフ (0.01 秒間)
  2. ノコギリ波
    ノコギリ波による音声データ (WAV 176444Byte: 4 秒)
    ノコギリ波のグラフ (0.01 秒間)
  3. 方形波
    方形波による音声データ (WAV 176444Byte: 4 秒)
    方形波のグラフ (0.01 秒間)
(12/08 2000)
目次に戻る

フーリエ級数の収束の様子とギブス現象

講義中に紹介した、ノコギリ波、方形波に対するフーリエ級数のグラフを 紹介します。

  1. ノコギリ波

    ノコギリ波に対するフーリエ級数は

    ノコギリ波のフーリエ級数の数式
    でした。このフーリエ級数の最初の N 個の和のグラフを、 ノコギリ波のグラフと重ねたものを以下に紹介します。

    フーリエ級数が、徐々にノコギリ波に近づいていく様子が見えますが、 特徴的なのは、不連続点の近くではグラフの振動が大きくなり、 N を大きくなるとそれは徐々に不連続点の方に寄りますが、 一定の大きさの誤差であり続ける、ということです。 これがギブス現象と呼ばれる現象です。 この誤差は両側でそれぞれ段差の約 9% (=0.0894898...) になることが 知られています。

    1. ノコギリ波と、そのフーリエ級数の部分和 (N=1,2,3,4)
      ノコギリ波のフーリエ級数の部分和 (N=1,2,3,4)
    2. ノコギリ波と、そのフーリエ級数の部分和 (N=5)
      ノコギリ波のフーリエ級数の部分和 (N=5)
    3. ノコギリ波と、そのフーリエ級数の部分和 (N=20)
      ノコギリ波のフーリエ級数の部分和 (N=20)
    4. ノコギリ波と、そのフーリエ級数の部分和 (N=100)
      ノコギリ波のフーリエ級数の部分和 (N=100)
  2. 方形波

    方形波に対するフーリエ級数は

    方形波のフーリエ級数の数式
    でした。このフーリエ級数の最初の M 個の和のグラフを、 方形波のグラフと重ねたものを以下に紹介します。

    1. 方形波と、そのフーリエ級数の部分和 (M=1,2,3,4)
      方形波のフーリエ級数の部分和 (M=1,2,3,4)
    2. 方形波と、そのフーリエ級数の部分和 (M=5)
      方形波のフーリエ級数の部分和 (M=5)
    3. 方形波と、そのフーリエ級数の部分和 (M=20)
      方形波のフーリエ級数の部分和 (M=20)
    4. 方形波と、そのフーリエ級数の部分和 (M=100)
      方形波のフーリエ級数の部分和 (M=100)

さて、三角波、ノコギリ波、方形波の音はかなり違った音であることは 前に紹介しましたが、 例えばノコギリ波に対して、それをフーリエ級数の部分和で徐々に近似 していくと、グラフは三角波から徐々にノコギリ波に近づいていきますが、 音としても三角波の音からノコギリ波の音に近づいていくでしょうか。 その途中の音はどんな音になると思いますか。

(12/17 2000)
目次に戻る

コワルスキーの実験

これは直接講義の内容とは関係ありませんが、ついでに作った音声データです。 元ネタは安野光雅さんの「算私語録」(朝日文庫) の 341 です。

例えば音がテープに録音されているとして、その先頭の位置を 0, 最後 の位置を 1 とします。1 から 0 に再生すれば、よくある逆回しになります。
それを、全体を 2 等分して、0.5 から 0, 1 から 0.5 と続けて再生すると、 前半分と後ろ半分は相変わらず逆回しのままですが、若干音の位置は 元の位置に近くなります。
さらに 4 等分して、0.25 から 0, 0.5 から 0.25, 0.75 から 0.5, 1 から 0.75 とするとそれぞれは相変わらず逆回しなのですが、 徐々に音が元の位置に戻って来て、段々元の音に近付いて行きます。
これを延々繰り返したらどうなるか、というのがそのお話です。 で、そこにはパリ在住のピョートル・コワルスキー (Piotr Kowalski) という人がそれを行った、と書いてあります。

デジタルサンプリングされた音声データだと、何回かやると完全に 元のものと同じになってしまうので、本当はアナログデータでやらないと 面白味がないのですが、取りあえずそれをやってみたのが下のデータです。

元の音源は、音声データをフリーで公開している こえうぇぶ の音声データの 一部分、及びそれらをつなげたものを使用しています。

最初に聞こえるのが単なる逆回し、それを徐々に 2 分割、4 分割、 としていって、最後に聞こえるもの (65536 分割) が元のデータと 同じものです。

ただ難点は、元のデータが透明すぎて (特に母音だけの方)、最初のものが 全然逆回しに聞こえないことです (^^;

目次に戻る

ルジャンドル関数等のグラフ

補講で紹介した、三角波以外の正規直交系のグラフを紹介します。

  1. ルジャンドル多項式

    まずは

    ルジャンドル多項式の定義式
    のグラフです。
    1. ルジャンドル多項式のグラフ (n=0,1,2,3,4,5)
      ルジャンドル多項式のグラフ (n=0~5)
    2. ルジャンドル多項式のグラフ (n=10,15)
      ルジャンドル多項式のグラフ (n=10,15)
    グラフを見ても分かりますが、ルジャンドル多項式の全ての零点 (零になる x の値) は -1<x<1 の範囲にあります。 n が増えると、この範囲で段々しわが増えていきます。

    なお、ルジャンドル多項式は、次のような漸化式で計算することも できます。

    ルジャンドル多項式の漸化式
    コンピュータ等で計算する場合はこちらの方が実用的でしょう。 しかし、再帰的定義を使うと、大きい n に対してはあまり実用的では なくなりますので、再帰を使わないようにする必要があります。

    ルジャンドル多項式は次のように正規化されます。

    正規化したルジャンドル関数の式
    この関数のグラフを紹介します。
    1. 正規化されたルジャンドル関数のグラフ (n=0,1,2,3,4,5)
      正規化されたルジャンドル関数のグラフ (n=0~5)
    2. 正規化されたルジャンドル関数のグラフ (n=10,15)
      正規化されたルジャンドル関数のグラフ (n=10,15)
  2. エルミート多項式

    次は

    エルミート多項式の定義式
    です。漸化式は
    エルミート多項式の漸化式
    であり、次のようなものが正規直交系になります。
    正規化したエルミート関数の式
    この正規直交系のグラフです。
    1. 正規化されたエルミート関数のグラフ (n=0,1,2,3,4,5)
      正規化されたエルミート関数のグラフ (n=0~5)
    2. 正規化されたエルミート関数のグラフ (n=10,15)
      正規化されたエルミート関数のグラフ (n=10,15)
  3. ラゲール多項式

    最後は

    ラゲール多項式の定義式
    です。漸化式は
    ラゲール多項式の漸化式
    であり、次のようなものが正規直交系になります。
    正規化したラゲール関数の式
    この正規直交系のグラフです。
    1. 正規化されたラゲール関数のグラフ (n=0,1,2,3,4,5)
      正規化されたラゲール関数のグラフ (n=0~5)
    2. 正規化されたラゲール関数のグラフ (n=10,15)
      正規化されたラゲール関数のグラフ (n=10,15)

いずれの正規直交系も、n が増える度に一つずつしわが増えるような関数系に なっていることがわかります。そしてエルミートやラゲール関数の場合には、 そのしわが段々全体に広がって行きます。 逆にいうと、関数系の完全性のためには、そういうしわが必要だということ になるのでしょうか。 三角関数系の場合も n が増えると段々しわが増えていき、周波数が増して いきますが、丁度それに対応します。

なお、数学辞典によると、ラゲール多項式は 0<x<∞ での広義積分の値の 数値計算で使われ、エルミート多項式は統計学でも使われるそうです。 ルジャンドル関数は、波動方程式やラプラス方程式と呼ばれる重要な方程式の 固有関数を数式であらわすことなどに使われます。

(02/20 2001)
目次に戻る

ワイヤストラスの関数

ついでに、フーリエ級数の例としてワイヤストラスの関数を紹介します。

ワイヤストラス (K.T.W.Weierstrass 1815-1897 独) は「厳密の権化」、 「近代解析学の父」と呼ばれたほど、解析学の色々な分野の厳密的な 仕事に関わった数学者ですが、次のような関数の例を構成しています。

連続だが、すべての点で微分可能でない関数が存在する
「連続」はグラフがつながっていることを意味し、「微分可能でない」は グラフに接線が引けないこと、つまりグラフがとがったりしていることを 意味しています。 例えば、絶対値関数 y=|x| は連続ですが、x=0 では微分可能ではありません。
絶対値関数 y=|x|
また、例えば次のような関数 (ディリクレの関数と呼ばれることもあります)
ディリクレの関数式
はすべての点でとがっているようですが、これは連続ではありません。

普通の「連続」な関数は、「微分可能」でない点は有限個しかありません。 しかし、ワイヤストラスは全ての点でグラフがとがっていて、かつ連続で あるような例を、フーリエ級数の形で与えました。

ワイヤストラスの関数式
a=1/2, m=13 のとき、この級数の第 N 部分和 (n=1 から n=N までの和) のグラフは次のようになります。
  1. ワイヤストラスの関数 (N=1)
    ワイヤストラスの関数 (N=1)
  2. ワイヤストラスの関数 (N=1,2)
    ワイヤストラスの関数 (N=1,2)
  3. ワイヤストラスの関数 (N=1,2,3)
    ワイヤストラスの関数 (N=1,2,3)
N が増えて行くと、グラフの大まかな形があまり変わらずに、どんどん小さい しわ (とげ) がついていくことがなんとなく分かると思います。 結局、この細かいとげが無数につくので接線がない、ということになります。

逆に考えると、フーリエ級数は、こんなとんでもない関数でも展開できて しまうほど、表現力、自由度が豊かだ、ということになります。 テイラー展開が無限回微分可能な関数でないと使えないのに比べると、 これは大きなメリットだといえるでしょう。 また、このグラフは、いわゆる "フラクタル" の例にもなっています。

なお、ワイヤストラスは 40 才までは中学校の先生をしていて、その後 大学の研究職についた人で、一流の数学者としては珍しく 大器晩成な人としても知られています。

(02/20 2001; 08/19 2008 修正)

追加ですが、ついでに上のグラフの N=1, N=2, N=3 のグラフを tbl2snd を用いて音にしてみました (いずれもサンプリング周波数 11025Hz, 16bit linear WAV file)。

音の震えのようなものが徐々に増えていく感じが聞こえると思います。

(12/28 2009)
目次に戻る

「あ」の音、「「あ」の音」の音、...

妙なタイトルですが、少し変なことを考えつきましたので紹介します。

このページの上の方に、単純な音とそのグラフを紹介していますが、 具体的な音である、「あ」の音のグラフを紹介しましょう。

とげのようなもので構成されていて、グラフの様子がよくわかりませんが、 そのとげ一つ一つが基本周期部分です。 実際の音の場合は、 全く同じ形の基本周期がずっと繰り返されるわけではありませんが、 音質のあまり変わらない部分ではだいたい似た形の関数が繰り返されています。 上のグラフの一部を拡大して見てみます。

れいしうさんのグラフの方がきれいに同じ形のグラフが並んでいますが、 それは、れいしうさんの方が声が一定できれいな声であることと、 れいしうさんの声の方が高いことに原因があります。 同じ時間の「あ」でも、高い音の場合は周波数が高い、 すなわち基本波形の繰り返しが多く (れいしうさんのは 0.05 秒間で約 12 回、わたしのは 0.06秒間で約 9 回)、 声のように出だしから最後までの間に音が変化するものだと、 低い声の場合は少ない繰り返しでその変化を行わなければいけません。 よって、低い声の場合は同じ波形の繰り返しはあまり続きません。 (しかし、だからといって、低い声よりも高い声の方が聞きやすいことになる、 のかどうかは私にはわかりません)

もう少し拡大してその基本波形のグラフを見てみます。 基本波形 2 つ分くらいのグラフを紹介します。

実際には音のデジタルデータには、 グラフの青い点のところだけのデータが保存されていて (このデータの場合は 1/8000 秒毎)、 このグラフはその青い点を折れ線で結んでいるだけです。

さて、上の音は「「あ」の音」ですし、 そのグラフは「「あ」の音」のグラフなわけですが、 私はグラフを音声化するソフトを持っています。 それはグラフの高低を音程の高低で表現するソフトです。

これを使うと、このグラフを音にすることができます。 つまり「「あ」の音」の音です。 実際に、上の基本波形 2 つ分のデータを音にしたものが以下のデータです。

ということは、同じことをさらに繰り返せば、 「「「あ」の音」の音」の音、「「「「あ」の音」の音」の音」の音、 とかできるのですが、 実は、「「「あ」の音」の音」の音より先はあまりおもしろくありません。

「「あ」の音」の音を聞いてみればわかるのですが、 これは単純な音、つまり三角波 (正弦波) を元にして作られています。 上のグラフを音声化するツールは、 グラフの高いところでは三角関数の周期を短くして高い音を作り (高さや波形は変えずに横幅だけ短くする)、 グラフの低いところでは逆に周期を長くして低い音を作っています。

つまり、「「「あ」の音」の音」のグラフは 三角関数のグラフと見た目がほとんど変わらず、 一番低いところと高いところの同じところを振動しているだけで、 その振動が速くなったり遅くなったりしているだけです。 ということは、「「「あ」の音」の音」の音は、 「三角関数のグラフ」の音 ( gnuplot グラフの音声化ツール tbl2snd のサンプル参照) とほとんど同じになってしまいます。
(04/04 2006)

目次に戻る

DTMF 信号 (プッシュホン信号)

先日、TV 番組の「探偵ナイトスクープ」で、 「名探偵コナン」に出てきた DTMF 信号を人間の声で本当に再現できるか、 ということをやっていました。 DTMF 信号というのは、 プッシュホンの電話で電話の番号一つ一つに割り当てられている音で、 プッシュホンは実際にその音を送信することで番号を送っているのだそうです。 実際には DTMF は、以下のような 2 種類の音の「和音」として 構成されているようです。

低音\高音 (Hz) 1209 1336 1477 1633
697123A
770456B
852789C
9410D

A,B,C,D はよくわかりませんが、 このような 2 種類の音の和音は、 「yomi」 の付属ツールである sndhz と sndmix, wavconn で簡単に作成ができます。 例えば、以下の通りです。

sndhz -c1 -wav -v0 440 200 > null.wav (0.2 秒の無音)
sndhz -c1 -wav 697 800 > tmp.wav (0.8 秒、697Hz)
wavconn ./tmp.wav ./null.wav > 697.wav (それを連結した 1.0 秒データ)
sndhz -c1 -wav 1209 800 > tmp.wav
wavconn ./tmp.wav ./null.wav > 1209.wav (同様の 1209Hz, 1.0 秒データ)
sndmix 697.wav 1209.wav > dtmf-1.wav (和音データ)
このようにして作成した音声データを以下に置きます (0.8 秒の音声 + 0.2 秒の無音、モノラル、WAV, 22094 byte)。

dtmf-0.wav (0), dtmf-1.wav (1), dtmf-2.wav (2), dtmf-3.wav (3), dtmf-4.wav (4),
dtmf-5.wav (5), dtmf-6.wav (6), dtmf-7.wav (7), dtmf-8.wav (8), dtmf-9.wav (9),
dtmf-A.wav (A), dtmf-B.wav (B), dtmf-C.wav (C), dtmf-D.wav (D),
dtmf-ast.wav (*), dtmf-sha.wav (#)

実際に、この音声を PC で再生したものを手元の電話の通話口に聞かせてみたら、 本当につながりました。 ただ、ノイズの関係か、タイミングの問題か、 高低の音のバランスの関係かはわかりませんが、 実際につながるのは 3 回に 1 回程度のようでした。
(06/12 2009)

目次に戻る

種々の音律

「ドレミファソラシド」の音階には、 それぞれの音に対応した周波数が割り当てられているのですが、 実はその割り当て方 (=音律) にはいくつかの方式があります。

現在日常的によく使われているのは「平均律」と呼ばれるものですが、 その他にも「ピタゴラス音律」「純正律」「中全律」などもあるようです。 詳しくは、例えば以下を参照してください。

音律の仕組みを最初に発見したのは、 三平方の定理でも有名なピタゴラスであるとされていて、 ピタゴラスは弦を弾いて音を出す場合、 弦の長さを半分にすると音が 1 オクターブ (半音 12 個分) 上がり、 1/3 にすると 1 オクターブと完全 5 度 (半音 12+7 個分、ドと 1 オクターブ上のソの関係) 上がることを発見しました。 これは周波数で言えば、周波数を 2 倍にすると 1 オクターブ、 3 倍にすると 1 オクターブと完全 5 度上がることを意味します。 この、「3 倍することで 5 度上げる」「半分にすることで 1 オクターブを下げる] という作業の組み合わせですべての音階を作成したのが「ピタゴラス音律」です。

ピタゴラス音律の場合の「ド、レ、ミ、ファ、ソ、ラ、シ、ド」の周波数の比は 以下のようになります。

1, 9/8, 81/64, 4/3, 3/2, 27/16, 243/128, 2
ただし、ファの音だけは、3n/2m の形をしていませんが、 それは分子、分母が大きくなりすぎないように、 上のドから逆に 5 度下げることでファを得ているために 4/3 となっています。

しかし、和音は簡単な整数比の音の方がまざりやすいのですが、 ピタゴラス音律はミ、ラ、シの周波数の分母が大きいため、 それを含む和音が綺麗にまざり合いにくい、という欠点があります。 それを改良したのが「純正律」で、それは以下のような比率になっています。

1, 9/8, 5/4, 4/3, 3/2, 5/3, 15/8, 2
しかし、純正律は転調すると比が合わなくなりますので、 楽譜の調に合わせて調律を変えなければいけませんし、 曲中の転調には対応できません。 そこで作られたのが「平均律」で、 これは半音間隔をすべて等分にしたものです:
1, a2, a4, a5, a7, a9, a11, 2
(a=21/12)
これはいずれも整数比ではないので、 和音には必ずうなりが含まれることになりますが、 例えば調を簡単に変更できないピアノなどは平均律に調律されています。 この他にも、前掲書によれば「中全律」なるものもあるようです:
1, b2/2, 5/4, 2/b, b, b3/2, b5/4, 2
(b=51/4)
以上は長音階ですが、短音階 (自然短音階:「ラ、シ、ド、レ、ミ、ファ、ソ、ラ」) では以下のようになります。

これを小数で書くと以下のようになります。

長音階
ピタゴラス純正律平均律中全律
1.000000 1.000000 1.000000 1.000000
1.125000 1.125000 1.122462 1.118034
1.265625 1.250000 1.259921 1.250000
ファ 1.333333 1.333333 1.334840 1.337481
1.500000 1.500000 1.498307 1.495349
1.687500 1.666667 1.681793 1.671851
1.898438 1.875000 1.887749 1.869186
2.000000 2.000000 2.000000 2.000000
短音階
ピタゴラス純正律平均律中全律
1.000000 1.000000 1.000000 1.000000
1.125000 1.125000 1.122462 1.118034
1.185185 1.200000 1.189207 1.196279
1.333333 1.333333 1.334840 1.337481
1.500000 1.500000 1.498307 1.495349
ファ 1.580247 1.600000 1.587401 1.600000
1.777778 1.800000 1.781797 1.788854
2.000000 2.000000 2.000000 2.000000

普通に音階を聞くだけではあまり違いがわからないと思いますが、 重ねたり、和音にするとうなりによってその違いなどがわかります。 そのような音のサンプルを yomi のツールで作ってみましたので、 以下に紹介します。 いずれも WAV ファイル (サンプリング周波数 11025Hz) です。 なお、基音をド位 (262Hz) にしてハ長調、イ短調の音階にすると、 下の方の音がやや低すぎて音が小さく聞こえるので、 基音をファ位 (349Hz) にしてヘ長調、ヘ短調にしてあります。

  1. 長音階ファイル (各音 2 秒ずつ)
  2. 短音階 (自然短音階) ファイル (各音 2 秒ずつ)
  3. 2 つの長音階を重ねたもの
  4. 2 つの短音階を重ねたもの
  5. すべての音階の周波数比率が異なるラとシの音を重ねたもの (各 5 秒)
  6. ドミソとドファラの和音 (各 5 秒)

同じ音を重ねたものは、違いがうなりとして聞こえるのでよくわかると思います。 うなりがゆるやかなほど音が近く、 うなりが早いほど音が離れていることを意味しています。

また、ドミソとドファラの和音は純正律が一番響きがよく、 後は多分ピタゴラス、中全律、平均律の順に響きが悪くなっているはずですが、 違いはわかるでしょうか。
(02/01 2010)

目次に戻る

位相のずれについて

楽器や声などの現実の音は、はっきりある音程に聞こえる音でも、 単音ではなくて複数の音の重ね合わせで作られていることが知られています。 特に、特定の音程が出せる楽器の場合は、 その重ね合わせは、その音程を基音として、 基本的にはその音のオクターブ上の音が順に重ね合わされています。

つまり、ある音にその音の丁度オクターブ上の音を重ねると、 それは「複数の音からなる和音」ではなく、 「音色のついた一つの音」として聞こえることになります。 重ね合わせる各音をどのような大きさにするかで、 その音の「音色」が決まるわけです。

なお、別な音程の音が重なれば「和音」になってしまうわけですが、 実際には楽器の音などは丁度オクターブ上の同じ音だけが重なっているわけではなく、 基音の 2 倍 (1 オクターブ上)、3 倍、4 倍 (2 オクターブ上)、5 倍、... といった周波数の音、いわゆる「倍音」が重なっています。 それは楽器の構造、音の出る仕組みからそのようになっています。

ところで、これに関して、ふと 「人間の耳はその音色に関して位相のずれを認識しているのか」 ということが気になりました。

例えば、ある周波数ωの単音 A sin(2πωt) (t は時刻、A は振幅) に対して、その 1 オクターブ上の音は

B sin(4πωt) + C cos(4πωt) = D sin(4πωt+θ) (D = (B2+C2)1/2)
の形で表されますが、この音は cos の成分のために元の音 A sin(2πωt) と位相がθだけずれています。 この場合、もちろん
A sin(2πωt) + D sin(4πωt+θ)
A sin(2πωt) + D sin(4πωt)
とはグラフは別なものになりますが、 人間の耳はこれを別の音として認識するのだろうか、 というのが私の疑問です。

人間の耳は、蝸牛によって音を周波数分解して認識しています。 ということは人間は位相のずれは理解せず、 上の 2 つを同じ音として聞いているのではないか、 というのが私の予想でした。 それで以下のようなデータを作って試してみました。

c1.wav は 1 ブロックが 1/21.12 周期なので、 10 ブロックのずらしでほぼ元の c1.wav の逆位相の音になります。 0 から 9 ブロックのずらしでだいぶ異なったグラフができると予想されます。 実際にそれによって作成した音声データと、 その重ね合わせ音声のグラフを以下に示します。

グラフを見ればわかりますが、音声データの形自体はだいぶ違います。 しかし、音声の方は音色の違いは全くないように聞こえます (少なくとも私には)。 つまり、音を重ね合わせるときは、 位相のずれは考えずに重ねても人間には同じに聞こえる、 逆に言えば人間は重ね合わされた音の位相のずれまでを認識しているわけではない、 ということになると思います。

よって、フーリエ変換して音声データから各周波数成分 (スペクトル) を取り出す場合、 sin(nx) の係数 an と cos(nx) の係数 bn を別々に評価することは意味がなく、 それらの自乗和の平方根 (いわゆる「パワースペクトル」)

An = (an2 + bn2)1/2
を取り出して評価すべきだということになるように思います。
(07/16 2010)

目次に戻る

分数音階

「種々の音律」 で色々な音階 (音律) を紹介しましたが、 そこで紹介している文献や、以下の本によれば、 現在標準的に使われている半音を、さらに半分にした 1/4 音 (「微分音」) という音程も存在します。

どんな風に聞こえるのか気になったので、その音階を作ってみました。 C (ド) から上のオクターブまでのすべての半音階 (12 + 1 音) と、 すべての微分音 (24 + 1 音) の上昇音階を以下に置きます (1ch, サンプリング周波数 11025Hz の WAV データ)。

微分音を入れると、音と音の音程の違いがかなり微妙になるので、 音階というよりは滑らかに上がっているようにも聞こえます。 上記の本には微分音を使った曲が紹介されているのですが、 どのように聞こえるのでしょうか。

なお、上の音階は平均律を元に、 公比 21/24 の等比数列の周波数の音を作成したのですが、 一般に 21/N の等比数列の周波数の音階は どのように聞こえるのかも少し気になりましたので、 同様に作ってみました。

通常の平均律の音階の音の周波数と同じ音を使うことになるのは、 2, 3, 4, 6, 12 等分の音階のみで、 2 等分は「ド (C0)、ファ♯ (F#0)、ド (C1)」、 3 等分は「ド (C0)、ミ (E0)、ソ♯ (G#0)、ド (C1)」、 4 等分は「ド (C0)、レ♯ (D#0)、ファ♯ (F#0)、ラ (A0)、ド (C1)」、 12 等分は通常の半音階となります。 しかし実際に聞いてみると、 意外に他の音階もそれなりに普通の音階のように聞こえなくもなく、 11 等分と 12 等分と 13 等分もあまり違いはわからないまま 音が一つ足りなかったり、一つ多かったりするように感じます。 平均律と純正律もそうですが、脳は少しの周波数の違いは許容して、 むしろ聞きなじみのある音だと認識しようとしているような気がします。

楽曲では、「短音階」や「長音階」、「四七抜き音階」 などが広く利用されていますが、 現代音楽では等間隔の半音階を対等に扱う「12 音階」を利用した 「十二音音楽」のようなものもあります。 とすると、上のような 12 音にこだわらない分数音階を利用した音楽も ありうるのかなと思いますが、 これらの音階を再現できる楽器はフレットのない弦楽器や トロンボーンのような楽器に限定されてしまいますし、 通常の音の位置と違う場所に手を合わせないといけないので、 もしそういう曲があったとしても 電子楽器以外での演奏は難しいかもしれません。
(02/26 2016)

追加です。上の分数音階のうち、7 等分の 8 音階 (seq-7.wav)は、 現在の長音階である「ド、レ、ミ、ファ、ソ、ラ、シ、ド」 の音階に、ある意味で音の数では対応しています。 実際、上の音階を聞いてみると、ややずれている音があるものの、 長音階に似ているように聞こえてしまいます。 特に最初の 3 音は普通の「ド、レ、ミ」のように聞こえます。 これを「等分音階」と呼んでみることにします。

実際には、 長音階ではミとファの間とシとドの間が他の間隔より狭く、 短音階ではレとミの間とソとラの間が他の間隔より狭くなっています。 等分音階ではすべての音の間隔が等分になっていますので、 例えば長音階と同じように聞こえる最初の 3 音でも、 すでに長音階よりは周波数が下がっていて、長音階のレ、ミは

ですが、等分音階の「レ」「ミ」、すなわち等分音階の 2 つ目、3 つ目の音は

となり、長音階とは多少ずれていることがわかります。 周波数をすべて上げてその差も見ると、以下のようになります。

音階 ファ
(1)長音階 261.6Hz 293.7Hz 329.6Hz 349.2Hz 392.0Hz 440.0Hz 493.9Hz 523.3Hz
(2)等分音階 261.6Hz 288.9Hz 318.9Hz 352.1Hz 388.8Hz 429.2Hz 473.9Hz 523.3Hz
(1)-(2) 0.0Hz 4.8Hz 10.7Hz -2.9Hz 3.2Hz 10.8Hz 20.0Hz 0.0Hz

等分音階を聞いて一番違和感を感じるのは「ファ」と「シ」だろうと思いますが、 「シ」は確かに一番ずれが大きいものの、 意外に「ファ」のずれはなく、 むしろ「ミ」や「ラ」の方が長音階とのずれはかなり大きくなっています。 音階として並べると前の音との相対的な違いを聞いてしまうので、 そのように感じるのだろうと思われます。

この 7 等分の「ドレミ」で、 簡単な音楽 (チューリップ、きらきら星) を作ってみました。 違いがわかるでしょうか。比較のために、長音階のもの、 および左右のチャンネルに結合したものを以下に置きます。

  1. チューリップ
  2. きらきら星

実は、いずれも一番違いが大きい「シ」の音が含まれていませんので、 等分音階でもそれほど違和感を感じないと思います。 結合するとはっきりうなりが聞こえますが意外に普通です。 これは、多分脳が多少補正をして、 聞きなじみのある音程だと認識しようとしているためではないかと思います。
(02/29 2016)

目次に戻る
作成日: 02/29 2016
竹野茂治@新潟工科大学 (shige@iee.niit.ac.jp)