4 実際のホルンでの実験

金管楽器の自然倍音は、ほぼ開管の周波数 (2) に なるが、実際には完全に一致するわけではない。 それがどれくらい近いのか、また逆にどれくらいずれているのかを、 実際の楽器の音で確認する実験を行った。

音は、F 管のシングルホルンで、バルブを使用しない 自然倍音列 $f^o_1\sim f^o_{13}$ を、 各 10 秒位演奏し、その各音源から出だし付近を除いた 安定している 3 秒程度の部分を使用した。

なお、ホルンでの録音には YAMAHA サイレントブラスのピックアップミュートを 使用したので、実際にはそのミュートの影響によって ミュートのない状態とは若干音高が違っている可能性はある。 また、演奏者の技量は高くはなく、中高の部活の学生レベルである。

そしてその音源 (WAV フォーマット、2 チャンネル、サンプリング 周波数 44100Hz) の安定部分を FFT (高速離散フーリエ変換) にかけて 周波数解析した。 FFT は $N=2^{17}=131072$ 分割をしているので、 周波数分解能は 44100/131072 = 0.34Hz 程度である。

例えば、$f^o_1$ に対するホルンの実音を FFT にかけた結果の 周波数グラフは図 1 のようになる。 なお、すべてのグラフ、およびこれに使用した音声データは、 Web ページ [2] の方にあげる予定である。

図 1: $f^o_1$ のホルンの実音の周波数グラフ
\includegraphics[width=0.7\textwidth]{horn/fft-1-17.eps}

少しグラフの見方について説明する。 横軸は各音の周波数で、7 次倍音まで含まれる程度の範囲に取っている。

縦軸は、FFT の結果のパワースペクトル $s_p$ であるが、 その最大値を 1 としたグラフにしている。 なお、$s_p$ は、通常は FFT の結果の複素数値 $s_r + is_i$ に対して、 その大きさ

  $\displaystyle
s_p = \vert s_r + is_i\vert = \sqrt{s_r^2+s_i^2}$ (5)
とするが、今回使用した音声データは 2 チャンネルのステレオデータ (本来はモノラルでよい) なので、左右のパワースペクトル
  $\displaystyle
s^l_p = \sqrt{(s^l_r)^2+(s^l_i)^2},
\hspace{1zw}s^r_p = \sqrt{(s^r_r)^2+(s^r_i)^2}$ (6)
に対して、さらにそれらの自乗和の平方根
  $\displaystyle
s_p = \sqrt{(s^l_p)^2+(s^r_p)^2}
= \sqrt{(s^l_r)^2+(s^l_i)^2 + (s^r_r)^2+(s^r_i)^2} $ (7)
としたが、$s^l_p$$s^r_p$ の平均 $s_p'$、 あるいは FFT 前にステレオデータの平均を取ってモノラル化したデータを 使って計算した $s_p''$ を使っても良かったかもしれないが、
  $\displaystyle
s_p' = \frac{s^l_p+s^r_p}{2}$ (8)
$s_p$ には、$s^l_p\geq 0$, $s^r_p\geq 0$ より容易にわかるように
$\displaystyle \sqrt{2} s_p'\leq s_p\leq 2s_p'
$
の関係が成り立つので、$s_p$$s_p'$ はどちらを使っても大きな違いはない。 一方、$s_p''$
  $\displaystyle
s_p''
= \left\vert\frac{s^l_r+s^r_r}{2} + \frac{s^l_i+s^r_i}{2} i\right\vert
= \frac{1}{2}\sqrt{(s^l_r+s^r_r)^2+(s^l_i+s^r_i)^2}$ (9)
なので、
$\displaystyle \sqrt{2} s_p''\leq s_p
$
となるが、 $s_p''\geq\alpha s_p$ の形の不等式は成り立たない。 それは例えば左右のデータが丁度逆位相だった場合は $s^l_r=-s^r_r$, $s^l_i=-s^r_i$ となるので $s_p''=0$ となるが、 $s^l_p=s^r_p>0$ なので $s_p$ $s_p=\sqrt{2} s^l_p=\sqrt{2} s^r_p$ と なる。今回の目的で言えば、逆位相は起きないだろうが、逆位相のデータが キャンセルされて 0 になってしまう $s_p''$ よりも、 むしろ左右のスペクトルをちゃんと拾う $s_p$ の方が適しているだろうと思う。

また、グラフの鉛直な点線は、表 1 で示した 理論的な周波数 $f^r_1$ の位置を示す。

楽器の実音には、完全な正弦波の純音とは違い多くの倍音成分が含まれる。 すなわち、一つの実音は、$a$Hz の 1 次成分と $2a$Hz の 2 次の倍音成分 (1 次成分の 1 オクターブ上の音)、 $3a$Hz の 3 次の倍音成分 (1 次成分の 1 オクターブ半上の音)、 などの和で構成される。 図 1 のグラフは、 一つの音に含まれる各次数成分の割合を グラフの高さで表現したものと見ればよい。 ただし、一番高いところが 1 となるようにスケール変換している。

例えば、図 1$f^o_1$ に対するホルンの実音は、 1 次成分の周波数 ($=f^H_1$ と書く) がほぼ $f^r_1$ に等しく、 そしてその高さが 1 ということはこの 1 次成分が最大であり、 そしてそれ以外の倍音成分、すなわち $f^H_1$ の自然数倍の周波数の音も かなり強いレベルで、しかもかなり高次成分まで含まれていることがわかる。

実際、同じグラフをもっと先の高次成分まで表示したものが 図 2 のグラフであるが、

図 2: より広い周波数幅で表示したもの
\includegraphics[width=0.7\textwidth]{horn/fft-1-17-w.eps}
これによれば、8 倍成分くらいまでかなり大きく、また 14,15 倍成分も 大きくなっていて、かなり高い周波数成分まで含まれていることがわかる。 逆に言えば、より大きな $n$ に対する $f^o_n$ の実音に比べると あまり純粋な音ではない、と言えるかもしれない。

$n=2,4,8$ および $n=13$ のグラフを図 3, 4 に示す。

図 3: $f^o_2$, $f^o_4$ のグラフ
\includegraphics[width=0.45\textwidth]{horn/fft-2-17.eps}\includegraphics[width=0.45\textwidth]{horn/fft-4-17.eps}
図 4: $f^o_8$, $f^o_{13}$ のグラフ
\includegraphics[width=0.45\textwidth]{horn/fft-8-17.eps}\includegraphics[width=0.45\textwidth]{horn/fft-13-17.eps}
$n\geq 2$ 以降のグラフは、$n$ が大きくなるにつれ形はより単純になり、 ほぼ 1 次成分 $f^H_n$ が一番強く、 2 次以降の倍音成分は 1 次成分に比べかなり小さくなっていき、 5 次成分以降はほとんど含まれなくなる。 ただし、$f^o_2$, $f^o_3$, $f^o_5$ の実音では、 例外的に 1 次成分より 2 次成分の方が強かった。 よって大きい $n$ に対する高い自然倍音の実音の方が 純粋な音に近いようにも見える。

また、実際のホルンの音 $f^H_n$ と理論値 $f^r_n$ とは、$n$ が 大きくなると少しずれが見えてくる。 それにはいくつかの原因が考えられるが、 例えば、演奏者の技量もその要因の一つだろう。

また、実際のホルンの自然倍音は完全に開管の (2) の 形になるわけではなく、あくまでそれに近い形になるだけで ([1])、 特に高次の自然倍音ではそこからのずれが大きくなることが $f^H_n$$f^r_n$ とのずれの原因となりうる。

他にも、$f^r_n$ は基準音の A を 440Hz として計算したのであるが、 金管楽器は 440Hz よりも少し高い音を基準として設計されている 可能性があり、それも原因の一つかもしれない。 温度などの環境変化によって、主に音速 $c$ が変わることによって 管楽器の音高は少し変わるが、その調整のために 金管楽器には「チューニング管」というものがついていて、 それを少し抜くことで管全体の長さを長くして全体の音高を少し下げる ことができる。 しかし、これは長くして下げることができるだけで、 短くすることはできず、上げる方向には調整できないので、 元々楽器の基準が少し高めに設定されている、という可能性が考えられるが、 詳しくはわからない。この基準の高めの設定の可能性については、 6 節でまた考える。

今回の実験で得られた、実際のホルンの $f^H_n$ の値、 すなわち自然倍音の 1 次成分周波数を表 2 に示す。 なお、表 2 の 3 列目は、表 1 の 右端に示した $f^r_n$ の値、すなわち A=440Hz から計算した F 管ホルンの 自然倍音の理論的な開管周波数、 音高差は $f^H_n$$f^r_n$ のセント単位での音高差、 すなわち音階数の差の 100 倍

$\displaystyle \left(12\log_2 \frac{f^H_n}{f^r_n}\right)\times 100
$
の値であり、100 セントで 1 半音差を意味する。

表 2: 実際のホルンの自然倍音周波数 $f^H_n$
$n$ $f^H_n$ (Hz) $f^r_n$ (Hz) 音高差
1 43.7 43.7 3.4
2 89.5 87.3 42.9
3 131.6 131.0 7.8
4 177.6 174.6 29.8
5 223.1 218.3 37.7
6 259.4 261.9 $-16.7$
7 299.4 305.6 $-35.1$
8 350.9 349.2 8.4
9 401.1 392.9 35.7
10 445.8 436.5 36.4
11 494.3 480.2 50.0
12 542.0 523.8 59.1
13 594.2 567.5 79.6


$f^H_n$$f^r_n$ より低い音もあるが、全般的にはやや高めである。 これについても、6 節で考察する。 また、これが開管の式 (2) とどれくらい合っているかに ついては、5 節で他の実験結果と合わせて考察する。

竹野茂治@新潟工科大学
2022-06-21