yomi WWW page (in Japanese)


目次

  1. yomi とは
  2. yomi のサンプル (03/31 2017 更新)
  3. 付属ツールのサンプル/スクリーンショット (05/15 2019 更新) [Update!]
  4. ダウンロード (05/15 2019 更新) [Update!]
  5. いくつかの情報 (05/15 2019 更新) [Update!]
  6. yomi に関する Q and A (08/09 2010 更新)
  7. 謝辞 (07/13 2009 更新)
  8. 関連サイト (04/25 2004 更新)
UNIX のページへ戻る

yomi とは

yomi は、UNIX 上の日本語テキストファイル読み上げを行うフリーソフトです。 基本的にごく単純な方法で動作しているため、非常に低品質、低機能です。 現在の最新版は yomi Version 0.18.1 (05/15 2019 現在) です。 詳しくは 付属のドキュメント をご覧下さい。

ご意見、ご感想等は こちら へ お願いいたします。

目次へ

yomi のサンプル

yomi は、基本的に 1 行ずつの音声ファイルを作成し、それを音声出力します。 以下にいくつかその 1 行の例を示します。 サンプルファイルは .au (8bit μ-Law 8kHz) 形式、および .wav (linear 8kHz) です (yomi は version 0.6 より WAV、version 0.8 より AIFF も support しています)。

以下のサンプルを聞けば、yomi がいかに低品質であるか、そして、 いくつかの問題点を持っていることがわかると思います。

「こえうぇぶ」の 音素などを使用する場合は、音素の前後の空白を削除する必要があります。 また、ファイルサイズが大きい場合は、実行環境によっては、 適当に品質を落してサイズを小さくする必要もでてくるでしょう。 単にその音素を使用した場合のサンプルを次に示します。

サンプルファイルは、「こえうぇぶ」のファイル (AIFF) を、 サンプリング周波数を変えずに WAV (16bit linear 48kHz) にしたもの、および、 sox (12.16) を使って AU (8bit μ-Law 8kHz) にしたものを使用しています。 いずれも空白の削除、音素の長さの調整は行っていません。

AU ファイルの方は、「が」の音に雑音が入っているのがわかると思いますが、 これはダイナミックレンジの問題で、 データの変換時にそれを絞れば解消できるようです。

次の例は、AU ファイルに対しては、その「が」の雑音を取り、 音声データの前に存在する空白部分を取り、 データファイルの長さを揃えたものを使用したものです。 データファイルは AU (8bit μ-Law 8kHz) と WAV (16bit linear 48kHz) です。 長さを揃えるのには、yomi 付属のツール ausubstr, wavsubstr を使用しました。 各音素の長さは、0.25 秒にしたもの、0.18 秒にしたものの 2 種類ずつの例をあげます。

このように音素の長さを変えることで、早口を実現できます。

なお、yomi version 0.7 より、読みの速度の調整は、 音素の長さを変えておかなくても、yomi 実行時にオプションを指定することで できるようになりました。

また、version 0.17 より、各音素の出だしと終わりを連続的に 0 に変化させることで音素を柔らかく連結するオプション (-C, -D) を追加しました。 元々の音素の出だしと終わりが 0 に近ければあまり意味はありませんが、 単音データのようなものを連結する場合は、 単純に連結するとつなぎ目にノイズが発生しますが、 このオプションにより多少それを減らすことができます。

以下に、「-Cs10 -Ds100」(先頭は 10 ミリ秒 0 からクレッシェンド、 末尾は 100 ミリ秒 0 へデクレッシェンド) のオプションを使った例を紹介します。

最初の言葉のデータの場合には、元々出だしと終わりが 0 に近い状態なので、 それほど違いはわかりません。 むしろ、後者の方が減衰オプションのせいで少し聞きにくいかもしれません。

一方、単純音の方は違いがよくわかると思います。 後者は「休符」や「息つぎ」を入れるようなものになるので、 必ずしも後者が前者に勝るわけではありませんが、 つなぎめのノイズが気になる場合はそれを消すことができる、 ということの原理がわかると思います。


目次へ

付属ツールのサンプル/スクリーンショット

  1. 音声切り出しソフト auslcut のスクリーンショット (08/12 2001 更新)
  2. 簡単な音声波形作成ソフト mksnd1.tcl のスクリーンショット (01/05 2005 更新)
  3. グリッサンド音生成ツール sndglis のサンプル (08/23 2005 更新)
  4. gnuplot グラフの音声化ツール tbl2snd のサンプル (08/29 2005 更新)
  5. 紙のソーティング補助ツール sortejun のサンプル (01/13 2007 更新)
  6. 聴覚周波数検査デモスクリプト earch.csh (01/13 2007 更新)
  7. 無限音階 (sndglis, sndcresc によるサンプル) (05/02 2008 更新)
  8. DTMF 信号 (プッシュホン信号; sndhz, sndmix, wavconn によるサンプル) (06/12 2009 更新)
  9. shless と awk による読み合わせのサンプル (05/15 2019 更新) [New!]

音声切り出しソフト auslcut

(08/12 2001 更新)

auslcut は、グラフィックモードを使うと 音声ファイルを gnuplot のグラフで確認しながら切り出しができます。 そのスクリーンショットを作ってみました。


目次へ

簡単な音声波形作成ソフト mksnd1.tcl

(01/05 2005 更新)

mksnd1.tcl は、大学のオープンキャンパスの模擬実験でも使用した、 GUI の音声波形作成ソフトです。 yomi version 0.13.3 より yomi に含まれています。 その簡単なスクリーンショットを作ってみました。


目次へ

グリッサンド音生成ツール sndglis のサンプル

(08/23 2005 更新)

sndglis はグリッサンド音を生成するお遊びツールですが、 現在、これを改良したものを別な目的で利用することを考えています。 それと関連して、2 つ程簡単なサンプルを作ったのでここに置いておきます (サンプリング 11025Hz, 16bit linear WAV file)。

なお、これらは sndglist と sndmix でそれぞれ以下のようにして作りました。


目次へ

gnuplot グラフの音声化ツール tbl2snd のサンプル

(08/24 2005, 08/29 2005 更新)

上の 「グリッサンド音生成ツール sndglis のサンプル」 のところにも少し書きましたが、 現在、sndglis を少し改良した tbl2snd というツールを作っています。 これは、gnuplot の table 出力を音声化するもので、 音程の高低でグラフの高低を表します。 sndmix, sndstereo と組み合わせることで、 複数のグラフを同時に音声化することも可能です (これは現在 tbl2snd だけでできるようにもするか検討中です)。

まだ作成途中ですが、サンプルをいくつか作ってみましたので、 それを先に公開します (サンプリング 11025Hz, 16bit linear WAV file、いずれも 5 秒)。

y=x と y=x*x の方は、最初と最後のところで音程が等しくなるので、 単純に合成するとその付近でうなりが発生しているのがわかると思います。 一方の波形を変えると多少うなりは聞こえにくくなりますが、それでも やはり多少聞こえます。 ステレオに分離するとうなりはなくなるようです。
(08/24 2005)

tbl2snd がほぼできましたので、 yomi-0.13.4 に tbl2snd を付属させました。 上のサンプルは table データからそれぞれ以下のようにして作れます。

tbl2snd -wav -u2 file.tbl > tbl-1.wav
tbl2snd -wav file.tbl > tbl-2.wav
tbl2snd -wav -m2 -u2 file.tbl > tbl-3.wav
tbl2snd -wav -m2 file.tbl > tbl-4.wav
table データ (file.tbl) は、 gnuplot に以下のような命令を食わせればできます。
set term table
set out "file.tbl"
plot [0:1][0:1] x, x*x
set out

(08/29 2005)


目次へ

紙のソーティング補助ツール sortejun のサンプル

(01/13 2007 更新)

sortejun は、テスト用紙などのように番号の書かれた紙を ソーティングするときに補助となるツールです。 詳しくは 「いくつかの情報 (yomi version 0.13.8)」 を参照してください。 現在、採点の済んだテスト用紙のソーティングに実際に利用しています。

普通は、テスト用紙のデータをコンピュータに入力する「前」にソーティングして、 学生番号順に入力していくんだろうと思いますが、 私は、データの入力時はバラバラの紙のデータを、学生番号も一緒に入力します。 それは、以下のような理由によります。

よって、答案用紙がどのように並んでいるか、 という情報がコンピュータにあるので、 それを利用して最後にソーティングを行います (ソーティングしなければいけない理由は、 学生への答案の返却の際はその方が便利なため等)。 そのソーティングの例をここで紹介します。 実際の 80 人位のデータを紹介するのは大変なので、 上から順に次のように並んだ、10 枚の架空の学生番号のついた答案を使います。

2005a051
2005a018
2005a074
2005a093
2005a047
2005a041
2004c056
2005a073
2005c037
2005a069

このようなデータ (1 行に学生番号 1 つがあるデータ) が書かれたテキストファイルを data.txt とし、 ソートは、紙を表にしたまま、3 つの山 (左から 1,2,3 番の山) に配っていくことでソーティングをすることにします。 この場合、sortejun を

sortejun -I2 -o3 < data.txt > data.srt
(I2 = 文字列としてソート, o3 = shless 用の出力を行う) と実行すると、shless 用の出力ファイル data.srt が作成されます。 これを
shless -c +v +l data.srt
shless にかけて実行すると、
[1 回目開始]
と表示され、 と音声ガイドが流れます。

return キーを入力すると、最初の 5 枚に対して (デフォルトでは 5 枚ずつ止まる)

[2005a051 --> 1]
[2005a018 --> 1]
[2005a074 --> 1]
[2005a093 --> 1]
[2005a047 --> 2]
と表示され、 と音声ガイドが流れます。 これに従って紙を上から順に 1,1,1,1,2 の山に配ります。 つまり、これにより、 となります。

次に return キーを入力すると、残りの 5 枚に対して

[2005a041 --> 1]
[2004c056 --> 2]
[2005a073 --> 2]
[2005c037 --> 1]
[2005a069 --> 1]
と表示され、 と音声ガイドが流れます。 これに従って紙を上から順に 1,2,2,1,1 の山に配ります。 つまり、これにより、 となります。

次に return キーを入力すると、

[1 回目終了]
と表示され、 と音声ガイドが流れます。 この通りに回収すると、上から
2005a069
2005c037
2005a041
2005a093
2005a074
2005a018
2005a051
2005a073
2004c056
2005a047
となります。 以下、同様に return を打って、指示通りに続けるわけですが、 以後、文字列と音声ガイドと山の状態のみ書きますと以下のようになります。

[2 回目開始]
(「2 回目開始」sortejun-05.wav)
[2005a069 --> 2]
[2005c037 --> 3]
[2005a041 --> 1]
[2005a093 --> 3]
[2005a074 --> 3]
(「2 3 1 3 3」sortejun-06.wav)
[2005a018 --> 1]
[2005a051 --> 2]
[2005a073 --> 3]
[2004c056 --> 1]
[2005a047 --> 2]
(「1 2 3 1 2」sortejun-07.wav)
[2 回目終了]
(「1 2 3 の順に、1 が一番上になるように重ねてください」 sortejun-08.wav)

この通りに回収すると、最終的に上から

2004c056
2005a018
2005a041
2005a047
2005a051
2005a069
2005a073
2005a074
2005a093
2005c037
となり、ソーティングが済むことになります。 ちなみに、この後 return を押すと、最終行なので
BOTTOM of the file.
と表示されますので q で shless を終了して終わりです。

今回は 10 枚なので、2 回はあまり早くないと感じますが、 80 枚位の紙でも大抵 3 回くらい (最悪は 4 回) で終わります。

なお、上の音声サンプルは、「れいしう」音声を使用してみました。


目次へ

聴覚周波数検査デモスクリプト earch.csh

(01/13 2007 更新)

先日、体調の影響か、右耳の聞こえ具合がやや悪くなりました。 近くの医者で診断してもらったのですが、 そこで受けた聴覚検査からふと思いついて、 yomi のツール (sndglis, sndchmix, wavconn) を用いて 簡単な周波数毎の聴覚テストを行ってみました。 これは、yomi のツールのデモにもなりますし、 聴覚能力を自分で測ってみたい、という人もいるかもしれませんから、 ここに公開することにします。

付属音声が大きくて全体で約 21MB もありますので、 付属音声を取り除いたアーカイブ (earch-nosnd-*) も用意しました。 yomi と tools ツールがインストールされていれば、 付属音声を自分で作成することもできます (作成スクリプトもあります) ので、そちらを利用する方がいいかもしれません。

やることは簡単で、kterm などの上で

[01] [632.455Hz ~ 709.626Hz]
[02] [709.626Hz ~ 796.214Hz]
[03] [796.214Hz ~ 893.367Hz]
...
のように表示しながら、その音声データを順に再生するだけです。 各音声データには、表示される範囲の周波数を滑らかに変化する (いわ ゆるグリッサンド)、1 秒の音が、
  1. 左右両方のチャンネル
  2. 左チャンネルのみ
  3. 右チャンネルのみ
の順に入っています (正確に言えば、最後に同じ長さの無音も含まれています)。

つまり、ヘッドフォンをつけて実行すると、 最初は 632.455Hz から 709.626Hz までのグリッサンド音が

  1. 両耳から聞こえ、
  2. 次は同じパターンが左耳のみから聞こえ、
  3. 次は同じパターンが右耳のみから聞こえ、
  4. 最後は無音
で、次の音に移る、というようになっています。 丁度、視力検査で段々見えにくい小さいものに移動していくようなイメージです。

最初に両耳から聞こえるものは、左右の耳のバランス (厳密にはそれとヘッドフォンの左右のバランス) が正常であれば真ん中から聞こえるはずですが、 右耳の聞こえが悪いようであれば、 それはやや左にずれて聞こえますし、 左右の聞こえ方の違いは、 その後の左のみと右のみの音声を聞き比べればよりはっきりすると思います。

検査は、人間の可聴範囲と言われる 20Hz ~ 20kHz の真ん中 (相乗平均である 632.5Hz) から 20Hz まで下降するもの、 又は真ん中から 20kHz まで上昇するもの、の 2 通りがあります。 その範囲をそれぞれ 30 分割してグリッサンドした音が用意されています。

なお、ハードウェア (コンピュータ、音声ボード、ヘッドフォン等) の性能により、特定の範囲の周波数の再生に問題があることもあります (特に最低音と最高音) し、 作成者には医学的な知識もなければ、 これで調べられるものの妥当性もわかりませんので、 あまりあてにはしないでください。

又、付属の音声データには、 20Hz から 20kHz、ボリュームレベル 0.7 のデジタル音が含まれていますが、 それを聞くことによって生ずる障害や損害には一切応じられませんので、 あくまで自己責任でご利用ください。


目次へ

無限音階 (sndglis, sndcresc によるサンプル)

(05/02 2008 更新)

「無限音階」というものを聞いたことがあるでしょうか。 音階をずっと上がっていくような単純な音 (和音) なのですが、 ある一定範囲を繰り返しているだけなのに、 なぜかそれの継ぎ目が聞こえなくて、無限に上がり続けているようなものです。 これは例えば以下にも記されています。

実際は、ドからその上のシまでの数オクターブの音階を和音にして、 その一番下のオクターブの音階をフェードイン (つまりボリューム 0 から普通の音量へのクレッシェンド) で、 一番上のオクターブの音階をフェードアウト (普通の音量からボリューム 0 へのデクレッシェンド) で重ねるようにすれば、 ごく低い音、ごく高い音は聞こえにくいので、 いつ入ったのか、いつ消えたのかがわからずに無限に続いているように感じる、 というものです。

これは、yomi-0.16 から付属されたクレッシェンド/デクレッシェンドツール sndcresc と、sndhz (または sndglis), auconn, sndmix などを使えば作れます。 sndglis で、4 オクターブ、6 オクターブの無限音階を作成する方法と、 そのサンプルを紹介します。

基本的には、いずれも以下のようなことをやっています。

  1. sndglis でドから上のドまでのグリッサンド音を、数オクターブ作成 (6000 ミリ秒)
  2. sndcresc で一番下のオクターブの音を 0.0 から 1.0 でクレッシェンドし、 一番下のオクターブの音を 1.0 から 0.0 でデクレッシェンド
  3. それらを sndmix で全部和音にして重ねる
  4. auconn でその重ねたものを数回 (上では 5 回) 反復する

最後の auconn で反復する際に波形が綺麗につながらない (位相のずれがある) ので、 若干繋ぎ目でノイズが入ります。 逆にそこで音としても本当は繰り返しが入っていることになっているのですが、 意外にそうは聞こえないと思います。

目次へ

shless と awk による読み合わせのサンプル

(05/15 2019 更新)

ここでは、私が普段やっている読み合わせ作業の利用例を紹介したいと思います。 yomi 本体は perl で書かれていますが、 実は私は普段は awk と C シェルスクリプト使いで、perl はあまり使いません。 以下では、 awk と yomi と shless の組み合わせによる読み合わせの事例を紹介します。

例えば、以下のようなスペース区切りの学生の名簿のテキストファイル file1 があり (あえてやや難読名にしています)、

001 柏崎 一 カシワザキ ハジメ
002 工科 進助 コウカ シンノスケ
003 新潟 葉菜子 ニイガタ ハナコ
004 藤橋 都志江 フジハシ トシエ
このうちの 3 名のテストの点数が、番号と点数の組のファイル data1 が あるとします:
004 90
001 82
002 75
このテストの点数の読み合わせをするために、data1 に
004 藤橋 都志江 90
001 柏崎 一 82
002 工科 進助 75
のように、通常は番号に対応する file1 の名前を追加して 読み合わせ作業をしているのですが、 単純にこのようなファイルにしてから yomi にかけると、 名前の難読部分を正しく読んでくれません。

名前の難読部分は、file1 のカナ部分を使えば正しく読めるはずなので、 私は一旦 file1 をまず以下の file2:

(004) フジハシ トシエ 90
(001) カシワザキ ハジメ 82
(002) コウカ シンノスケ 75
のようなファイルに変換してから、 それを「yomi -sh -d」にかけて、 shless 用の出力 file3 を作成しています。 なお、番号をかっこで囲むのは、一桁ずつ「ゼロゼロヨン」 のように読ませるためです。

しかし、この file3 をそのまま「shless -c +v file3」 のようにして読ませると、 画面表示は file2 のカナ表示の名前が表示されてしまいますが、 画面表示はむしろカナではなく、

004 藤橋 都志江 90
001 柏崎 一 82
002 工科 進助 75
の漢字表示の方が望ましいので、 file3 をさらに加工してこのような表示になるように awk で変換をしてから shless にかけています。

手間はかかるようですが、一旦 C シェルスクリプトにしてしまえば たいしたことはありません。 以下にその C シェルスクリプト例を紹介します。

  #! /bin/csh -f
  set awk = /usr/local/bin/gawk
  ## OS 付属の awk でも多分大丈夫

  ## file2 の作成
  $awk -v db=file1 'FILENAME == db { seik[$1] = $4; meik[$1] = $5; next }\
    { printf "(%s) %s %s %s\n", $1, seik[$1], meik[$1], $2 }'\
    file1 data1 > file2

  ## file3 の作成
  yomi -sh -d file2 > file3

  ## file4 の作成
  $awk -v db=file1 'FILENAME == db { seij[$1] = $2; meij[$1] = $3; next }\
    /^\#shless:/ { gsub(/[)(]/, " ", $1); $0 = $0;\
      $3 = seij[$2]; $4 = meij[$2]; print ; next }\
    { print }'\
  file1 file3 > file4

  ## shless による読み合わせ
  shless -c +v file4
実際にはここまで単純ではなく、 例えばデータベースにない学籍番号が data1 にあった場合のエラー処理なども 行っていますが、実質的にはこのような感じです。 これで、画面表示は「[番号] [漢字の姓名] [点数]」で、 音声出力はカナの方を読んでくれるような読み合わせが実現できます。

また、直接 yomi に読ませるのではなく shless にかければ、 enter を押すまで次の行に進みませんし、 前の行に戻ったり、今の行をもう一度読ませたりもでき便利です。

目次へ

ダウンロード

  1. yomi 本体 (更新日 05/15 2019) [Update]
  2. 音声データ (更新日 07/11 2004)
yomi 本体
音声データ 目次へ

いくつかの情報

yomi のバグ情報や、yomi に関して頂いた情報、今後の計画など雑多なこと をここに上げていきます。yomi をバージョンアップした際には、付属のド キュメントに加えていきたいと思います。


「いくつかの情報」の先頭へ戻る
目次へ

yomi に関する Q and A

ここには、yomi に関する Q and A をあげていきます。
(08/09 2010 更新)

1. うちの UNIX には auplay がないのですが
2. EsounD への対応は行なわないのですか
3. WAV への対応は行なわないのですか
4. MP3 への対応は行なわないのですか
5. Linux では動作しますか
6. kakasi が動けばどんな UNIX 上でも動作しますか
7. 音声読み上げではなくて点訳の方向は考えていませんか
8. 再生中にうまく中断できないのですが
9. 特定の音が読めないようなのですが
10. 音声の出だしに雑音が入るようなのですが
11. 付属音声データを他のソフトに流用したいのですが
12. yomi でアルファベット列をローマ字読みさせることはできますか
13. 特定の単語に特定の読み方をカスタマイズするには
目次へ

Q 1. うちの UNIX には auplay がないのですが

A 1.

auplay は NAS (Network Audio System) に付属のコマンドで、多分標準では インストールはされていません。 適当に AU ファイルを再生できる再生ソフトに読みかえてください。 なお、yomi version 0.6 からは WAV ファイル、 version 0.8 からは AIFF ファイルもサポートしています。
(01/08 2001; 10/30 2001 修正)

yomi に関する Q and A 先頭へ戻る

Q 2. EsounD への対応は行なわないのですか

A 2.

他にもいくつかのフリーの音声ライブラリはありますし、OS に付属の ライブラリがある場合もありますが、現在の yomi はいずれも使用して いません。

それらを仮定すると、 yomi をインストールするにはそれらが先に インストールされていないといけなくなりますし、 どんな貧弱な環境でも yomi を動くようにしたいので、 それらは使用しない形にしたいと考えています。

調べたりするのが面倒、というのも大きな理由です (^^;
(01/08 2001; 10/30 2001 修正)

yomi に関する Q and A 先頭へ戻る

Q 3. WAV への対応は行なわないのですか

A 3.

yomi version 0.6 からは WAV ファイルもサポートされていますので、 WAV ファイルが再生できる環境であれば利用できます。
(01/08 2001)

yomi に関する Q and A 先頭へ戻る

Q 4. MP3 への対応は行なわないのですか

A 4.

まだ現在の所 (01/08 2001) 未サポートです。
(01/08 2001)

yomi に関する Q and A 先頭へ戻る

Q 5. Linux では動作しますか

A 5.

日本語化された perl (perl5 用の jperl) か version 5.8 以降の perl と kakasi (version 2.2.5 以上) がインストールされていて、 AU ファイルか WAV ファイル (yomi version 0.6 より) か AIFF ファイル (yomi version 0.8 より) を再生できる環境であれば Linux でも動作すると思います。 ただし、RPM などの Linux 用のパッケージは用意してはいませんので、 コンパイル、インストールの作業が必要になります。 詳しくは 付属のドキュメント をご覧ください。 なお、perl-5.8.X には yomi version 0.13 から対応しています。
(01/08 2001; 03/23 2004 修正)

追加ですが、テキストファイルの漢字コードは現在の所 EUC-JP にしか 対応していません。 Fedora Core 1 の UTF-8 環境では segmentation fault が出る、 という報告がありました。 nkf 等であらかじめ EUC-JP に変換してから yomi に食わせて下さい。
(04/25 2004)

yomi に関する Q and A 先頭へ戻る

Q 6. kakasi が動けばどんな UNIX 上でも動作しますか

A 6.

UNIX 毎に多少サポートしている音声デバイスが違い、音声出力の あたりは OS 毎にかなり違いがあるようですが、

のいずれかが使えるなら yomi は音声出力ができます。もちろん 日本語化された perl (perl5 用の jperl) か version 5.8 以降の perl が もちろん必要です (perl-5.8.X には yomi version 0.13 からの対応)。

なお、yomi version 0.13 からは、内部で open2() で外部コマンドの kakasi を実行する代わりに、 kakasi の perl モジュールである Text::Kakasi にも対応しています。
(01/08 2001; 03/23 2004 修正)

追加ですが、ソースでは大半のツールで

(long int, int, short int, char) == (4byte,4byte,2byte,1byte)
を仮定して書いてあります。 そうでないコンパイル環境 (OS、コンパイラに依存) では まともに動かない可能性があります。
(01/25 2004)

追加ですが、テキストファイルの漢字コードは現在の所 EUC-JP にしか 対応していません。 Linux Fedora Core 1 の UTF-8 環境では segmentation fault が出る、 という報告がありました。 nkf 等であらかじめ EUC-JP に変換してから yomi に食わせて下さい。
(04/25 2004)

yomi に関する Q and A 先頭へ戻る

Q 7. 音声読み上げではなくて点訳の方向は考えていませんか

A 7.

次のような理由で、現在は考えていません。

ただし、例えば視覚障害者の中には聴覚障害も合わせて持っておられる 人もいます。不十分な機能でもいいから、特殊なデバイスを使っても いいから点訳できるようにする、ということも確かに意味はあると 思いますので、今後の検討課題となるかと思います。
(01/08 2001)

yomi に関する Q and A 先頭へ戻る

Q 8. 再生中にうまく中断できないのですが

A 8.

音声再生中は Ctrl-C などで中断しようと思ってもなかなか効かないことが あります。yomi ではデバイスファイルを直接操作はしていないので、 原理的に中断は難しいです。よって、中断する可能性がある場合は、 yomi の -s オプションを使ってください。一行毎に終了するか 継続するか待つようになります (q RET で終了、r RET で今の行を再び再生、 単に RET で次の行)。

または付属の shless を使うという手もあります。
(01/08 2001)

yomi に関する Q and A 先頭へ戻る

Q 9. 特定の音が読めないようなのですが

A 9.

まず音声ファイルがあり、それを認識しているか調べて下さい。 例えば WAV ファイルで ka の音が読めないときには

% wavconn -l ka
としてみてください。それでインストール先の音声ファイルが 表示されない場合は音声ファイルのパスが正しく認識されていないか、 または別なファイルが認識されてしまっている可能性があります。

例えばドキュメントにも書いてありますが、 カレントディレクトリを検索する設定になっていて、 カレントディレクトリに "ka" のようなファイルかディレクトリがあると それを音声ファイルとして使おうとして失敗します。 そのような場合は ~/.wavconnrc を設定してカレントディレクトリの検索を しないようにして下さい。

なお version 0.10.2 以降ではカレントディレクトリの優先度は 下げられましたのでこのような障害は起こりにくくなったと思います。
(10/30 2001; 11/02 2001 修正)

yomi に関する Q and A 先頭へ戻る

Q 10. 音声の出だしに雑音が入るようなのですが

A 10.

音声ファイルのヘッダ部分を出力しているためである可能性があります。 yomi version 0.10.4 からは auconn, wavconn, aiffconn で -r オプション (ヘッダ部分を出力しない) が追加されましたのでそれをお試し下さい。 yomi でそのオプションを利用する場合はこちらを ご覧下さい。
(12/25 2001)

yomi に関する Q and A 先頭へ戻る

Q 11. 付属音声データを他のソフトに流用したいのですが

A 11.

付属ドキュメントには以下のように書いてあります。

また、このソフトはフリーソフトとして公開します。 再配布、改良は可能ですが、その際、 このライセンス部分は改変せずに付属させてください。 改良は変更箇所を別途明記してください。ソースコードも、 dist/ 以下にあるもの以外の私が作成したものに関しては、 それを自由に使用して頂いて構いません。 付属する音声ファイルも、私が作成したものに関しては 自由に使用して頂いて構いません。

よって、音声データの利用に関しては以下のように考えています。

  1. yomi の配布物に含まれている音声データを それだけ取りだして別のソフトに使用するといった使い方をする場合、 私的利用はもちろん構わないし、 自分のソフトに取りこんでそれを公開することも構わない (再配布、再利用可)。
  2. このページで公開している、 「こえうぇぶ」の音声データを yomi で使えるように加工したものについては、 「こえうぇぶ」を運営しておられる、さかいれいしうさん (http://reisiu.iamas.ac.jp/) にも許可を得ること

「こえうぇぶ」の音声データについては、 加工したものの yomi 用としての公開は さかいれいしうさんに許可を得ましたが、 それを他のソフトに再利用することに関しては許諾は得ていませんので、 上記のようにお願いいたします。

なお、ソフト付属音声はあまり音声品質はよくありませんので、 他の目的での利用に耐えるものかどうかはわかりません。
(01/13 2006)

yomi に関する Q and A 先頭へ戻る

Q 12. yomi でアルファベット列をローマ字読みさせることはできますか

A 12.

yomi は文書をひらがな列への変換で kakasi を利用しているのですが、 kakasi はアルファベット列をローマ字変換はできなさそうなので、 yomi 単独では無理です。

よって、sed などを使って、 アルファベット列をローマ字読みしたひらがな列への変換スクリプトを作って、 それで前処理するのがいいでしょう。 sed での変換はそれほど難しくはありません。
(08/09 2010)

yomi に関する Q and A 先頭へ戻る

Q 13. 特定の単語に特定の読み方をカスタマイズするには

A 13.

kakasi の辞書に単語を追加すればいいのではないかと思います。 詳しくは kakasi のドキュメントを参照してください。

または、sed などを使って、 そのような特定の単語をその読みに変換するスクリプトを作って、 それで前処理するという手もあります。 sed での変換はそれほど難しくはありません。
(08/09 2010)

yomi に関する Q and A 先頭へ戻る
目次へ

謝辞

このツールの改良に関して、研究室の 1999 年度の 4 年生佐藤健美君に 色々調査、考察をして頂きました。どうもありがとうございました。

「こえうぇぶ」(「関連サイト」 参照) を作成しておられるれいしうさんには、 yomi への音素の使用を快く了承して頂いたばかりでなく、 yomi には不足となる音素ファイルの作成のご協力まで申し出て頂きました。 本当にどうもありがとうございました。

長野大介さんには、Linux で yomi を使用する場合の問題点、バグリポート、 修正点、技術情報など、大変多くのことを教えて頂きました。 本当にどうもありがとうございました。 長野さん自身、yomi とは別のコンセプトのテキストファイルの 読み上げソフトを作成しておられます。こちらもお楽しみください。 (「関連サイト」 参照)

0.7 から 0.10 までの改良に関しては、研究室の 2000 年度の 4 年生 船橋崇将君に主にお世話になりました。 彼との意見交換の中での色々なアイデアが改良に使われていますし、 また、0.10 で取り入れられた CUI 環境での編集が可能な頭出しツール auslcut, wavslcut, aiffslcut は彼の卒業研究によるもので、彼との合作です。 本当にどうもありがとうございました。

研究室の 2001 年度の 4 年生佐々木徹也君には、0.10.2 の yomi の -L[bs] オプションのバグの報告を頂きました。どうもありがとうございました。

山田栄成さん <hymd3a@plum.freemail.ne.jp> には、 0.12.4 の Makefile のバグの報告、 Linux Fedora core1 + perl-5.8.3 での動作報告、 UTF-8 環境での問題の報告、その他のご意見等を頂きました。 どうもありがとうございました。

Sakae Kobayashi さん (http://www.ksky.ne.jp/~sakae/) には、0.16 の conf.c のバグの報告を頂きました。どうもありがとうございました。

その他、QandA に載せている yomi への質問などを頂いた方々、 どうもありがとうございました。

目次へ

関連サイト


目次へ
UNIX のページへ戻る
作成日: 05/15 2019
竹野茂治@新潟工科大学 (shige@iee.niit.ac.jp)