FC2ブログ

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

「インパルス応答」エコーの正体

18/09/01初稿

 初めに。インパルス応答の「エコー」はエコーと言ってもカラオケのエコーのようなものではありません。また、テープの磁気転写のようなことでもありません。猛烈に念のためですが。
 また、本Blogでの「インパルス」「インパルス応答」の意味付けは、あくまでもPCMオーディオ理解用としてのものです。

 本稿、先の≪foobar2000≫のアップサンプラーをOSDFにみたててDACが波形復元するプロセスを可視化し、「サンプル個々のインパルス応答の合算が原波形になる」記事の続編として記します。

・「エコー」は波形の血肉である
 前稿の目的は「サンプリング定理による原波形復元を具体的に理解すること」でした。
 しかし、その内容は見方を変えると、OSDFのインパルス応答エコー成分は「復元すべき原波形の血肉」であると言い換えることができるのではないでしょうか。
 そしてこれは、エコーは決して無駄で不自然な成分ではないということも示しています。

 ポストエコーだけでなくプリエコーもです。復元サンプルに混ざっている(というか形成している)プリエコー成分は未来サンプルのエコーではありますが正当な血肉であって、未来からの音が響いているワケではないということです。

 復元プロセスで見た通りエコーは波形復元中ずっと発生しているのですから、OSDFの復元精度を確かめた際にヘンテコな差分が出なかったことからも、それは言えると思います。

 しかし、それって巷で大勢をなす評価とは真逆ですよね。ホントでしょうか?
 PCMオーディオを考える上でかなり重要なことだと思いますので、本稿で熟考してみます。

・まずはDAとADは切り離して考える
 原波形復元について考えているので自明だとは思いますが、本稿で扱うのは「DA変換」のみです。「AD変換」時の事情は対象外であることを、念のため確認させてください。
 具体的に言うと、例えば、44.1kHzのデータであれば特記なき場合は「22.05kHz未満に帯域制限されている」として扱いますが、その手法などは考えません。
 実際、データを再生する側としては、もしデジタル化プロセスのどこかの帯域制限処理でエコーが付いたとしても、それはDA変換して戻すべき正当な波形として扱わざるを得ませんし。

・「不自然」なのはどっち?
 上記記事の通り、サンプリング定理の復元プロセスの実装として、OSDFがインパルス応答でエコーを生成するのは必然です。
 しかし、よく「DACのデジタルフィルタを通すとアタック音の前後に不自然なエコーが付く」などと言われます。何故なのでしょう?

 「エコー悪玉論」は基本的にインパルス応答のエコー(特にプリエコー)を引き合いにしていると思います。が、インパルスは自然音ではなく、OSDFの応答はフィルタ特性を示すものです。
 大きな1サンプルだけの“音波”など有り得ないにも拘わらず、その応答波形をDA変換結果(音波)への直接的影響として語っていることが“そもそも不自然”なのではないでしょうか。
 「エコー悪玉論」においては、インパルス応答としてではなく、原波形復元成分としての問題を指摘する必要があると思います。

 ちなみに、OSDFを通さないでエコーがないインパルス応答波形をもって「過渡特性バツグンで自然な音」的に評されることもあるようですが、リコンストラクションしないってことですから、そうやって再生された波形は零次ホールドのままのカクカク波形です。例えばCDフォーマットの14.7kHzだとカクカクを超えてガタガタになります。
 個人的にはその方が“不自然”だと思うのですけれど。

#アナログフィルタでカクカクを除去したら結局インパルスはその応答します。

 振動体の過渡特性とゴッチャに感じられる場合もあり、さらに混乱を招いている気もします。

・「不自然で無駄な成分」に見えるのは何故か
 以前、「インパルス応答のエコーを見ていても実際の音波に対する影響は解らないのではないか」と考え、インパルスではなく「いきなり立ち上がって消える1周期のみのサイン波」の前後に発生するエコーを観察したことがあります(不自然な波形であることは承知で)。

 結果、実質的には問題ないだろうと判断しました(判断理由は記事内参照)。
 が、実質的問題はなくとも、サイン波の前後にエコーが発生し、「不自然で無駄な成分」に見えたことは事実です。何故でしょう?

 それは、「原波形復元におけるエコーは原波形の正当な成分」であることから考えると、「そこに復元すべき有効なサンプルがないから」ではないでしょうか。
 1周期のサイン波の前後がいきなり無音なのはサンプリング定理違反(自然界には存在しえない波形)です。違反状態のため出現してしまう原波形復元成分が無用に見えてしまう、ということだと思います。

・無音部分に“エコーが染み出る”ことを可視化する
 ここで、上記理解をより納得するため可視化してみます。
 手法は先の記事と同じです。3周期の14.7kHz/-3dBサイン波(*)の前後に新たに2サンプルずつ無音をくっつることで、そこに出現するエコー成分は「各サンプルのインパルス応答によってつくられた原波形の血肉が取り残されたもの」であることを、連続した復元成分波形として示します。

*:今回は位相はズラしていません。周期最初のサンプルをゼロにして無音サンプル(ゼロ)と連続させた方が解りやすいかと思いまして。

 ベースとなる波形を以下に示します。

 上図・・・再現すべき原波形(*)
 中図・・・上図を44.1kHzでサンプリングした結果(に相当するデータ)
 下図・・・各サンプルの8倍インパルス応答をすべて加算した結果

*:8倍アップサンプリングで作ったものですので粗いですが、サンプル値を編集するのがメンドクサイのでご容赦ください。また、本来サンプリング定理違反ですので原波形と呼ぶのはどうかと思いますが、これもご容赦を。

インパルス応答ベース:3周期


 合成結果が原波形復元になっており、サンプル値がない前後4サンプル部分は「“合成され切れず取り残された応答成分”がエコーとして見えている」と言っていいと思います。

 次に、そのプロセスとして各インパルス応答波形を示します。今回のデータでは3サンプル/周期中1サンプルはゼロクロスしますので、値があるサンプル=インパルス応答するサンプルは3周期中No.4,5,7,8,10,11の6個になります。
 Linear系ですのでプリエコー・ポストエコーが前後対象に発生しています。

インパルス応答:3周期


 以上より、先の考察でエコーが発生しているのは
「いきなりゼロ値のサンプルに接続するというサンプリング定理違反なのが原因」
であり、
「定理に則ったサンプルが連続する限り、エコーは原波形の正当な血肉になる」
と考えていいでしょう。

 サンプリング定理に則る=波形を「自然界に存在しうる(発音体や媒体が振動できる)ナイキスト周波数で帯域制限された音波」として考えることは重要だな、と改めて思いました。

・本当に問題ないのか
 サンプリング定理の数学的復元では問題になりません。定理ではサンプルは過去にも未来にも無限にありますから、エコーは原波形復元の“血肉になり続ける”からです。
 PCMオーディオにおいても、波形が定理に則った波として連続している限りは“なり続けている”状態ですから、実質的には問題にならないでしょう。
 具体的に言うと、「曲が始まってしまえば問題ない」ということです。

 が、「曲(データ)の最初や最後」についてはなかなか難しく理解できていません。
 今は、「そもそも最初と最後があること自体がサンプリング定理の応用としての理想との乖離なので、なんかヘンでも仕方ない」と思うことにしています(苦笑)。
 なんかヘンになるとしても特殊条件を満たした場合だけですし、量子化されているのでエコーの影響範囲はそれほど広くない(前稿参照)でしょうから、全体的音質にはほぼ無関係だと思いますし。

 さらに、完全な無音(ゼロサンプル)からの立ち上がりや収束について考えていたところ、「“完全な無音”はある種のDC成分ではないか? とすると、サンプリング定理で扱っているのは“波”なので、実はあっちゃダメなのでは?」という気がしてきたことを後日のためにメモしておきます。

 前稿でも引いた東京電機大の「ディジタル信号処理の基礎」から、また抜粋引用してみます。

バイアス(直流成分)=ゼロ は、信号処理の暗黙の前提であることが多い
出典:http://www.asp.c.dendai.ac.jp/ASP/DSPseminar14.pdf P.4

 「AD変換時には、直流成分=DC成分は無いことが前提」とのことです。

・ベンダの功罪
 OSDF特性を複数設定できるようになっているDACチップがあります。そして、その設定をユーザに公開しているDACユニットもあります。
 Resampler-Vの表現で記すと、Linear系特性は位相ズレが発生せずエコー成分が前後対象(プリエコーあり)ですので、サンプリング定理の原波形復元に一番近い特性と言えるでしょう。
 Minimal系は位相ズレが発生しますがプリエコーがありませんので、未来のサンプルは参照できない(過去サンプルに影響できない)現実世界のアナログフィルタ特性に近いのでしょう。

 が、それらが選べるのは本来音質をチューニングするためのハズです。
 例えば、Minimal系はOSDF以前のアナログLPFの音に馴染んでいると好ましいかも知れませんが、決して「プリエコーがない方が客観的に高音質」ということではないでしょう。
 逆に、そもそも論ですが、PCMオーディオはあくまでもサンプリング定理の応用ですので、数学的復元に準ずる方が絶対に正しいとも言い切れません。ですので、「やっぱりプリエコーはキライ」といった嗜好(客観的ではない)も否定できるものではない、とは思います。

 ですが、新開発機能・技術をアピールするためか、「プリエコーは不自然」というイメージで語られることがあるように見受けられます。残念です。


 最後に、繰り返しになりますが、本稿ではAD変換時(デジタル化時)のフィルタ事情は考えていません。
 もしかしたら「AD変換時の帯域制限でLinear系フィルタをかけるとプリエコーが発生して不自然」といった事情はあるかも知れませんが、たとえそうだとしても、DA変換時にはそのプリエコーも再現すべき波形になっちゃいますので。


・個人的メモ
 MQAって、もしかしてADとDAの処理特性マッチングを図ってるってこと?
 ハイレゾでデジタルフィルタのデメリットを減らすことを考えた時、「AD特性に合わせてDAできればいいのに」と考えたが、それ系?

ハードウェア・デコードでは、4x(4fs)の176kHz、192kHz等のいわばフルデコードが可能だ。対してソフトウェア・デコードでは、2x(2fs)までで上限が88kHzまたは96kHzになる。これはボブ・スチュワートから、MQAは基本的にエンド・トゥ・エンドのシステムであり、4x以上のデコードにはDACの特性を知ることが必要だからという説明がなされている。

ちなみにプリッソン氏によると、MQA内部の情報にはDACのフィルタープロファイルをチューニングするためのデータも含まれているということだ。

出典:https://www.phileweb.com/review/article/201704/17/2496_3.html

これは正しい認識である。なぜならばMQAエンコードされる際に音源が“de-blur”、つまり時間的なあいまいさが取り除かれるからだ。これはつまりMQAの特徴のひとつである時間的正確性のことである。これは一種のデジタルフィルターと言ってもよい。
出典:https://www.phileweb.com/interview/article/201707/12/471.html


メインメニューへ

テーマ : オーディオ
ジャンル : 趣味・実用

最新記事
ERIへようこそ

Author:らかせ
「最新記事」または
「メインメニュー」からどうぞ

・ファイルへの直接リンク以外はリンクフリー(連絡不要)です

・一応、拍手にコメント(非公開)付けられるようにしてあります

・DB的に利用しており、過去記事もガシガシ書き換えています。特に「最新記事」は初稿から一週間くらいは直してることが多く、大幅に変わっちゃうことも。ご了承ください

・ということもありますし、記すまでもないですが無断転載(ファイル含む)はご遠慮ください

・引用の考え方については「007:諸事」をご参照ください

・アフィリエイトは「Amazon.co.jpアソシエイト」のみです

・ハイパーリンクは当Blog記事のみです(054:節電記事のみ例外)

カテゴリ
検索フォーム
FC2カウンター
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。