かつては考えられなかったオーディオ信号をMIDIイベントに変換する方法です。しかもMaxを使っているのでリアルタイムです。
スレッショルドなどの設定がかなりシビアです。
試してわかった事は、人間の音声は12平均律なんかでは到底再現できないということ。
微分音(マイクロトーン)がかなり含まれています。これを強制的にMIDIの12平均律にマッピングするとどんどん音声のリアリティーは失われてきます。
この手のアプローチは、非リアルタイムですがMax使うよりもircamのaudiosculptを使って、SDIFに変換してからOpenmusicなどでMIDIに変換したほうが精度が高い変換が可能です。
ーー追記
オーディオをMIDIにリアルタイム変換するMac OSX用アプリをリリースしました。