ボイロなどの機械音声と人の声を比較して、何が違和感の原因なのかを説明した論文は見つけられませんでした。ボイスロイド2が、隠れマルコフモデルで、パルス列とスペクトル包絡を使っているなら高音まで出そうな気がするのですが何か技術的なものがあるのでしょうか。
http://www.nicovideo.jp/watch/sm37728480