Tag Archives: 音声解析

「さしすせそ」の音って耳障り

ポッドキャストは講座を作っていて、ちょっと違和感がある音がある。

一つは籠もった音、
一つはパピプペポ、
一つは微妙なリバーブ(部屋の何かに反響している–多くは机とか壁)、
そしてサシスセソのキンキン音

パピプペポはポップガードである程度カバーできます
これは口から発する突発の「風」がマイクへ当たるものです。

サシスセソは意外とキンキンに聞こえる人もいます。

実際、マイクの特性もあったりますので、ナンとも言えないので、私自身はミキサー経由高音を落として収録しています。
落としすぎると「籠もった」音にしか聞こえなくなるのでこの塩梅が微妙です。

ちょっと聞いていただきたい

「さしすせそ」.WAV 44.1KHz 32bit

「さそしせそ」を3回簡易的にしゃべって収録してみた

このアプリはAdobe Auditionを使っている。

そして最初のは、除去していない
次のは高周波の一部(黄色が濃いところ)、
そして3回目のは高周波(10KHz以上をカット)

Continue reading

音声解析AI vs 音声合成AI はどうなるか?

2021年4月7日より3日間、東京ビッグサイト青海展示場にて春のAI Expoが開催されます。

私はAIを活用することで相続や事業承継にも使えると考えております。
そこで意気投合したのが今回AIを活用した会社さんとお付き合いすることになりました。

AIには様々な用途があり、人の感情を解析することもできたり、製品の寿命や異常検出、更に製品設計や強度の検出にも使えます。

Photo by Markus Winkler on Pexels.com

まず、相続ではどうなるかを考えていきたい。
AIを活用し、自分のコピーを作れたらどうかな?

今は出来ます

Deep AI Copy

これで自分のアバターを作り出して、予め教育させておくことであるアルゴリズムを使い、自分で判断させていくことが可能になります。
実際、これが相続の段階で法的に自分の分身と認められることはありえないのだが、ある程度のガイダンスを得ることが可能だろう

つまり経営者の場合、「おじいちゃんだったらどう判断しただろうか」という質問を答えることができるだろう。
占い師や運に任せることがなく、ある程度の論理的判断を委ねることが可能ということだ。

さて、このAIは解析する側と状況を作る側がある。

解析する側は、音声解析による、本人や相手の感情を検知し、それを数値化することで客観的判断ができる。
合成する側は、音声を作りことで、本人や相手の声をそのまま真似て、更に感情を入れ込んで熱唱したりすることが可能になる。

つまり矛楯(ホコタテ)を作ることができる。

なぜここでホコタテというかは、人の声にて感情を解析、しかも言語問わずする機能に人工知能がDeep AI Copyによって作り出した声にフィードするとどうなるか。

Continue reading