BLOG.NOIRE

THINK ABOUT SOMETHING.

Webサービスのアイディア

ワールドカップに際し思いついたサイトのアイディアを書こう。YouTubeは楽曲の解析の為に音声解析をしていると思うのだけど、それを音声認識してテキストデータベースも別に設ければ面白いことができる。キーワードによるシーン検索だ。

 

例えば自分の好きな芸能人の名前でシーン検索をかければ、タイトルにその芸能人の名前が含まれていなくても、動画内でその名前を呼ぶシーンがあればそこに飛べる。つまり、あらゆる動画内のシーン一覧を抽出可能で、タイトル検索とは別の検索としてそれは引っかかる。

 

理想は「ゴール」とシーン検索をかけて、実況者がゴールと叫ぶシーンを一覧抽出することだが、点が入る時以外でもゴールと喋ることはあり得るし、詳細検索に声量や長音フィルターを設けるのは必須。また「ゴール」だけでは目的外のスポーツも含まれる為、タイトル検索と組み合わせる必要もあるだろう。

 

そしてシーン検索するキーワードの該当シーンから、前方ないしは後方またはその両方の尺指定をできるようにする。例えば「ゴール」に対して前方に10秒の尺を指定すれば、ゴールの瞬間から10秒遡った時点から再生されるし、これは前方にも後方にも両方にも指定できる。

 

そしてここからが重要で、それをQueuingCamみたいにダイジェストにするのだ。例えばサッカーのゴールシーンが指定された尺で代わる代わる再生され、あるいはボクシングのKOシーンが指定された尺で代わる代わる再生されていくようなイメージ。動画が存在する限りにおいてだ。

 

他にもニュースがYouTube上に有料チャンネル化されれば(この辺は全然詳しくない)、そのアーカイブからあらゆる当時のニュースを検索もできる(但しそれは課金者の特権)。基本的にニュースは音楽がかかってないから、音声認識の精度的に相性も良い筈だし、学術的な用途でも使いこなせ得る。

 

あるいはテキストに限らず、笑い声や怒鳴り声といった感情フィルターも設けたり、それらをダイジェスト化してあちこちに自由に飛べる操作性を実現できれば、少なくとも自分は使ってみたい。問題はそれらの認識の精度で、ダイジェストに無関係のシーンが混ざったりあるいは欠けたりすれば台無しになる。

 

一番のネックはそこだ。それに「ゴール」というキーワードのみだと素人動画のシーンとかも混ざり得るから、公式チャンネルのみといったフィルタリングをして回避する必要があるけど、音声認識の精度の問題はやはり残るし、動画数も激減するし、なんか片手落ちだなあ。

 

『混ざる』の方はユーザーに委ねる形でフィックスさせることは一応可能だと思うが、『欠ける』の方はそれをするのに一気に難易度が上がる。それに詳細検索が難しくなればなるほどサービスとしての普遍性もなくなる。片手落ちを前提で楽しむWebサービスとしてならいいんだけど、なんかもったいない。