(半蔵門だより)

メディア・コンパス

メディア・コンパス4「情報とフォルム-2」

音声入力された「情報」とは

最近、最高裁判所は裁判の記録に、NEC社が開発した音声入力機を使うよう決定したそうである。このニュースは、新聞の囲み記事なので自分で確認したわけではないが、しかもこの音声入力機の音声識別能力は瞬時に30人まで可能だとのことである。

今まで音声入力機は、NECに限らずフィリップス社製のものも出回っていて、ほとんど音声の復唱がつけば、相当の確度で入力される段階にはあったのである。しかし、問題は声の個別認識能力の速さと入力情報の様式化であった。

つまり、発言の内容は仮に拾うことができても、それがどこの何という人の発言なのかはいちいち名乗ってもらわなければできなかったわけである。また、それに先立って、会議の持つさまざまな特質に対応する認識力が、入力機には欠けていたのである。

今回の場合は、裁判記録であるからその点は機能の高度化もあって相当程度解決できるとしても、情報のもつ様式化の問題は以下の点で残るものと考えられる。

まず、第1点はこの音声入力のフォームはどのように設定しているのか。情報には、その情報に与えられるべきフォームがあって、そのフォーム抜きでは情報として用をなさないという泣きどころがある。情報の様式化、図式化である。

加えて、
第2点は、点(、)や丸(。)の加入。
第3点は、改行の指定とフォルム。また、行あきの指定処理。
第4点は、用字用語の選択。さらに叫び声、泣き声のようなものの処理、ケバ取りの基準。
第5点は、ファクトチェック、資料の取り扱い。
等、情報処理の常識的な点を考えてみると、入力の部分は相当程度機械に依拠することができようが、従来のチェック作業が減少することはないように思われる。

ただ、問題点と効率は常に相反している。かつてイギリスの議会は、18世紀から19世紀の終わりまで公式記録を持たず、任意でされた民間の記録を間違いは間違いとして依拠していた、という時代があるから、音声入力機の程度を程度として依拠するということがあれば、音声入力機による入力は100%有効とされることになりうるかもしれない。

いずれにしても、このようなトランスクリプションツールができたとあれば、テープ起こしは大変革を迎えることになる。これはいつごろ、一般的にいくらで売り出されることになるのか。また、今後もさらに高度化するための研究は続くのか。ぜひ、知りたいところである。

(2009年9月8日 引地正)

pagetop