富士ゼロックス,視覚情報処理の仕組みを利用して手書き文字を認識する技術を開発

富士ゼロックスは,人間の脳内細胞の抑制的なはたらきに着目し,そのはたらきとよく一致する新たな構造をソフトウェアに取り入れることで,従来の技術の約3,000文字の10倍となる,約3万文字の多言語の文字認識を実現した。この構造を取り入れた技術をソフトウェアとして実用化したのは世界初。

これは脳神経科学の分野で解明が進んでいる視覚情報処理の仕組みをソフトウェア上で実現した文字認識技術を開発したもの。人が文字を認識する仕組みは,まず網膜から入力された視覚情報が大脳第1次視覚野に伝わり,さまざまな傾きを持つ線分に抽出され,次に形状を抽出する第2次視覚野で複雑な形状を認識すると考えられている。

無題

この技術では脳と同様に,線分や十字等の形状を抽出する畳み込み演算部と,抽出された特徴を集約するサブサンプリング部が階層的に接続されて文字の特徴を抽出し,最後の文字種判定部で文字を判定する。サブサンプリング部で特徴を集約する際に,方位交差抑制に相当する処理を行なう構造を取り入れることで,細かな文字の差異を区別する約3万文字の文字認識を可能にした。

詳しくはこちら。