東芝,東北大学,情報通信研究機構(NICT)は,量子暗号通信技術と秘密分散技術を組み合わせたデータ分散保管技術を開発し,大規模ゲノム解析データを複数拠点に分散して安全にバックアップ保管する実証実験に世界で初めて成功した(ニュースリリース)。
これまで,大容量で機密性の高いゲノム解析データのバックアップは,情報漏洩リスクからネットワークを介したバックアップではなく,ディスク・テープ等のメディアに保存し,場合によっては遠隔拠点に保管されていた。そのため,大容量で機密性の高いデータのバックアップ手法の確立,バックアップのコスト削減・利便性/可用性の確保が課題だった。
今回,量子力学の原理に基づきあらゆる盗聴や解読に対して安全な暗号通信を実現する「量子暗号通信技術」と,原本データを無意味化された複数のデータ片(シェア)に変換することで安全なデータ保管を実現する「秘密分散技術」を組み合わせた「分散保管技術」を開発し,大容量ゲノム解析データのバックアップへの適用を実証した。
開発したデータ分散保管技術は,データの通信および保管の双方にて,情報理論的安全性を担保することができる。量子暗号通信技術により,あらゆる盗聴・解読に対して安全な通信を実現する。
同時に,秘密分散技術により,システム障害や自然災害等で保管データの一部が棄損あるいは漏洩しても,元データの機密性は確保され,かつ,棄損せずに残った保管データから元のデータを復元することができるというもの。
この開発において,①シェアデータの保存先を,各拠点におけるディスクのセクタ単位で指定することで高速にシェアデータの読み書きを行なう「ダイレクトアクセス技術」,②量子鍵配送によって生成した暗号鍵を大量に蓄積し,ソフトウェアの並列実行によって,情報理論的安全が保証されるワンタイムパッド暗号を高速に実行する「並列ソフトウェア技術」等を用いて秘密分散およびワンタイムパッド暗号通信の高速化を実現した。
これらの高速化技術を活用することで,情報理論的安全性を確保しつつ,大容量のゲノム解析データを実用的な時間で分散保管する技術を確立した。
1検体のゲノム解析データ(約80GB)を対象に,分散保管および復元に要する時間とスループットを測定した結果,分散保管処理時は約30分(356Mb/s),復元処理時は約21分(502Mb/s)となった。これは,現状のテープ等のメディアを用いたゲノム解析データの遠隔保管地から物理的に運搬するユースケースと比べて実用的な速度に相当するとしている。