ホーム > NSSOLテック・コラム > データセキュリティ > 改正個人情報保護法の全面施行で注目が集まる匿名加工技術 匿名加工体験ハンズオンを開発、匿名加工の理解をサポート

NSSOLテック・コラム

データセキュリティ

2017/09/05

改正個人情報保護法の全面施行で注目が集まる匿名加工技術 匿名加工体験ハンズオンを開発、匿名加工の理解をサポート

2017年5月30日、改正個人情報保護法(以下、改正法)が全面施行されました。その改正法で新しく導入された「匿名加工情報」という制度を利用し、企業間や組織間でデータを連携することによる新しいビジネスチャンスが期待されています。そこで、匿名加工情報の活用に向けたNSSOLの取り組みについて、システム研究開発センターの大坪 正典さんと波多野 卓磨さんに話を伺いました。

改正法が施行されましたが、何か変わったことはありますか。

大坪:最近、当社の匿名加工技術について紹介させて頂く機会が増えていると感じています。以前は数ある注目技術の一つとしてご紹介してきましたが、最近では個人情報活用に関する技術として名指しでご要望を頂くことも増えてきました。個人情報の利活用というテーマがお客様の関心事項になってきており、高い興味を持って頂いているという状態です。

匿名加工情報の活用が始まっている、ということでしょうか。

大坪:実際に匿名加工情報の活用が始まるにはもう少し時間がかかりそう、という印象です。これまで企業にとって「個人情報を活用する(流通させる)」という発想は、リスクのイメージが先行するために持ちづらかったと言えます。そのため、改正法によってそれが許されたとしても、リスクが読めずに踏み出すことができないというのが実態でしょう。公共的な組織や積極的な企業が先行的に取り組んで、匿名加工情報流通の前例が増えていけば、加速的に活用が進んでいくだろう、と考えています。

波多野:「匿名加工情報とはどういうものかが、世間的に正しく認識されていない」という課題感もあります。何となく「個人情報を使われているらしい」「プライバシー漏洩が危険だ」というグレーな印象があると、パーソナルデータの流通に対して積極的に取り組めません。流通対象である匿名加工情報が「特定の個人が識別できないように加工した情報である」ということを、きちんと理解いただくことが大切だと思っています。

匿名加工に対する正しい認識が重要なのですね。

大坪:そうですね。現状、匿名化に興味を持たれているお客様と会話をしていると、「匿名化は可逆性のあるデータ加工である(後で再度個人情報に戻して個人を特定できる)」と捉えられていることが多く、法律が求めている匿名加工情報とはギャップがあると感じます。このことが、先ほどの「グレーな印象」を引き起こしている原因でもあると考えます。私たちはこの2つの加工データを明確に分けるために、可逆性のあるデータ加工によりできたものを「仮名化データ」、法律が求めている不可逆な加工を施したものを「匿名加工情報」と呼んでいます。

【図1:「仮名化データ」と「匿名加工情報」の違いとそれぞれの用途】

「仮名化」という技術もあるのですか?

波多野:仮名化データは、データの中身を置換するなどして個人の情報が直接分からないように加工されています。図1の仮名化データは、例えば「出身地」の列名は「X3」に変更され、「東京」などの地名も一定の規則で置き換えられているので、一見して何を表すか分からないようになっています。しかし、「ID」の列によって、一行一行を加工前のデータと対応させることができるため、加工前のデータを持っていれば、加工前後のデータを紐づけて個人特定が可能です。そのため、仮名化データは匿名加工情報にはなりません。しかしながら「匿名化」と聞いてお客様がまずイメージするのは、この仮名化の方のようです。そして直近ニーズが高いのも、仮名化の方だと感じています。

仮名化データは、どのように活用できるのでしょうか。

大坪:データの安全管理ですね。「個人情報をパブリッククラウドにそのまま置くのがセキュリティ的に不安だから、仮名化してから保存する。」あるいは「データ分析の際、分析者に生の個人情報を見せたくないから、仮名化データを分析してもらう。」などです。マーケティングなど、分析結果を個人に紐づけて活用する場合は、匿名加工情報は使えません。「Aさんが商品を買ってくれそう」という分析結果が出ても、匿名加工情報の場合、可逆性が無いためにAさんのメールアドレスが分かりませんからね。

波多野:仮名化によって情報漏洩の危険性は下がります。しかし、仮名化データは、元データと照合することで特定の個人が識別できるため、法律上は個人情報になります。

そうした中でNSSOLはどういう取り組みをしていこうと思っていますか?

大坪:まず、「匿名加工情報」と「仮名化データ」の2つの違いを、きちんと説明してご理解いただかなければならないと思っています。現在はお客様ニーズしては仮名化の方が高いようなので、現場では仮名化データを用いた安全管理技術が進んでいくのだろうと思います。次第に「こういうデータには価値がある」ということが一般化すると、「これは他社に売れる」と考えるようになるでしょう。しかし、仮名化データは個人情報なので、流通させるための手続きが大変です。そこで、匿名加工情報が必要になってきます。

匿名加工情報であれば、流通させやすいということでしょうか。

大坪:そうですね。現段階では、データの具体的な価値が分からないため、データが流通すること自体一般的ではありません。しかし将来的には、データが取引される市場が形成され、データの流通が加速していくだろうと考えています。実際に総務省や経済産業省などで、データ流通に関する検討が行われていますしね。こうしたデータ流通時代では、匿名加工のニーズが高まり、「良い匿名加工とは何か」といった評価もはっきりしてくるでしょう。その時に高い技術力を以て、良い匿名加工情報を提供できるようにすることが我々のミッションだと思っています。

ハンズオンを体験して匿名加工への理解を深めてほしい

お客様に匿名加工を体験していただくハンズオンを作ったと聞きました。

大坪:はい。実際に体験していただくと、匿名化がどういうものか分かっていただけると思っています。ハンズオンのシナリオを簡単に説明しますと、
1. ハンズオン参加者の皆さんは、クレジットカード会社の社員という設定
2. ある日、社長から「改正法を受けて、クレジットカード利用者情報を使ったビジネスができないか」と打診がある
3. 社長からの打診に悩んでいると、転職エージェントから「クレジットカード利用者の年収に関する情報をください」という協業の話が舞い込んでくる
4. 改正法の「匿名加工情報」制度を利用して、自社のクレジットカード利用者情報を匿名加工情報に加工して、転職エージェントに販売することに
...というストーリーの下、匿名加工処理の難易度別に3つの依頼事項を設定しており、それぞれの匿名加工課題について、参加者の皆さんに挑戦してもらうというものです(図2)。

【図2:匿名化ハンズオンにおける3つの課題】

各課題のポイントを教えて頂けますか?

波多野:課題1では、「企業ごとの平均年収をなるべく変えない」というシンプルな条件で匿名化を行います。今回のハンズオンでは、「削除」と「一般化」の2つの代表的な匿名化手法を用います。特定の個人が識別できるIDや名前の列を「削除」して、年齢(例:25歳⇒20代)や企業名(例:個別の企業名⇒企業グループ名)を「一般化」することで、個人が特定しにくくします(図3)。参加者の皆さんは、削除する列と一般化度合いを表すパラメータを選択することで、匿名化を実施します。課題1を通して、まずは簡単な匿名化の手法について理解して頂きます。

【図3:匿名加工の手法】

なるほど、IDや名前を削除して企業名や年齢をぼかすと、個人が分からなくなりますね。課題2はどの様なものでしょうか。

波多野:課題2では、「企業×役職ごとの平均年収をなるべく変えない」という条件で加工します。企業情報を一般化しすぎると、個人を特定することが難しくなりますが、転職エージェントが欲しい情報である「企業と役職別の平均年収」が元のデータと大きくズレてしまい、有用なデータが提供できなくなります(図4)。課題2を通して、匿名化における「安全性(個人特定の難しさ)」と「有用性(元データ特性の維持)」の2つのバランスについて考えて頂きます。

【図4:安全性と有用性のバランス】

ここまでの説明で、匿名化がどんなものか概要がわかりますね。最後に課題3はいかがでしょうか。

波多野:課題3では、「企業×役職×年齢ごとの平均年収をなるべく変えない」という匿名化ですが、これはなかなか難しいです。一般化度合いの選択肢が多くどのように絞り込めばいいのか、様々な情報を組み合わせて考える必要があります。課題3に取り組むことで、匿名化の奥深さや「良い匿名化には高い技術力が必要だ」ということをご理解いただけると思います。

大坪:ここまでハンズオンを体験した方は、本コラム前半に登場した「仮名化との違い」についても、肌で感じることができると思います。

実際に体験された方からの反応は?

大坪:今年(2017年)6月に行われた当社事業部のお客様招待イベントにて、ワークショップを実施しました(図5)。参加者は情報システム部門の部長クラスの方々で、約6名1グループでこのハンズオンに取り組み、匿名加工技術を競って頂きました。ワークショップ後の懇親会にてお話したお客様は、「匿名化おもしろかったよ。これが実データだと大変だよね。」と、匿名化の奥深さを感じていただけたようです。

波多野:「匿名加工技術についてもっと詳しく知りたい」というお客様もいらっしゃいました。本ハンズオンは基礎編ですが、今後より深い議論ができると嬉しいですね。

【図5:6月に開催した当社イベントでのワークショップの様子】

最後に、今後の展望についてお聞かせ下さい。

大坪:前述の通り、匿名化のニーズが本格化するには、もう少し時間がかかると思っています。しかしながら匿名加工技術における課題は山積みの状況です。我々は、自らの匿名加工技術を磨くことは勿論のこと、今回ご紹介したハンズオンの様に、お客様に匿名化についてご理解頂く活動なども通じて、1つ1つの課題を解決していきたいと考えています。いくら技術だけが高度化しても、その安全性や有用性を認識してその価値を判断するのはお客様ですからね。

波多野:今のハンズオンでは基本的な匿名化手法しか使っていませんが、今後は当社が開発した、より高度な匿名化手法も組み込んでいきたいですね。

なるほど。匿名化ハンズオンの体験をご希望の方がいらっしゃったら、ぜひお声掛けいただきたいですね。今日はどうもありがとうございました。

【関連記事】
個人情報の匿名化技術を競うコンテスト「PWSCUP2016」で3位 再識別賞も受賞 データ活用を加速させるデータセキュリティのパイオニアをめざす
【技術動向】企業横断の「データバンク」で共創を促進 ~異業種データの掛け合わせとAIで得た知見を新事業創出に生かす~

関連する記事