特別寄稿

「Disclosure」の日本語訳をめぐって

伊藤 伸介(いとう しんすけ)さん
中央大学 経済学部 教授

 私は,公的統計(政府統計)を主たる研究対象として,個人・世帯,企業・事業所に関するミクロレベル形式のデータ(ミクロデータ)の利用可能性と匿名化措置に関する研究を長年行ってきました.また2017年より,ドコモ クロステック開発部の寺田 雅之氏らのグループと,高次元大規模データにおける統計プライバシーに関する共同研究を進めています.今回執筆の機会をいただいたことから,これらの研究を行うきっかけの1つとなった大学時代のことを振り返ってみることにしました.

 私は,1993年に九州大学経済学部に入学しました.その後,大学3年生のときに,経済統計学を専門とする故濱砂 敬郎先生のゼミナールに所属しました.当時のゼミ活動は,現在の勤務先である中央大学経済学部のゼミで実施している,ゼミ生主体によるグループ別の実地の調査研究活動とは大きく異なるものでした.当時は,統計学の方法を学ぶというよりもむしろ,社会経済の見方・考え方を身につけることをめざして,主として認識論に関するテキストを輪読しながら,少人数でディスカッションを行うというスタイルで,ゼミが行われていました.濱砂先生が説明を行う際には,ホワイトボードにチャートを描きながら,テキストの内容を整理するだけでなく,そこからどのような構造が明らかになるかについて解説をされていました.そのチャートの鮮やかさに,学生の私は大いに刺激を受けました.こうした影響から,議論の内容についてチャートを描いて説明することは,現在私がゼミで学生を指導する上での方法的な基礎になっています.

 ゼミは,毎週金曜日に開講されていましたが,午後3時ごろから2,3時間ほど,テキストの内容について活発な議論を行っていました.その後,当時九州大学があった福岡県福岡市箱崎地区の大学周辺の居酒屋に移動して,焼酎のお湯割りを飲みながら,社会経済に関するさまざまな話題について,時には口角泡を飛ばしながら,夜遅くまで議論をしていたことを懐かしく思い出します.こちらのつたない発言に対しては,濱砂先生からストレートで厳しい意見をいただくことも少なくありませんでしたが,その当時の経験は,現在大学教員として学生を指導する立場となり,経済統計学の研究者となった私にとって,大変得難い財産だと強く感じています.

 私は,大学3年生のときから,漠然とでしたが,大学院に進学しようという考えはありました.しかしながら,大学4年生になっても,大学院でどういう研究を行いたいのかという具体的なビジョンを描くことはできていませんでした.そうした中で,九州大学大学院の入学試験に運良く合格した直後の1996年9月ごろに濱砂先生の研究室に伺うと,いきなり英語のペーパーを渡され,「これを翻訳しなさい」と言われました.それは,ドイツのハイケ・ヴィルト(Haike Wirth)博士(当時,マンハイム社会調査方法分析センター(ZUMA:Zentrum für Umfragen, Methoden und Analysen,現在はドイツの社会科学データのアーカイブ施設であるGESIS(Gesellschaft Sozialwissenschaftlicher Infrastruktureinrichtungen)に在籍))が書かれた,「Confidentiality and Disclosure of Microdata Sets Obtained from Statistical Surveys」という英文のペーパーでした.早速ペーパーの翻訳に取りかかったのですが,何が書かれているのかがさっぱり理解できません.「microdata」という用語に関しては,政府が実施する統計調査で得られるミクロレベルのデータを表すことは,タイトルから分かりましたが,「confidentiality」や「disclosure」が,具体的に何を表しているのか,当時はペーパーを読んでも,理解することはできませんでした.

 我が国では,2007年に統計法が改正されて以降,学術研究目的のために公的統計のミクロデータの利用は進展しましたが,それ以前は,「統計目的外使用」という形で,「公益性」に適った学術研究を行う,限定された研究者にミクロデータが提供されていました.それに対して,欧米諸国では,ミクロデータの提供は1960年代に遡ることができ,各国の統計制度に基づきながら,より広範に公的統計のミクロデータの提供を可能にするための法整備と制度設計が段階的に進められました.こうした海外におけるミクロデータの提供状況を参考にした上で,我が国における公的統計のミクロデータの作成・提供のあり方を追究することが当時においても求められました.前述の英文ペーパーは,1996年10月に福岡で開催された国際研究集会のために来日したヴィルト博士が,ドイツにおけるミクロデータに対する匿名化措置の特徴について講演したときの発表資料でした.

 英文ペーパーの翻訳を手書きで行い,当時使われていたワープロで入力・印刷して,濱砂先生に翻訳原稿をもっていくと,後日,言葉の表現から単語の訳に至るまで,手書きで細かく修正が原稿に入っていました.赤で直された箇所を修正して,また原稿をもっていくのですが,さらに赤で多くの修正が入っており,翻訳作業は完了しませんでした.修正の期間が長くなるにつれて,大学院に進学して,本当に研究をやっていけるのかと何度も不安に思いましたが,先生からの励ましの言葉もあり,大学院修士1年生であった1997年5月に「政府の統計調査から得られるミクロデータの秘匿性および索覗」という翻訳を法政大学日本統計研究所から刊行することができました.それは,私にとっての最初の研究業績でした.

翻訳のタイトルに「秘匿性」と「索覗」という用語が含まれています.秘匿性はconfidentiality,索覗はdisclosureの訳語となっています.

公的統計の分野では,confidentialityを「秘密保護」と翻訳することもありますが,この場合の「秘匿性」については,ミクロデータに含まれる秘密情報に関する保護の程度を定量的に評価することが包含されています.

 公的統計の匿名化においてdisclosureが使われる場合,近年では漏洩,暴露,露見,開示といったさまざまな訳語が当てられます.データに含まれる個体に関する情報については,提供者側から見れば,その情報が外部に流出されることは,情報の漏洩を意味します.他方,利用者(攻撃者)側にとっては,データにある個体情報を特定化し,他人に知られたくない情報を暴くことになれば,それは暴露と言うこともできるでしょう.さらに,データに含まれる個体の秘密情報が露になるという(中立的な)意味で,露見が使用されることも少なくありません. なお,disclosureが,統計数理的な観点から個体識別によって情報が外部に示されることを意味する場合には,開示と訳されています.いずれにせよ,このdisclosureについては,状況によって当てるべき訳語は異なると考えられます.

 英文ペーパーの中にdisclosureは何度も出てきましたが,当時は,既存の訳語で適切と思われる言葉が何かは分かりませんでした.公的統計の匿名化の議論で使われるdisclosureのイメージがつかめなかったのです.濱砂先生に相談したところ,適切な既存の訳語が無ければ,その英語が示している状況を十分に理解した上で,それを表現する日本語を新たに作れば良いのではないかと言われました.それで,先生と何度も議論した結果,データを検索して,その中身を覗き見る「索覗(さくし)」という用語を新たに作り,それをdisclosureの訳語とすることになりました.個体情報の特定化のプロセスを勘案した場合,攻撃者が提供対象となる公的統計のミクロデータから,ある特定の個人に関するデータを探索し,個体識別を行った上でセンシティブな情報を発見するという行為は,「索覗」という言葉で説明することもできるような気がします.

 翻訳が刊行されて以降,公的統計の分野でこの「索覗」という用語が使われることはなかったように思います.あえて「索覗」という用語を定着させる社会的なニーズもなかったといえます.しかしながら,学生時代に英文ペーパーの翻訳のための適切な日本語を探すことに格闘した経験を通じて,社会経済を構造的に把握する上で,対象となる社会事象を的確に表す言葉を選び,それを概念化することの重要性を学びました.それは,私の現在の研究活動に大いに役立っていると確信しています.

Profile
2003年九州大学大学院経済学府博士後期課程単位修得退学.博士(経済学).明海大学経済学部専任講師,同准教授,中央大学経済学部准教授を経て,2017年より現職.専門分野は経済統計学.内閣官房IT総合戦略本部「パーソナルデータに関する検討会」技術検討ワーキンググループ構成員などを歴任.現在,総務省統計研究所「匿名データ有識者会議」構成員,「国税庁保有行政記録情報の整備に関する有識者検討会」委員.

このページのトップへ