業務案内

匿名データの利用に関するFAQ(回答)

A.匿名データについて

1 匿名データとはどういったものでしょうか?

基となった統計調査の「調査票情報」を加工して、特定の個人又は法人その他の団体の識別(他の情報との照合による識別を含む。)ができないようにしたものです。

2 現在、統計センターで利用できる匿名データはどの統計調査のものでしょうか?

行政機関からの委託により、現在、統計センターが提供している匿名データの一覧は、匿名データの利用のページを参照してください。

3 匿名データは、どのようなファイル構成に分かれていますか?

統計調査ごとに年次別に分かれています。

例えば、就業構造基本調査の匿名データは、平成4年、9年、14年の3つの年次にファイルが分かれています。

なお、社会生活基本調査の匿名データは、平成3年、8年は「生活行動編」と「生活時間編」の2つのファイルに分れていて、平成13年以降は「調査票A(生活行動編)」、「調査票A(生活時間編)」及び「調査票B(生活時間編)」の3つのファイルに分かれています。

4 匿名データは具体的にどのような加工(匿名化措置)がされているのでしょうか?

総務省が所管する統計調査の匿名データでは、次のような措置が行われています。

匿名化措置 匿名化措置の内容(※)
データのリサンプリング 統計調査の調査票のレコードのすべてを用いず、一部を抽出している。
識別情報の削除等 ・調査区番号や調査区内連番など、調査客体を直接識別できる情報をすべて削除する。
・データの配列順が意味をなさないよう、無作為に並べ替え。
特異なレコードの削除 特徴的な値を持つレコードは削除する。
例:世帯人員が8人以上となる世帯のレコードを削除する。
トップコーディング
(ボトムコーディング)
極端に大きな値は、上限値を設けて頭打ちにする。
(極端に小さな値は、下限値を設けて頭打ちにする。)
例:年齢を「85歳以上」(「15歳未満」)でまとめる。
リコーディング 分類事項の程度は、詳細なものではなく、粗いものにする。
例:年齢を「5歳階級」ごとにまとめる。
スワッピング
(国勢調査のみ)
一部のレコードを他の類似したレコードと入れ替える。

※ 匿名化措置の具体的な内容は、統計調査ごとに異なりますのでご注意ください。

5 匿名データのデータ形式等を教えてください。

データ形式等の概要は次のとおりです。

文字コード Shift_JIS(漢字、カタカナは使用していない)
改行コード CRLF
ファイル形式 カンマ区切り形式(CSV形式)
6 匿名データを利用するに当たり、参照すべき資料はありますか?

まず、基となった統計調査を実施した行政機関から提供されている調査報告書やウェブサイトの資料を参照し、統計調査の方法や調査票の様式、用語や分類の定義、集計結果などを確認してください。

統計調査のウェブサイトは、匿名データの利用のページから関心のある匿名データ名をクリックして各匿名データのページを開いたら、その中の「調査の概要」にて対応する行政機関のページへのリンクを参照できますので、ご活用ください。

また、匿名データとして利用可能な変数項目も確認してください。各匿名データのページから「データレイアウト及び符号表」や「項目名一覧」を参照してください。

なお、統計調査及び匿名データのいずれの資料も、年次によって内容が異なる場合がありますので、利用したい匿名データに対応した年次の資料をご覧ください。


B.利用要件等について

7 利用者に制限(利用要件)があるのでしょうか?

匿名データは、学術研究の発展又は高等教育の発展に資すると認める場合であって、以下の要件をすべて満たす場合に、提供可能となります。

  • 統計の作成又は統計的研究にのみ利用されること。
  • 学術研究又は高等教育(学校教育法(昭和22年法律第26号)第1条に規定する大学又は高等専門学校における教育)の用に供することを直接の目的とするものであること。
  • 学術研究の成果又は教育内容が公表され、社会に還元されること。
8 海外でも利用可能でしょうか?

利用は可能ですが、匿名データの安全性を確保するため、以下の要件のいずれかを満たす必要があります。

なお、利用相談や利用申出の手続きは日本語で行います。

  • 2以上の外国政府等から調査票情報等の提供を受け、かつ、公的機関若しくは1以上の外国政府等から職員の派遣、資金の提供等の支援を受けており、かつ、上記提供及び支援を直近過去5年間継続して受けている場合。
  • 我が国の職員が申出者の属する機関に出向しており、当該職員に匿名データの利用状況を確認してもらえるよう、統計センターが依頼を行うことが可能であり、当該職員が利用状況の確認を行う旨の承諾書を、申出に必要な書類の提出時に併せて提出できる場合。
  • 匿名データの提供を受けた者又は法人その他の団体職員が、匿名データの利用期間中に統計センターへ来訪し、当該来訪時に利用状況のヒアリングを受けられる場合。
  • 過去に匿名データを利用したことがあり、匿名データを取り扱う者、匿名データの利用場所、利用する環境、保管場所及び管理方法が同一とみなせる場合であって、e-mail 等により統計センターが利用状況等のヒアリングを行うことができる場合。

C.手数料・利用期間

9 匿名データの利用は有償でしょうか?

有償です。申出1件につき、以下の(1)~(4)を合算した金額が必要となります。

(1) 事務手数料 1,850円
(2) 匿名データの提供ファイル数
※ 統計調査ごとにファイル数は異なります。
8,500円 × ファイル数
(3) 格納する媒体の料金
※ 原則として、媒体1枚につき1ファイルのデータを収録。
CD-Rの場合 100円 × 必要枚数(ファイル数)
DVD-Rの場合 120円 × 必要枚数(ファイル数)
(3) 書留等料金(郵送で受け取る場合)
※ 窓口で本人確認を終えている場合は、郵送での受け取りが可能。
日本国内の場合は、本人限定受取郵便(特定型)とし、加算料金100円が生じる。

(例1)全国消費実態調査の4つの年次を1ファイルずつCD-Rで利用したい場合

→年次ごとにファイルが分かれているため、ファイル数は「4」となります。

  • 事務手数料 1,850円
  • ファイル数 8,500円×4ファイル=34,000円
  • CD-R  100円×4枚=400円

計36,250円

(例2)社会生活基本調査の「調査票A」の生活行動編と生活時間編について、平成3年、8年、13年及び18年を1ファイルずつDVD-Rで利用したい場合

→「生活行動編」と「生活時間編」ごと、4つの年次ごとにファイルが分かれているので、ファイル数は「8」となります。

  • 事務手数料 1,850円
  • ファイル数 8,500円×8ファイル=68,000円
  • DVD-R 120円×8枚=960円

計70,810円

なお、複数の研究者が別々の場所で匿名データを利用したい場合、研究者それぞれの分のファイル数が必要となります。

10 匿名データの利用期間はいつまででしょうか?

統計センターが提供を行っている匿名データは、最大で3年間を限度とし、目的内容から見て必要最小限の期間のみ、利用することができます。

なお、利用期間中、やむを得ない事情がある場合、延長の申出をすることができますが、この申出は1回のみで、延長期間は最大で2年間を限度とします。


D.利用にあたって

11 他の研究者との共同研究や、学生達への教材等、複数人で匿名データを利用することはできますか?

1ファイルの匿名データは、同時に1台のPC等にしか保存できません。また、サーバー上に匿名データを保存し、複数のPC等で同時に利用することもできません。

そのため、複数の研究者や学生が同時に利用するためには、あらかじめ利用するPC等の台数分のファイル数の匿名データが必要となります。

ただし、1台のPC等に保存して交互に利用するのであれば、1ファイルでかまいません。

12 学生に利用させる場合、保管・管理は学生自身が行っても構いませんか?

高等教育を目的とする場合、保管・管理は教育責任者(教員)が行ってください。学生には保管・管理させないでください。

13 匿名データを利用する場所等の制限はありますか?

匿名データを適正に管理する法律上の義務が生ずるため、利用場所については、具体的に次の制限があります。

  • 利用する場所は、大学の研究室内など、施錠可能な物理的な場所に制限されること
  • 提供されたCD-R、DVD-Rなどの媒体の保管場所は、上記の利用場所にある、施錠可能なキャビネット内等とし、利用場所の外に持ち出さないこと
  • 匿名データを利用する際は、利用者以外の立ち入りが制限されるか、なんらかの確認行為が行われること
14 匿名データを利用するPC等についての制限はありますか?

匿名データを適正に管理する義務により、PC等にも次の制限があります。

  • 匿名データを利用する際は、インターネット等の外部ネットワークに接続しないこと
  • コンピュータウイルスや不正操作等へのセキュリティ対策がなされていること
  • 外部ネットワークに接続する可能性があったり、匿名データの利用者以外の者が使用するPC内には匿名データ及び中間生成物(匿名データの個々の情報を判別できるもの。)を残留させないこと
  • 匿名データの利用者以外の者がアクセスできないように制限されていること

E.利用申出等の手続きについて

15 利用申出はどのように行うのでしょうか?

実際に利用申請される前に、「匿名データの利用」の「利用に当たっての留意事項」から「利用の手引(学術研究・高等教育目的)」をダウンロードしていだだき、必ず一読してください。その上で、次の受付窓口で利用相談を行ってください。

<受付窓口>

  • (独)統計センター 統計情報・技術部 統計作成支援課 利用相談担当
  • TEL: 03-5273-1205
  • MAIL: nijiriyou_atmark_nstac.go.jp ※「_atmark_」を「@」に置き換えて送信してください。
  • 所在地: 〒162-8668 東京都新宿区若松町19-1 総務省第2庁舎
    (来訪される場合は入館手続等が必要になりますので、事前に窓口までご連絡ください)
  • 申出書の受付期間: 4月1日~2月末日(土、日、祝日、年末年始の期間を除く)
  • 利用時間: 10:00~17:00(12:00~13:00を除く)

また次の機関でも、受付業務を行っています。

一橋大学
経済研究所附属社会科学統計情報研究センター ミクロデータ分析セクション 別ウィンドウで開きます。
神戸大学
大学院経済学研究科研究助成室 データ管理室担当 別ウィンドウで開きます。
法政大学
日本統計研究所ミクロ統計情報提供ユニット 別ウィンドウで開きます。
情報・システム研究機構
データサイエンス共同利用基盤施設
社会データ構造化センター オンサイト解析室 別ウィンドウで開きます。
16 利用相談に当たって、必要な書類はありますか?

利用相談の段階で、不明な点やあいまいな箇所がないよう、十分に申出内容の検討・調整を行う必要があります。そのため、仮の「提供依頼申出書」をメールにより受付窓口に提出してください。(受付窓口は、それを基に必要な助言を行います。)

なお、「提供依頼申出書」の様式は、「匿名データの利用」の「申出書の提出」からダウンロ-ドしてください。記入の際は、Excel様式の別シート「記入例」を参照してください。


F.提供依頼申請書の変更手続き等について

17 利用者の所属や利用場所、利用期間などを変更したい場合や、利用者を追加したい場合には、どのような手続きが必要でしょうか?

「提供依頼申出書」に係る記載事項について、申出者の都合により変更が生じた場合は、変更内容に応じた申出手続が必要となりますので、事前に受付窓口に相談した上で、所定の手続きを行ってください。

(1)統計センターから承諾を得る必要がある場合

次の場合は、再度統計センターの審査を受け、承諾を得る必要があります。「提供依頼申出書の記載事項変更依頼申出書」と、記載事項を修正した「提供依頼申出書」により申出を行います。

  • 匿名データの利用場所、保管場所の変更
  • 匿名データの追加(※別途手数料が必要)
  • 利用者の追加、交代
  • やむを得ない事情による利用期間の延長(※1回限り、最長2年間)

(2)軽微な変更の場合

次の場合は「利用目的、要件に影響を及ぼさない軽微な変更」となりますので、「所属等変更届出書」(様式第9号)により申出を行います。その際、記載事項を修正した「提供依頼申出書」を併せて提出します。

  • 申出者の連絡先、姓、職名、所属(※利用場所も変更となる場合を除く)
  • 利用者の除外
  • 利用者の姓、職名、連絡先の変更
18 利用目的の変更について、当初は「高等教育目的」で匿名データの提供を受けたが、学生の指導が終わったので、利用目的を教員自身の「学術研究目的」に変更し、引き続き利用できますか?

利用目的が異なりますので、「高等教育目的」で提供を受けた匿名データを返却していただき、改めて「学術研究目的」で利用を申請してください。


G.利用終了の手続きについて

19 匿名データの利用報告などをする必要はありますか?

匿名データを利用して行った学術研究の成果又は高等教育の内容は、「提供依頼申出書」に記載した公表時期及び公表方法に基づいて公表してください。

また、統計センターへの報告は、次の手続きにより行ってください。

(1)学術研究目的の場合

当該研究成果の公表がすべて終了した3か月以内に、その公表を含めた成果の概要について「利用実績報告書(学術研究目的関係)」(様式第15-1号)により統計センターに報告してください。

(2)高等教育目的の場合

当該高等教育の終了後3か月以内に、その実施状況について「利用実績報告書(高等教育目的関係)」(様式第15-2号)により統計センターに報告してください。

20 研究成果を発表する際、匿名データの出所について書いておくべきことはありますか?

成果を発表する際には、匿名データを基に申出者が独自に作成・加工した統計である旨を明示し、行政機関等が作成・公表している統計等とは異なることを明らかにする必要があります。

(以下の例文を参照してください。)

例:

統計法に基づいて、独立行政法人統計センターから「平成16年 全国消費実態調査」(総務省)に関する匿名データの提供を受け、独自に作成・加工した統計です。

なお、「利用実績報告書」による報告内容を基に、匿名データを利用された事実が行政機関等から公表されます。

21 利用が終了したら、匿名データはどう扱えばよいでしょうか?
  • PC等に保存した匿名データや中間生成物(匿名データの個々の情報を判別できるもの。)は速やかに消去し、「データ消去報告書」を作成してください。
  • 上記の「データ消去報告書」を添えて、提供された媒体(CD-RまたはDVD-R)を速やかに返却してください。

このページのTOPへ