公的統計の二次的利用サービス

匿名データの利用に関するFAQ(回答)

A. 匿名データについて

1 匿名データとはどういったものでしょうか?

行政機関等が行う統計調査の「調査票情報」を加工して、特定の個人又は法人その他の団体の識別(他の情報との照合による識別を含む。)ができないようにしたものです。

2 現在、統計センターで利用できる匿名データはどの統計調査のものでしょうか?

行政機関からの委託により、現在、統計センターが提供している匿名データの一覧は、「利用可能な統計調査 」をご覧ください。

3 匿名データは、どのようなファイル構成となっていますか?

統計調査ごとの年次別ファイルとなっていますが、一部の統計調査ではさらに細分されているものがあります。

例えば、就業構造基本調査の匿名データは、平成4年、9年、14年、19年、24年、29年の六つの年次にファイルが分かれています。

なお、社会生活基本調査の匿名データは、平成3年、8年は「生活時間編」と「生活行動編」の二つのファイルに分れていて、平成13年以降は「調査票A(生活時間編)」、「調査票A(生活行動編)」及び「調査票B(生活時間編)」の三つのファイルに分かれているなど、同じ統計調査でも年次によってファイル構成が異なるものもあります。

4 匿名データは具体的にどのような加工(匿名化措置)がされているのでしょうか?

総務省が所管する統計調査の匿名データでは、次のような措置が行われています。

匿名化措置 匿名化措置の内容(※)
データのリサンプリング 統計調査の調査票のレコードのすべてを用いず、一部を抽出する。
識別情報の削除等 ・調査区番号や調査区内連番など、調査客体を直接識別できる情報をすべて削除する。
・データの配列順が意味をなさないよう、無作為に並べ替え。
特異なデータの削除 特徴的な値を持つデータは削除する。
例:世帯人員が8人以上となる世帯のデータを削除する。
トップコーディング
(ボトムコーディング)
極端に大きな値は、上限値を設ける。
(極端に小さな値は、下限値を設ける。)
例:年齢を「85歳以上」(「15歳未満」)でまとめる。
リコーディング 分類事項の程度は、詳細なものではなく、粗いものにする。
例:年齢を「5歳階級」ごとにまとめる。
スワッピング
(国勢調査のみ)
一部のレコードを他の類似したレコードと入れ替える。

※ 匿名化措置の具体的な内容は、統計調査ごとに異なりますのでご注意ください。

5 匿名データのデータ形式等を教えてください。

データ形式等の概要は次のとおりです。

文字コード Shift_JIS(漢字、カタカナは使用していない)
改行コード CRLF
ファイル形式 カンマ区切り形式(CSV形式)

6 匿名データを利用するに当たり、参照すべき資料はありますか?

まず、基となった統計調査を実施した行政機関から提供されている調査報告書やウェブサイトの資料を参照し、統計調査の方法や調査票の様式、用語や分類の定義、集計結果などを確認してください。

統計調査のウェブサイトは、「匿名データの利用」のページから該当の調査をクリックし、そのページの「調査の概要」欄のリンクから参照できます。

また、匿名データとして利用可能な変数項目も確認してください。各匿名データのページから「データレイアウト及び符号表」や「項目名一覧」を参照できます。

なお、統計調査及び匿名データのいずれの資料も、年次によって内容が異なる場合がありますので、利用したい匿名データに対応した年次の資料をご覧ください。

7 符号表に「△」などの2バイト文字がありましたが、データ内に2バイト文字があるのでしょうか?

符号表の備考・補足事項に記載がありますが、「△」は符号表の表示上の表記で、データ上は半角ブランク(空白)となり、データ内に全角(2バイト)文字は含まれておりません。

B.利用相談・申出書の提出について

1 利用者に制限(利用要件)があるのでしょうか?


匿名データは、①学術研究、②教育、③国際比較統計利活用事業、④デジタル社会形成統計利活用事業の発展に資すると認める場合であって、以下の要件をすべて満たす場合に、提供可能となります。

  • 学術研究又は教育の用に供することを直接の目的とするものであること。(①又は②)
  • 国際社会における我が国の利益の増進及び国際経済社会の健全な発展に資すると認められるものであること。(③)
  • デジタル社会形成統計利活用事業を推進する目的で国民経済の健全な発展又は国民生活の向上に寄与すると認められるものであること。(④)
  • 匿名データを利用して行った学術研究の成果、教育・事業の内容が公表され、社会に還元されること。
  • 個人及び法人の権利利益、国の安全等を害するおそれがないこと。
  • 匿名データを適正に管理するために必要な措置が講じられていること。
  • 法令で定める欠格事由に該当しないこと。

2 利用申出はどのように行うのでしょうか?

実際に利用申請される前に、「匿名データの利用」の「利用に当たっての留意事項」から「利用の手引」をダウンロードしていだだき、必ず一読してください。その上で、次の受付窓口で利用相談を行ってください。

<受付窓口>

  • (独)統計センター 統計技術・提供部 統計情報提供課 利用審査係
  • TEL: 03-5273-1205
  • MAIL: nijiriyou_atmark_nstac.go.jp ※「_atmark_」を「@」に置き換えて送信してください。
  • 所在地: 〒162-8668 東京都新宿区若松町19-1 総務省第2庁舎
    (来訪される場合は入館手続等が必要になりますので、事前に窓口までご連絡ください)
  • 提供申出書の受付期間: 通年(土、日、祝日、年末年始の期間を除く)
  • 受付時間: 10:00~17:00(12:00~13:00を除く)

また次の機関でも、受付業務を行っています。

一橋大学
経済研究所附属社会科学統計情報研究センター ミクロデータ分析セクション
神戸大学
大学院経済学研究科研究助成室 データ管理室担当
情報・システム研究機構
データサイエンス共同利用基盤施設
社会データ構造化センター オンサイト解析室

※申出受付期間:4月1日~2月末日

3 これから開始する研究の場合、提供申出書に記載する内容についてはどの程度記載すればよろしいでしょうか?

申請時における計画の内容で差し支えございません。

提供申出書に記載していただいた利用目的や研究内容に変更がなければ、学術研究の名称などは当初の名称から変更になることは問題ありません。

また、研究実施期間・公表先などにつきましては、現段階で想定している研究計画・公表先などを記載してください。研究遂行中に記載されている実施計画が変更になるようであれば、窓口にご相談ください。

一方で、利用目的・研究内容については、匿名データが必要な事由でございますので、なぜ匿名データがこれから実施する研究に必要かがわかるように記載をお願いいたします。なお、利用目的・研究内容は研究遂行中に大幅な修正をすることは原則認められませんのでご留意ください。

4 匿名データの利用は有償でしょうか?

有償です。申出1件につき、以下の(1)~(4)を合算した金額が必要となります。

(1)事務手数料 1,950円
(2)匿名データの提供ファイル数
※ 統計調査ごとにファイル数は異なります。
4,450円 × ファイル数
(3)格納する媒体の料金
※ 原則として、媒体1枚につき1ファイルのデータを収録。
CD-Rの場合 100円 × 必要枚数(ファイル数)
DVD-Rの場合 120円 × 必要枚数(ファイル数)
(4) 書留等料金(郵送で受け取る場合)
※ 窓口で本人確認を終えている場合は、郵送での受け取りが可能。
日本国内の場合は本人限定受取郵便(特定型)、日本国外の場合は原則として国際スピード郵便(EMS)、EMSに対応していない国は追跡可能な郵送方法とする。

(例1)全国消費実態調査の六つの年次を1ファイルずつCD-Rで利用したい場合

→年次ごとにファイルが分かれているため、ファイル数は「6」となります。

  • 事務手数料 1,950円
  • ファイル数 4,450円×6ファイル=26,700円
  • CD-R  100円×6枚=600円

計29,250円

(例2)社会生活基本調査の「調査票A」の生活時間編と生活行動編について、平成13年、18年、23年及び28年を1ファイルずつDVD-Rで利用したい場合

→「生活時間編」と「生活行動編」ごと、四つの年次ごとにファイルが分かれているので、ファイル数は「8」となります。

  • 事務手数料 1,950円
  • ファイル数 4,450円×8ファイル=35,600円
  • DVD-R 120円×8枚=960円

計38,510円

5 匿名データの利用期間はいつまででしょうか?

統計センターが提供を行っている匿名データの利用期間は、最大で3年間を限度とし、目的内容から見て必要最小限の期間のみ、利用することができます。

なお、利用期間中、やむを得ない事情がある場合、延長の申出をすることができますが、この申出は1回のみで、延長期間は最大で2年間を限度とします。利用期間延長による追加費用はありません。

6 他の研究者との共同研究や、学生達への教材等、複数人で匿名データを利用することはできますか?

複数の利用者が1件の匿名データファイルを共同又は別の電子計算機(外付けの外部記憶装置、DVD-RW等の媒体を含む。)に複写して利用することも可能ですが、提供を受けた匿名データの複製は、1ファイルにつき複製権限のある一人にしか認められません。

利用者ごとの複製権限の有無及び複製回数は「管理簿」に記載します。

複製権限を有する者から複製データの提供を受けた利用者が、複製データファイルを別の電子計算機に複写する場合、同時期に複製するファイルは一つのみとし、当該電子計算機の保存・複製ファイルが消去されない限り、別の電子計算機への保存・複製は認められません。匿名データの加工又は集計により作成した中間生成物についても、匿名データの取扱いに準ずるものとします。

なお、「匿名データの提供申出書」に記載した利用場所及び利用者の範囲以外の利用は認められません。

7 海外でも利用可能でしょうか?

利用は可能ですが、匿名データの安全性を確保するため、以下の要件のいずれかを満たす必要があります。

なお、利用相談や利用申出の手続きは日本語で行います。

  • 2以上の外国政府等から調査票情報等の提供を受け、かつ、公的機関若しくは1以上の外国政府等から職員の派遣、資金の提供等の支援を受けており、かつ、上記提供及び支援を直近過去5年間継続して受けている場合。
  • 我が国の職員が申出者の属する機関に出向しており、当該職員に匿名データの利用状況を確認してもらえるよう、統計センターが依頼を行うことが可能であり、当該職員が利用状況の確認を行う旨の承諾書を、申出に必要な書類の提出時に併せて提出できる場合。
  • 匿名データの提供を受けた者又は法人その他の団体職員が、匿名データの利用期間中に統計センターへ来訪し、当該来訪時に利用状況のヒアリングを受けられる場合。
  • 過去に匿名データを利用したことがあり、匿名データを取り扱う者、匿名データの利用場所、利用する環境、保管場所及び管理方法が同一とみなせる場合であって、メール等により統計センターが利用状況等のヒアリングを行うことができる場合。

8 デジタル社会形成統計利活用事業とは、どういうものなのでしょうか?

デジタル社会形成基本法(令和3年法律第35号)第38条第2項第13号に規定する特定公共分野に関する統計表の作成等であって、国民経済の健全な発展又は国民生活の向上に寄与すると認められる行為をいいます。

特定公共分野については、令和4年7月現在、「健康・医療・介護」、「教育」、「防災」、「こども」、「モビリティ」、「農林水産業・食関連産業」、「港湾(港湾物流分野)」、「インフラ」、「取引(受発注・請求・決済)」、「スマートシティ」の10分野が指定されています。(「デジタル社会の実現に向けた重点計画」令和4年(2022年)6月7日閣議決定)

C. 利用中の手続き等について

1 利用者の所属や利用場所、利用期間などを変更したい場合や、利用者を追加したい場合などの際には、どのような手続きが必要でしょうか?

「提供申出書」に係る記載事項について、申出者の都合により変更が生じる場合は、変更内容に応じた申出手続を速やかに行う必要がありますので、事前に受付窓口に相談した上で、所定の手続きを行ってください。

(1)統計センターから承諾を得る必要がある場合

次の場合は、再度統計センターの審査を受け、承諾を得る必要があります。「提供申出書の記載事項変更申出書」と、記載事項を修正した「匿名データの提供申出書」により申出を行います。

  • 匿名データの利用場所、保管場所の変更
  • 匿名データの年次追加(※1回限り。別途手数料が必要。)
  • 利用目的の追加
  • 利用者の追加、交代
  • やむを得ない事情による利用期間の延長(※1回限り、最長2年間)

(2)軽微な変更の場合

次の場合は「利用目的、要件に影響を及ぼさない軽微な変更」となりますので、所属等変更届出書により届け出ます。その際、記載事項を修正した「匿名データの提供申出書」(様式は当初申出時の様式)を併せて提出します。

  • 申出者の連絡先、姓、職名、所属(※利用場所も変更となる場合を除く)
  • 利用者の姓、職名、連絡先の変更

(3)利用者の除外

統計センターの承諾は必要ありませんが、提供申出書の記載事項変更申出書と、記載事項を修正した「匿名データの提供申出書」(様式は当初申出時の様式)により申出を行います。

2 利用者を追加したいのですが、すでに提供を受けているデータを複写して利用させてもよいでしょうか?

提供申出書に記載のある利用者に複製する場合においては、複製権限のある方が提供を受けているデータを複製し、追加された利用者へ送付の上、利用していただいて構いません。なお、データの受け渡しは、普通郵便ではなく、手渡しや本人限定郵便での郵送など物理的に安全な方法で渡してください。

その際、「管理簿」に追加された利用者の利用状況も追記して記録を行ってください。

提供申出書に記載がない利用者を追加したい場合には、初めに、C-1(1)統計センターから承諾を得る必要がある場合の手続きを行ってください。なお、「提供申出書」に記載の利用者以外の利用は不適切利用にあたり、違反行為となり、利用停止の措置を受ける場合がありますので、ご注意ください。

3 利用目的の変更について、当初は「高等教育目的」で匿名データの提供を受けたが、学生の指導が終わったので、利用目的を教員自身の「学術研究目的」に変更し、引き続き利用できますか?

利用目的の追加として、C-1(1)統計センターから承諾を得る必要がある場合に記載の手続きを行うことで引き続き利用可能です。なお、当初の申出時において、あらかじめ想定している利用目的については、可能な限りすべて記載して申請してください。また、「提供申出書」に記載の利用目的以外の利用は不適切利用にあたり、違反行為となり、利用停止の措置を受ける場合がありますので、ご注意ください。

4 当初の申出では、研究の内容を出版することについて想定していませんでしたが、出版する可能性が出てきました。提供申出書には記載していませんでしたが、それは可能でしょうか?

提供申出書に記載のない目的の利用は禁止されているため、出版できません。しかし、記載事項変更手続きを行い、利用目的の追加手続きを行えば、営利目的での副次的な利用も可能となります。ただし、営利目的の利用は、提供申出書に記載された利用目的による成果等の公表後に行われることが必要となりますので、ご注意ください。

D. 利用時の適正管理について

1 「管理簿」とは何でしょうか?

令和元年5月の改正統計法施行により、利用者には匿名データの適正管理義務が課せられており、利用する人数の多寡に関わりなく「管理簿」を用いてデータの管理をすることが定められました。

「B-6 他の研究者との共同研究や、学生達への教材等、複数人で匿名データを利用することはできますか?」の質問に記載のとおり、複数人で匿名データを利用することが可能となりましたが、複製データは、あらかじめ「提供申出書」に記載された利用者が、記載の利用場所で適切にご利用いただく必要があります。

そのため、 「管理簿」は、利用相談の段階で作成いただき、匿名データの受領後3カ月以内にご提出いただくほか、利用期間終了時などにご提出いただく書類となりますので、利用状況について適切に記載をお願いします。

「管理簿」の記入に当たっては、次の点に留意してください。

  • 「管理簿」によるデータ管理に当たり、複数人で利用する場合は、データ1枚につき一人を他の利用者のための複製権限を有する者(管理責任者)に指定し、「管理簿」の「2.利用者の範囲 匿名データに関する権限」の「複製」欄に「有」を記載してください。
  • 「3. 利用状況 複製年月日」は、他の利用者に提供するためではなく、自身で利用するために、電子計算機等への複製を行った日付を記載します。この場合、同時期に複製するファイルは一つのみとし、当該電子計算機の保存・複製ファイルが消去されない限り、別の電子計算機への保存・複製は認められません。
  • 複製データを受け取った利用者は、受け取った日やデータ・機器等を削除/廃棄した日などの利用者ごとの利用状況を「管理簿」に記録する必要があります。

2 複製はどのように行えばよいでしょうか?

複製権限のある者から他の利用者に複製データを提供する際は、直接の受け渡し又は本人限定受取郵便による送付など利用者本人が確実に受け取れる方法により行ってください。共有サーバに匿名データを複製し、当該サーバから各利用者が複製を行う方法や電子メールによる送付は認められません。

3 学生に利用させる場合、保管・管理は学生自身が行っても構いませんか?

教育を目的とする場合、保管・管理は教育責任者(教員)が行ってください。学生には保管・管理させないでください。

4 匿名データを利用する場所等の制限はありますか?

データの適正管理義務が課せられることから、以下の要件を満たす必要があります。

① 匿名データの利用場所(匿名データファイルの保管を含む)は、施錠可能な物理的な場所に限定されるとともに、匿名データの利用時、その利用場所に存在する者が制限される、又は何らかの確認行為が行われるなど、利用場所への入退室管理が行われること。

② 匿名データが限定された媒体に格納され、当該媒体が施錠可能なキャビネット等に保管されること。また、匿名データを利用する電子計算機がワイヤー等で固定されること。さらに、利用場所から匿名データが不正に持ち出されないための保安対策が図られていること。

5 匿名データを利用するPC等についての制限はありますか?

データの適正管理義務が課せられることから、以下の要件を満たす必要があります。

① 複製した匿名データ及び集計作業等によって生成される中間生成物の削除、匿名データ等が記録された機器等の廃棄は、復元不可能な手段で行うこと。

② 匿名データを使用する情報システムに識別及び主体認証対策、スクリーンロック等の不正操作対策が図られ、利用者以外の者が匿名データ及び中間生成物を保管している電子計算機にアクセスできないこと。

③ 匿名データを使用する情報システムに、コンピュータウイルス対策、セキュリティホール対策等の不正アクセス行為防止措置が図られていること。

④ 外部ネットワークに接続する可能性のある電子計算機や利用者以外の者が使用する電子計算機を利用する場合は、オフラインで集計作業等を行い、作業後は当該電子計算機に匿名データ及び中間生成物を残留させない、ダウンロードやアップロードの監視を行うなど、匿名データ及び中間生成物(廃棄物含む)の漏えい等事故を防止するための措置が行われること。

6 法人が利用申出を行った場合に、適正管理義務はどのように課せられるのでしょうか?

公的機関等又は法人等の組織として利用する際の適正管理義務は、以下のように定められています。

  • 匿名データの適正管理に係る基本方針を定めること。当該基本方針には、匿名データの適正管理に関する考え方、関係法令や規程等を遵守することなどを盛り込むこと。(公的機関等を除く。)
  • 匿名データの適正管理に関する措置の内容を盛り込んだ規程(※)を策定し、匿名データを取扱う者に周知徹底すること。(※既存の規程にこれらの要素が含まれる場合は、当該規程を準用することも可能とする。)
  • 上記規程に基づき匿名データの適正管理を実施すること。さらに、その実施状況について把握・分析の上評価し、必要な改善を行うこと。
  • 匿名データの漏えい、滅失又は毀損の発生時における事務処理体制を整備すること。
  • 匿名データを取り扱う者に対し、関係法令や規程等の内容、研究倫理等について適切な教育及び訓練を行うこと。

E. 研究成果・教育・事業の内容の公表について

1 研究成果を発表する際、匿名データの出所について書いておくべきことはありますか?

成果を発表する際には、匿名データを基に申出者が独自に作成・加工した統計である旨を明示し、行政機関等が作成・公表している統計等とは異なることを明らかにする必要があります。

(以下の例文を参照してください。)

例:
統計法に基づいて、独立行政法人統計センターから「平成26年 全国消費実態調査」(総務省)に関する匿名データの提供を受け、独自に作成・加工した統計です。

なお、「報告書」による報告内容を基に、提出された統計又は統計的研究の成果等がミクロデータ利用ポータルサイト【miripo】で公表されます。

2 報告書の提出後、集計結果を基に再度、研究・公表を行いたいと考えていますが、統計センターへ承諾を得る必要はありますか?

既に作成された分析結果をもとに、新たな論文などを作成された場合は、統計センターへ公表についての承諾を得る必要はありません。なお、公表の際は「E-1 研究成果を発表する際、匿名データの出所について書いておくべきことはありますか?」も参照してください。

F. 利用終了後について

1 利用が終了したら、匿名データはどう扱えばよいでしょうか?

統計センターから提供を受けた媒体はすべて返却してください。

PCや外部記憶装置,CD-R等に複製した 匿名データや中間生成物(匿名データの個々の情報を判別できるもの。)は速やかに削除/廃棄し、「報告書」を作成してください。また、「管理簿」に複製を行ったデータについて、利用者全員分の消去した日を記載してください。

2 匿名データの利用終了時にはどのような手続きを行えばよいでしょうか?また、利用報告などをする必要はありますか?

「提供申出書」に記載の匿名データ利用期間終了日の約1か月前に返却/延長(1回限り)について、統計センターから連絡します。返却することとなりましたら、以下の手続きをお願いします。

  • (1)匿名データの返却
     集計等のためにハードディスク等の記憶装置に保存、もしくは紙媒体等に出力した匿名データ及び中間生成物について、専用ソフトを用いるなどして復元できないように削除/破棄した上で、提供されたすべての匿名データを統計センターに返却します。その際、適切に削除/破棄が行われたことを「報告書」に記載してください。
  • (2)「報告書」、「管理簿」の提出
     匿名データの返却と併せて「作成した統計又は統計的研究の成果」、「報告書」、「管理簿」を提出します。利用期間終了時点で成果の公表が終わっていない場合は、「報告書」に今後の見通しを記載の上、「管理簿」とともに提出します。成果の公表後に、作成した統計又は統計的研究の成果と併せて「報告書」を再度提出します。また、法人組織の解散、研究計画の中止など真にやむを得ない事情により研究成果や教育・事業内容の実績が示せない場合も、「報告書」にその理由を記載して、「管理簿」とともに提出します。