
地方公共団体などを通じて提出された調査票等の調査書類は、種類・数量を確認し、整理した後、調査票保管室で厳重に管理します。
調査票は、統計作成処理を行うために、OCR(光学式文字読取)装置による画像解析とデータ入力の処理を行います。OCR装置で認識できなかった文字は、コンピュータで検出し、補正処理を行います。
調査票に記入された「事業の内容」、「仕事の種類」や「家計の収入・支出の種類」などの自由記入事項は、統計作成処理ができるように分類基準(産業分類、職業分類、収支項目分類など)に従った符号格付(コーディング)を行います。
複雑多岐にわたる記入内容を数百の分類に当てはめる符号格付は、産業や職業などに関する専門知識と、適合する分類を即座に判断する技能を必要とします。近年は、自動格付(オートコーディング)の研究開発を進め、業務への導入・実用化を進めています。
OCR装置で入力したデータや格付した分類符号を基に、調査票の記入漏れ、記入誤り、記入内容の矛盾などをコンピュータによりチェックし、個々のデータの妥当性を審査します。
個々のデータの欠損や調査項目間のデータ不整合は、作成する統計の品質や信頼性の低下に直結するため、これらを抽出し、論理的・数理的補正を行う、データのいわばクリーニングを行います。
データチェックを終え、クリーニングされたデータをコンピュータにより集計し、結果表を作成します。
集計においては、統計調査ごとに設計した推定方法によるクロスセクション・データの集計のほか、季節調整法を適用した時系列データの集計、多変量解析法による集計、統計精度を推定する誤差集計など、統計理論に基づく各種の集計を行っています。
作成した結果表について、文字や表の様式のほか、統計数値の論理的整合性の検証、過去の数値との時系列検証、関連統計との比較、異常値・特異値の検証など、結果数値の妥当性の審査をさまざまな角度から行い、結果表の品質を保持しています。
作成した結果表は、各種媒体により、総務省統計局その他統計調査を実施した各府省に提出します。