作者：彭文华

先分类还是先分级？

一般来说，数据分类、分级会在两个领域出现，一个是数据资产目录建设，一个是数据安全管控。

数据资产目录这边偏分类多一些，因为数据资产太多了，需要归归堆，没有一个树形的目录体系，根本没办法查找。

当然，树形目录的弊端也很多，比如查找困难等。所以现在又出现了多分类、标签等方法，辅助进行数据资源的检索。

数据安全管控的方式一般是针对不同级别的数据，施行对应的管控手段，限制人数、可访问范围，所以安全这边主要是数据的分级。

比如《工业数据分类分级指南（试行）》把数据分为一、二、三级，也就是一般、重要、核心数据。《基础电信企业数据分类分级方法》中按重要敏感程度，把数据分为第四级、第三级、第二级、第一级，大概意思就是高敏感、敏感、不敏感、公开。

所以，分类和分级，是两个工作。根据其目的，侧重点不一样，先做那个，取决于当前主推那个任务。

从老彭参与的项目上来看，一般来说，先做数据盘点，整理数据资产目录的较多。也就是先进行数据分类的情况较多。

数据分类案例

上篇讲到，数据分类主要有线分类法、面分类法和混合分类法三种。但是线分法和面分法都有其局限性，所以我们常见的数据分类，还是采用折中的混合分类法较多。

同时，数据分类跟行业属性、业务也有非常大的关系。

以政务数据分类为例，《贵州省政务数据分类分级指南》中建议政务数据可以采用主题分类、行业分类和服务分类三种分类方法。

本标准采用多维度和线分类法相结合的方法，在主题、行业和服务三个维度对贵州省政府数据进行分类，对于每个维度采用线分类法将其分为大类、中类和小类三级。业务部门可以根据业务需要，对数据分类进行小类之后的细分。对小类的细分，各部门可以根据业务数据的性质、功能、技术手段等一系列问题进行扩展细分。本标准采用面分类法将政府数据按照多个维度进行关键词的标签构造。

按主题分类的方法，可将贵州省政府数据分为以下大类：综合政务、经济管理、国土资源、能源、工业、交通、邮政、信息产业、城乡建设、环境保护、农业、水利、财政、商业、贸易、旅游、服务业、气象、水文、测绘、地震、对外事务、政法、监察、科技、教育、文化、卫生、体育、军事、国防、劳动、人事、民政、社区、文秘、行政、综合党团。

按行业分类的方法，则将贵州省政府数据分为以下大类：农、林、牧、渔业；采矿业；制造业；电力、热力、燃气及水生产和供应业；建筑业；批发和零售业；交通运输、仓储和邮政业；住宿和餐饮业；信息传输、软件和信息技术服务业；金融业；房地产业；租赁和商务服务业；科学研究和技术服务业；水利、环境和公共设施管理业；居民服务、修理和其他服务业；教育；卫生和社会工作；文化、体育和娱乐业；公共管理、社会保障和社会组织；国际组织。

以电信数据分类为例，《基础电信数据分类分级方法》中主要采用线分类的方法，对电信数据进行完整的分类。

根据基础电信企业业务运营特点和企业内部管理方法，收集企业内所有部门的数据资源，梳理所有数据资源。按照线分类法，按照业务属性（或特征），将基础电信企业数据分为若干数据大类，然后按照大类内部的数据隶属逻辑关系，将每个大类的数据分为若干层级，每个层级分为若干子类，同一分支的同层级子类之间构成并列关系，不同层级子类之间构成隶属关系。所有数据类及数据子类构成数据资源目录树，如图1所示。目录树的所有叶子节点是最小数据类。最小数据类是指属性（或特征）相同或 相似的一组数据。