数据交易平台交易规范
一、数据类型规范
1、数据定义
1.1 非个人信息数据(non personal information,non-PII)

以电子或者其他方式记录的无法单独或者与其他信息结合识别特定自然人身份或者反映特定自然人活动情况的各种信息。

1.2 个人信息数据(personal information,PII)

以电子或者其他方式记录的能够单独或者与其他信息结合识别特定自然人身份或者反映特定自然人活动情况的各种信息。

1.3 个人敏感信息数据(personal sensitive information)

一旦泄露、非法提供或滥用可能危害人身和财产安全、极易导致个人名誉、身心健康受到损害或歧视性待遇等的个人信息。

1.4 其他敏感信息数据(other sensitive information)

色情、暴恐、政治人物等数据本身非常敏感,一旦泄漏、非法提供或滥用会违反相应法律法规,给公司带来极大的负面影响的信息。

2、数据示例
针对数据服务业务可能会触及的敏感数据类型,进一步将存在风险隐患的数据类型分为个人身份信息、个人隐私、涉黄、涉暴涉恐、政治敏感、生物特征信息(人像)、生物特征信息(语音未授权)、内容审核、其他敏感、无人驾驶、生物特征信息、生物特征信息(语音有授权)、非敏感数据,总计13个类型。
2.1 个人身份信息:身份证、军官证、护照、驾驶证、工作证、社保卡、居住证等;
2.2 个人隐私:个人不愿为他人(一定范围以外的人)知悉的秘密,与ID结合的健康生理信息(个人因生病医治等产生的相关记录,如病症、住院志、医嘱单、检验报告、手术及麻醉记录、护理记录、用药记录、药物食物过敏信息、生育信息、以往病史、诊治情况、家族病史、现病史、传染病史等,以及与个人身体健康状况产生的相关信息等)、性取向、婚史、宗教信仰、未公开的违法犯罪记录等;
2.3 涉黄数据:包含色情内容的图片、文本、音频、视频等数据内容;
2.4 涉暴涉恐数据:包含恐怖组织、暴力活动、反动、邪教以及其他涉暴涉恐的图片、视频、文本等数据内容;
2.5 政治敏感数据:包含政治人物、煽动民族仇恨、民族歧视、影射领袖等新闻办或公安局禁止宣传的数据内容;
2.6 生物特征信息(人像):人像数据,面部识别特征;
2.7 生物特征信息(语音未授权):未授权语音信息;
2.8 内容审核:所有的图片、文本、音频、视频等产品线/外部委托审核项目;
2.9 其他敏感:

2.9.1 个人联系方式及网络身份标识信息(联系方式、身份标识):个人电话号码、个人邮箱、通讯类账号(QQ、微信号等);

2.9.2 个人在私人网络空间内存储的信息或进行的操作(操作日志):用户在网盘内存储的信息、通信记录和内容(短信、邮件、IM记录)、与ID结合的输入法记录和网页浏览记录等;

2.9.3 个人财产信息(财产信息):与ID结合的银行账号、鉴别信息(口令)、存款信息(包括资金数量、支付收款记录等)、负债信息、房产信息、信贷记录、征信信息、交易和消费记录、流水记录等;

2.9.4 个人地理位置信息(GPS):与ID结合的行踪轨迹、住宿信息等。

2.10 无人驾驶:涉及无人车2D,3D相关所有的标注类型数据;
2.11 生物特征信息:指纹/虹膜/DNA等其他生物特征;
2.12 生物特征信息(语音有授权):已授权语音信息;
2.13 非敏感数据:

2.13.1 以上12项数据类型的脱敏数据可为非敏感数据;

2.13.2 非以上12项类型中的数据可为非敏感数据。

二、采集服务交易规范
数据采集业务能够获取到的数据分为两种:
1、通过任务自动收集到的用户id、日志、GPS等信息
此类数据的收集、使用必须完全遵守平台用户协议与隐私政策
2、根据采集项目要求,有偿收集用户主动自愿提供的符合采集规范的数据
此类数据为供应商受客户委托有偿收集用户提供的数据,因其中会存在用户个人敏感信息和其他敏感信息,因此针对此类情况,供应商数据采集业务须严格遵守以下规范:
2.1 数据范围:包括个人身份信息、个人隐私等两类数据类型的采集规范

2.1.1 个人身份信息 :身份证、军官证、护照、驾驶证、工作证、社保卡、居住证等;

2.1.2 个人隐私:个人不愿为他人(一定范围以外的人)知悉的秘密,与ID结合的健康生理信息(个人因生病医治等产生的相关记录,如病症、住院志、医嘱单、检验报告、手术及麻醉记录、护理记录、用药记录、药物食物过敏信息、生育信息、以往病史、诊治情况、家族病史、现病史、传染病史等,以及与个人身体健康状况产生的相关信息等)、性取向、婚史、宗教信仰、未公开的违法犯罪记录等。

处理原则:拒绝提供此类数据的采集服务
2.2 数据范围:包括生物特征信息(人像)、生物特征信息(语音未授权)、内容审核、其他敏感、无人驾驶、生物特征信息、生物特征信息(语音有授权)等七个数据类型的采集规范

2.2.1 生物特征信息(人像):人像数据,面部识别特征;

2.2.2 生物特征信息(语音未授权):未授权语音信息;

2.2.3 内容审核:所有的图片、文本、音频、视频等审核项目;

2.2.4 其他敏感;

2.2.4.1 个人联系方式及网络身份标识信息(联系方式、身份标识):个人电话号码、个人邮箱、通讯类账号(QQ、微信号等);
2.2.4.2 个人在私人网络空间内存储的信息或进行的操作(操作日志):用户在网盘内存储的信息、通信记录和内容(短信、邮件、IM记录)、与ID结合的输入法记录和网页浏览记录等;
2.2.4.3 个人财产信息(财产信息):与ID结合的银行账号、鉴别信息(口令)、存款信息(包括资金数量、支付收款记录等)、负债信息、房产信息、信贷记录、征信信息、交易和消费记录、流水记录等;
2.2.4.4 个人地理位置信息(GPS):与ID结合的行踪轨迹、住宿信息等。

2.2.5 无人驾驶:涉及无人车2D、3D相关所有的标注类型数据;

2.2.6 生物特征信息:指纹/虹膜/DNA等其他生物特征;

2.2.7 生物特征信息(语音有授权):已授权语音信息。

处理原则:在一定限制条件内提供此类数据的采集服务

(1)商务合同/邮件:商务合同/邮件中明确使用场景与使用方式,禁止客户转售、转让、用于他途等一切超出约定范围的行为;

(2)数据采集:采集时需同步收集用户授权,证明用户本人自愿主动提供数据,供应商需确保数据授权链的形式完整;

(3)数据存储:供应商需在授权有效期截止前完成项目交付并销毁原始数据,不得保存超出有效期的数据;

(4)数据交付:数据交付验收后,供应商和平台方有义务通知客户在授权有效期截止前销毁数据。

2.3 数据范围:包括涉黄、涉暴涉恐、政治敏感等三类数据类型的采集规范

2.3.1 涉黄数据:包含色情内容的图片、文本、音频、视频等数据内容;

2.3.2 涉暴涉恐数据:包含恐怖组织、暴力活动、反动、邪教以及其他涉暴涉恐的图片、视频、文本等数据内容;

2.3.3 政治敏感数据:包含政治人物、煽动民族仇恨、民族歧视、影射领袖等新闻办或公安局禁止宣传的数据内容。

处理原则:每个案例具体评估是否能够提供此类数据的采集服务

(1)客户背景调查:需对客户进行背景调查,必须是专门从事或部分从事黄反/暴恐/政治敏感等智能识别模型研究的公司;

(2)法务风险评估

(3)商务合同/邮件:商务合同/邮件中明确使用场景与使用方式,禁止客户转售、转让、用于他途等一切超出约定范围的行为;

(4)数据采集:采集时需按照法务评估的要求,确保采集目标源合法;

(5)数据存储:供应商需在完成项目交付并销毁原始数据,不得保存此类数据。

(6)数据交付:数据交付验收后,供应商和平台方有义务通知客户在授权有效期截止前销毁数据。

2.4 数据范围:非敏感数据类型的采集规范

2.4.1 以上12项数据类型的脱敏数据可为非敏感数据;

2.4.2 非以上12项类型中的数据可为非敏感数据。

处理原则:在一定限制条件内提供此类数据的采集服务

(1)商务合同/邮件:商务合同/邮件中明确使用场景与使用方式,禁止客户转售、转让、用于他途等一切超出约定范围的行为;

(2)数据交付:数据交付验收后,供应商和平台方有义务通知客户在授权有效期截止前销毁数据。

三、标注服务交易规范
数据标注业务接触到的数据分为两种:
1、通过第三方平台自动收集到的用户id、日志、个人资料等信息
此类数据的收集、使用必须完全遵守平台用户协议与隐私政策
2、标注业务客户提供原始数据,委托供应商对原始数据进行清洗、框选、分类、打标签等加工处理
此类数据为客户提供,供应商需要对数据进行存储、标注,因其中会存在用户个人敏感信息和其他敏感信息,因此针对此类情况,数据标注业务须严格遵守以下规范:
2.1 L4级别敏感信息数据标注规范
数据范围:包括个人身份信息、个人隐私、涉黄、涉暴涉恐、政治敏感等五类数据类型

2.1.1 个人身份信息 :身份证、军官证、护照、驾驶证、工作证、社保卡、居住证等;

2.1.2 个人隐私: 个人不愿为他人(一定范围以外的人)知悉的秘密,与ID结合的健康生理信息(个人因生病医治等产生的相关记录,如病症、住院志、医嘱单、检验报告、手术及麻醉记录、护理记录、用药记录、药物食物过敏信息、生育信息、以往病史、诊治情况、家族病史、现病史、传染病史等,以及与个人身体健康状况产生的相关信息等)、性取向、婚史、宗教信仰、未公开的违法犯罪记录等;

2.1.3 涉黄数据:包含色情内容的图片、文本、音频、视频等数据内容;

2.1.4 涉暴涉恐数据:包含恐怖组织、暴力活动、反动、邪教以及其他涉暴涉恐的图片、视频、文本等数据内容;

2.1.5 政治敏感数据:包含政治人物、煽动民族仇恨、民族歧视、影射领袖等新闻办或公安局禁止宣传的数据内容。

处理原则:在一定限制条件内提供此类数据的标注服务

(1)商务合同/邮件:商务合同/邮件中,需要客户方说明提供的原始数据来源合法有效,拥有数据主体的授权来委托供应商进行数据加工处理;

(2)数据授权:客户提供原始数据时,需提供与原始数据一一对应的用户授权,供应商需对用户授权进行核查确保每份数据均有对应的用户授权;

(3)数据标注:该类数据标注时,需指定有安全保障资质的用户完成,需严格控制标注员的操作规范,禁止一切将数据流出的行为(包括不限于网络传输、拷贝、拍照等);

(4)数据交付:数据交付验收后,供应商需销毁原始数据,不得保存该数据。

2.2 L3级别敏感信息数据标注规范
数据范围:包括生物特征信息(人像)、生物特征信息(语音未授权)、内容审核、其他敏感等四个数据类型

2.2.1 生物特征信息(人像):人像数据,面部识别特征;

2.2.2 生物特征信息(语音未授权):未授权语音信息;

2.2.3 内容审核:所有的图片、文本、音频、视频等审核项目;

2.2.4 其他敏感:

2.2.4.1 个人联系方式及网络身份标识信息(联系方式、身份标识):个人电话号码、个人邮箱、通讯类账号(QQ、微信号等);
2.2.4.2 个人在私人网络空间内存储的信息或进行的操作(操作日志):用户在网盘内存储的信息、通信记录和内容(短信、邮件、IM记录)、与ID结合的输入法记录和网页浏览记录等;
2.2.4.3 个人财产信息(财产信息):与ID结合的银行账号、鉴别信息(口令)、存款信息(包括资金数量、支付收款记录等)、负债信息、房产信息、信贷记录、征信信息、交易和消费记录、流水记录等;
2.2.4.4 个人地理位置信息(GPS):与ID结合的行踪轨迹、住宿信息等。
处理原则:在一定限制条件内提供此类数据的标注服务

(1)商务合同/邮件:商务合同/邮件中,需要客户方说明提供的原始数据来源合法有效,拥有数据主体的授权来委托供应商进行数据加工处理;

(2)数据授权:客户提供原始数据时,需提供与原始数据一一对应的用户授权,供应商需对用户授权进行核查确保每份数据均有对应的用户授权;

(3)数据交付:数据交付验收后,供应商需销毁原始数据,不得保存该数据。

2.3 L2级别敏感信息数据标注规范
数据范围:包括无人驾驶、生物特征信息、生物特征信息(语音有授权)等三个数据类型

2.3.1 无人驾驶:涉及无人车2D、3D相关所有的标注类型数据;

2.3.2 生物特征信息:指纹/虹膜/DNA等其他生物特征;

2.3.3 生物特征信息(语音有授权):已授权语音信息。

处理原则:在一定限制条件内提供此类数据的标注服务

(1)商务合同/邮件:商务合同/邮件中,需要客户方说明提供的原始数据来源合法有效,拥有数据主体的授权来委托供应商进行数据加工处理;供应商无须逐一核查授权;

(2)数据授权:客户提供原始数据时,需提供与原始数据一一对应的用户授权,供应商需对用户授权进行核查确保每份数据均有对应的用户授权;

(3)数据交付:数据交付验收后,供应商需销毁原始数据,不得保存该数据。

2.4 L1级别敏感信息数据标注规范
数据范围:包括非敏感数据等一个数据类型

2.4.1 以上12项数据类型的脱敏数据可为非敏感数据;

2.4.2 非以上12项类型中的数据可为非敏感数据。

处理原则:在一定限制条件内提供此类数据的标注服务

(1)商务合同/邮件:商务合同/邮件中,需要客户方说明提供的原始数据来源合法有效,拥有数据主体的授权来委托供应商进行数据加工处理;供应商无须逐一核查授权;

(2)数据交付:数据交付验收后,供应商需销毁原始数据,不得保存该数据。