身份证号、家庭住址、投诉材料……到底什么才算隐私泄露?又该怎么防?
政府网站上发现了个人隐私信息,算不算泄露?该谁负责?最近这类问题被问到的次数,明显多了。
原因不复杂:一方面《个人信息保护法》落地后监管越来越严,网信办常态化开展隐私信息巡检和通报;另一方面,政府网站公示公告体量庞大,哪些能公开、哪些不能,不少工作人员其实心里没底。
最常见的误区是:一看到网页上有手机号,就觉得是隐私泄露。其实不是这么回事。
先说不算泄露的情况。
政府网站、招投标平台上公示的业务咨询电话、官方办事联络号码、统一举报热线——这些是履职需要公开的信息,单独展示一条联系方式,不属于隐私泄露。
这个界限,得先搞清楚。不然自己吓自己,什么事都干不成。
那什么才算?
根据《个人信息保护法》,身份证号、银行卡号、家庭住址、手机号码、个人疾病与用药信息、群众投诉举报材料、公民犯罪记录——这些全部属于受法律保护的个人隐私。
注意,这里有个关键词:"批量"。
判定隐私泄露的核心条件,是网页、附件或压缩包内,大批量集中公示多名普通公民的完整隐私数据。零星的、履职必须的公开信息,不在此列。
真实案例
一份公示附件里,包含了32条人员隐私信息,身份证号、手机号一字排开;另一份文档,检出了914条身份证数据;还有一个压缩包,里面是多份人员花名册,上千条隐私信息集中在里面——这种,才是真正要命的。
这些案例的共同点:不是一条两条,而是批量;不是履职必须的公开,而是把普通公民的敏感信息直接摊开。
说几个最常见的场景,你可能觉得眼熟。
1.网页正文直接展示
公示公告、中标结果、人员名单——隐私信息直接写在网页里,搜索引擎一收录,谁都能查到。
2.独立附件里藏着
网页本身没问题,但附了一个Word或Excel,里面完整记录了几百人的身份证号、手机号、家庭住址。
3.压缩包嵌套多层
最隐蔽的一种。隐私数据藏在压缩包里,压缩包里还有子文件夹、多份表格——人工几乎不可能逐一排查。
4.群众诉求材料被公开
投诉举报信、困难群众申请材料,附带了详细住址、联系方式、甚至个人病史——这类材料本不该完整对外公示。
这些隐私一旦流出,后果是真实的。
住址、证件号、银行卡信息落入不法分子手中,电信诈骗、个人信息冒用就有了可乘之机。更严重的是,如果举报人的信息被完整公开,还可能引发打击报复。
这也是为什么,网信办会常态化开展隐私信息巡检和通报——隐私保护,已经不是"注意一下"的事,而是硬要求。
场景说完了,问题也清楚了。但摆在眼前一个很现实的事是:知道有风险,和能把风险找出来,是两回事。
政府网站少则几百个页面,多则几千个,附件、压缩包更不知道有多少。一页页翻、一个包一个包解压——这不现实。
人工排查有两个致命问题:第一,覆盖不到——压缩包里的子文件、多份嵌套表格,人工很难逐一检查;第二,持续不了——今天查完了,明天新上传的文件呢?后天呢?
所以,技术工具的价值就在这里:做人工做不到的事,做人工做不完的事。
说到这里,讲讲我们这套检测。它和普通的"关键词搜索"不太一样,检测深度和覆盖范围要广得多
具体说,有这几个核心能力:
很多隐私泄露,其实不在网页正文里,而在附件里。
普通检测工具只能扫网页文字,附件直接跳过。但我们的系统,网页正文和各类独立附件文件,全部支持检测。
Excel、Word、PDF——不管隐私信息写在哪里,系统都能识别出来。
这是最关键的一个能力。
现实中最常见的泄露场景,就是压缩包。一个包里塞了多份表格、多个子文件夹,人工排查几乎不可能。
但系统可以自动解压,逐文件读取。压缩包里所有子文件、多份表格,全部逐一扫描,不会漏掉任何一层。
检测出隐私信息,只是第一步。精准标记风险位置、统计泄露条数,才是真正能帮到工作人员的。
系统会自动标注:哪份附件有问题、泄露了几条、具体在文件的什么位置——不用你自己去数、去找。
多份附件的风险数据量,系统也会分别统计。比如压缩包检出51处,其中附件A有3处、附件B有48处——区分清楚,整改时才知道先改哪份。
系统会把检测结果分成两类:
1.网页直接展示的隐私信息
隐私数据直接写在网页正文里,搜索引擎可以收录,风险最高,需要优先处置。
2.隐私数据藏在附件、压缩包内
网页本身没问题,但附件或压缩包里有隐私——这类需要逐份检查、脱敏处理后重新上传。
两类场景,系统都能识别。区分开来,整改时才能对症下药。
检测出问题,只是第一步。整改确认、复检闭环,才是这件事真正落地的地方。
系统的工作流程是这样的:
1.自动巡检
7×24小时全站扫描,包括网页正文和所有附件。新上传的内容第一时间被检测,不会等你去发现。
2.分级告警
个人隐私泄露属于紧急问题,系统检测到后会优先触发运维人员处理——不是等邮件,是第一时间响应。
3.整改复检
工作人员修复之后,系统自动复检,确认问题真的解决了才闭环销号。每一个漏洞都有迹可循、有人负责。
说到底,隐私保护这件事,核心不是"能不能公示",而是知道什么能公示、什么不能,并且在平时就有人帮着盯着。
政务公开和保障个人隐私,并不是对立的关系。在满足公示要求的同时做好隐私保护,这件事本身就是政务数字化的一部分。
这几年,政府网站普查、网站监测的要求越来越严,隐私保护已经成为一项硬指标。靠人工翻页、靠自觉自查,已经远远不够了。
用对的工具,做对的事。既是保护老百姓的隐私,也是保护政府工作人员自己。
这,才是以人民为中心的数字化。