首页 > 热点资讯 >新闻内容

数据脱敏——什么是数据脱敏

2021年06月02日 12:06

一、什么是数据脱敏


数据脱敏(Data Masking),又称数据漂白、数据去隐私化或数据变形。

百度百科对数据脱敏的定义为:指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。在涉及客户安全数据或者一些商业性敏感数据的情况下,在不违反系统规则条件下,对真实数据进行改造并提供测试使用,如身份证号、手机号、卡号、客户号等个人信息都需要进行数据脱敏。

生活中不乏数据脱敏的例子,比如我们最常见的火车票、电商收货人地址都会对敏感信息做处理,甚至女同志较熟悉的美颜、有些视频中的马赛克都属于脱敏。


二、为什么要进行数据脱敏


上面说到,在“涉及客户安全数据或者一些商业性敏感数据的情况下”对数据进行改造,说明我们要进行改造的数据是涉及到用户或者企业数据的安全,进行数据脱敏其实就是对这些数据进行加密,防止泄露。

对于脱敏的程度,一般来说只要处理到无法推断原有的信息,不会造成信息泄露即可,如果修改过多,容易导致丢失数据原有特性。因此,在实际操作中,需要根据实际场景来选择适当的脱敏规则。改姓名,身份证号,地址,手机号,电话号码等几个客户相关字段。

三、如何实现数据脱敏


按照脱敏规则,可以分为可恢复性脱敏和不可恢复性脱敏。可恢复性脱敏就是数据经过脱敏规则的转化后,还再次可以经过某些处理还原出原来的数据,相反,数据经过不可恢复性脱敏之后,将无法还原到原来的样子,可以把二者分别看做可逆加密和不可逆加密。

我们目前遇到的场景是日志脱敏,即在把日志中的密码,甚至姓名、身份证号等信息都进行脱敏处理。

脱敏前:


脱敏后:

如上图,仔细分析会发现,打日志之前,获得脱敏的数据就两个步骤:【拿到要输入的数据(user实体)】→【进行序列化】,所以要进行数据脱敏可以考虑在这两个步骤上进行实现。第一个方法就是在序列化实体之前先把需要脱敏的字段进行处理,之后正常序列化;第二个方法就是在实体序列化的时候,对要脱敏的字段进行处理。


相关推荐

租客惠:付款秒到账,收款不扣点

最近高层举办的企业家座谈会提了个新名词:经济内循环。所以牛市来了,房价被限制了,中小企业融资更简单了,接下来中国要发生的变化与我们每个人息息相关。消费作为经济发展的重要引擎之一,是“经济内循环”不可或缺的动力。这次提出“经济内循环”就是向市场发出信号,促进国民消费势在必行。这是商家们的良好机遇,也是一场艰难挑战。消费增加的同时市场竞争每况愈烈,如果打起了价格战那么商家就算抢占了市场份额,获利也会相应减少。摆在商家面前,尤其是新兴中小商家的问题一箩筐。如何引流?如何宣传?如何抢占市场份额?如何获得更高的利润……进驻互联网团购网站无疑是大多数商家的选择,期冀借助平台多元化的引流手段和平台影响力带动店内销售的增长。而且不仅限于入驻一家网站,还会与很多银行的信用卡合作,让消费者的选择更加宽泛。但与此同时带来的弊端也十分明显。随着团购网站的迅速发展,越来越多的商家进驻团购平台,竞争激烈,商家的低价促销也没有显著效果。并且还要投入大量的成本交纳团购平台的入驻费用,致使商家在团购网站的利润空间越来越小。但是现在的大部分顾客都是到店后使用团购券来付款,平台不仅没有为店里带来额外顾客,还让商家白白损失了大约15%的收入。而商家最畏惧的“差评”问题在团购平台上被无限放大,有的商家稍有闪失或是莫名其妙就被顾客在网站上打了“差评”。而这种负面评价对商家口碑带来非常大的消极影响。尤其是对于餐饮行业来说,不但影响餐厅的打分排名,还会直接导致客流量减少。为了帮助商家走出这样的市场困境,租客网打造的“租客惠”服务项目应运而生。租客惠是租客网旗下一个大型生活消费优惠类服务平台,通过租客网的APP和官网首页帮助商家进行大幅推广,利用平台影响力、自媒体平台矩阵、视频平台矩阵及社群营销等多渠道引流,帮助合作商家免费引流,提高商家的曝光度和知名度。加盟租客惠平台不收取商家的入驻费用,减少商家成本投入,付款秒到账,收款不扣点。租客惠的初心就是帮助商家宣传品牌,提升销量的同时,为租客网本身广大租客提供一个高品质高性价比的优质生活圈,互利共惠。如今租客惠已与众多咖啡厅、健身房、餐厅、KTV等商家合作,已为商家实实在在的扩宽了宣传渠道,带来了清晰可见的盈利增长。

2020年09月08日 10:38

基石药业-B:CS1001 联合含铂化疗抗肿瘤活性优异

5月27日,资本邦获悉,基石药业-B(02616.HK)已于5月26日公布CS1001非小细胞肺癌疗效验证数据和关键性研究进展。公告称,公司将在美国临床肿瘤学会(ASCO)2020年年会上,以摘要的形式公布其PD-L1单克隆抗体CS1001的CS1001-101研究最新数据。有关重点消息包括:更新的数据显示CS1001联合含铂化疗一线治疗晚期非小细胞肺癌(NSCLC),在非鳞NSCLC和鳞状NSCLC两个队列中,客观缓解率(ORR)分别为47.6%和75%;安全性良好,未发生CS1001相关的导致患者退出研究的不良事件。基石药业首席医学官杨建新博士表示:“很高兴的看到CS1001联合含铂化疗显示了优异的抗肿瘤活性和良好的安全性数据,这一最新数据再次支持CS1001联合化疗在晚期一线NSCLC的探索。基石药业目前已经完成了CS1001联合含铂化疗一线治疗晚期NSCLC的三期临床研究的患者招募,预计会在接下来几个月时间公布主要研究结果。值得一提的是这项研究是中国首个同时涵盖鳞状NSCLC和非鳞NSCLC两种亚型的三期一线临床研究。随著Ⅰb期ORR和无进展生存期等数据的完善,我们有信心也非常期待Ⅲ期研究的结果。”资本邦获悉,CS1001-101研究是一项针对晚期实体瘤或淋巴瘤患者开展的旨在评估CS1001的安全性、耐受性、药代动力学特征和抗肿瘤疗效的Ⅰ期研究。在本次ASCO年会上基石药业将发表CS1001-101研究中晚期NSCLCⅠb期队列的疗效验证数据。该队列研究的目的是评估CS1001联合含铂化疗一线治疗NSCLC的疗效和安全性。CS1001是由基石药业开发的在研抗PD-L1单克隆抗体。CS1001由美国公司LigandPharmaceuticalsInc.(LGND.US)授权引进的OMT转基因动物平台产生,该平台可实现全人源抗体的一站式生产。与同类药物相比,CS1001在患者体内产生免疫原性及潜在毒性的风险更低,这使得CS1001在安全性方面具有潜在的独特优势。基石药业是一家生物制药公司,专注于开发及商业化创新肿瘤免疫治疗及精准治疗药物,以满足中国和全球癌症患者的殷切医疗需求。成立于2015年底,基石药业已集结了一支在新药研发、临床研究以及商业化方面拥有丰富经验的世界级管理团队。公司以肿瘤免疫治疗联合疗法为核心,建立了一条15种肿瘤候选药物组成的丰富产品管线。目前五款后期候选药物正处于关键性临床试验。

2020年05月27日 14:03

中小网站SEO优化为什么要尽量避免使用JS ?

做网站的技术人员都知道,js在数据传输,用户交互以及增进页面丰富度上起到了很大的作用,js的功用就是action。但js的主要功能却与搜索引擎索引页面要提供给用户相应信息及满足需求并不太吻合。因为js主要体现在来到页面后的使用体验上。而搜索引擎则主要体现在为用户提供信息,而它能识别的信息目前文字占据绝大部分。不过二者有一个方向是吻合的,那就是满足用户。因此,js的用与不用,使用范围等就与网站本身提供的服务和功能挂钩了。如果是一个提供文字资讯的站点,多余的js是没有必要的,甚至不使用js为更好,或者将其封装起来阻止爬取,只将文本信息留给蜘蛛。js的使用必然会产生页面延迟,过多的交互还有可能导致浏览器运行缓慢甚至崩溃。这都是不好的。这也是技术人员想着力解决的问题,不过因为各种原因总会出现各种bug。针对js做设置能影响网站seo的效果吗?所以无论大小站点,禁止掉对js的爬取,并将这部分数据能以非js的方式向搜索引擎展现出来,对于交互性频繁的网站或网页甚至可以将整个页面对搜索引擎关闭,并制作一套对应的静态页面用以蜘蛛爬取。当用户进入后,采用非作弊手段转向到用户交互页面。不过有的网站本就是一个交互性展示网站,页面用不着去让搜索引擎展示,这就另当别论了,尽可以使用js,只要不影响系统使用就好。js站跟搜索引擎友好站,从本质上就是互相冲突的。robots协议如果重视SEO,就尽可能使用静态页面,主要原因是快。所以在百度mip直接要求不得使用自定义js。仅引入百度提供的js文件,其他家也一样,尤其在移动端对这个的要求更加高。小编记得有人测试过搜索引擎对js代码的爬取,的确能识别一部分了。但不可预知的代码错误导致的蜘蛛漏洞,还是无处不在,这又说到浪费蜘蛛资源以及对蜘蛛不甚友好上去了。因此对于小站点来说能不能可不用。做了这么多小企业站,大站各种滚动,闪动,貌似并不能对seo产生多大价值,当然由于其代码也相对简单,风险也比较小,通常都未做任何处理,而且有时候有意用js阻止一些不必要的抓取。互联网专业开发公司优联互通认为:小站能不用则不用,尤其移动站。说到根本小企业站就是为接业务而存在,也就是说争取信息排名。其他都是虚。信息能满足用户,说服它,并促成成交才是顶重要的。信息站,个人也觉得少用js,除非需靠js实现功能部分,比如添加到收藏,笔记,等等。功能站,一般可用周边信息或者单独一个页面实现SEO目的,另一个实现功能目的,满足用户,比如车贷计算器。而大型站点,其资源雄厚,用户群庞大,他们几乎可以不考虑SEO因素了,他们注重的是用户体验度,用户好才是真的好。

2020年04月04日 11:00