ASO114

APP反作弊之算算账(一)

小湿妹 • 1年前发布

\

这篇是基于成本考量的分享内容——关于效果与成本兼顾的APP反作弊策略分享。

APP反作弊是一个实践性很强的业务。在现实的环境中,没有绝对有效的反作弊方法,这里有一个核心底线,就是成本。

你要投入的成本跟收获的价值相比,合算吗?毕竟这是一个生意,而不是一个学识研究,或探究真理。

说到底,反作弊最后算的还是经济账,是一个效率问题。

量江湖在实践中摸索出一套经济高效的反作弊策略。关于高效,大家已经比较清楚了,我们现在回答另外一个问题——如何做到经济的。

针对行业现状,量江湖的反作弊处理策略是:

1) 锚定原点:数字DNA指纹技术,标识硬件设备,是构成量江湖整套作弊防护体系中的参照系、坐标系;

2) 分层过滤:多层独立防护技术,能在初层解决的问题,就在初层解决,不用增加处理后续的处理成本,同时,针对疑难杂症,加深作弊的防护深度和精细度,确保万无一失;

3) 软硬兼施:硬件信息和软件环境综合考虑,全面考虑各种因素、各项指标;

4) 模式识别:建立如同杀毒软件一样的病毒库——异常行为特征库技术是量江湖的独门秘籍,不仅覆盖全部的作弊手段,还提供实时的更新机制,把作弊歼灭在信息源头,降低机器计算的开销和处理成本;

• (一)多层独立识别技术

先说分成过滤。作弊识别是一个极其复杂的工程,有的作弊特征非常明显,有的则隐藏很深,还有少量情况是特征不够明显,甚至是个概率事件。为此,量江湖在识别作弊行为上采用了多层防护、多维判定、独立识别、综合评定的全套作弊识别解决方案。目的在于提高防范强度和精度的同时,兼顾方案的时效性和实用性:对于70%以上的作弊行为,可以在10分钟内给出判断;剩余下的大约20%高度仿真作弊行为,可以在3小时内给出判定;但其余大概5%左右的疑似作弊但特征不明显的行为,则需要2天的时间给出判定(跟版本有关),并对最终所有结果给出最终的判定:

1.1:初滤识别层

硬件设备异常嗅探技术:

– 第一步是判断设备本身、app、以及工作环境,是否处于被调试状态,当处于调试状态,系统会启动更加严格的设备验证算法,可识别目前所有通过调试方式刷量的行为;

– 第二步是判断设备的OS是否被劫持。一旦操作系统被劫持,就可以通过软件方式篡改设备信息。而量江湖的嗅探技术,不依赖操作系统接口的方式,而是独立获取设备信息,不受任何劫持木马或程序的干扰,通过对比得到准确的判断。

– 第三步是判断模拟器作假。量江湖对模拟器的作假判断有丰富的经验与独特技术,可以100%识别基于模拟器技术的作弊。

软硬件信息一致性校验技术

– 量江湖还对所取得关键设备信息、软件信息,如制造商ID、CPU、Mac地址、IMEI、操作系统版本、机型版本等各种进行一致性的校验,并与数据库中的用户数据进行比对校验,进行双保险的一致性校验比对。加深了对作假的审查深度。

1.2再滤识别层

– IP甄别:对其IP地址的来源、性质、分布进行全面的审查判断;

– 大数据比对:量江湖拥有5亿以上的用户画像,对所取得硬件关键设备ID进行合规校验以及数据库行为校验,分析其异常概率;

– 群体行为分析:包括接入网络类型、运营商分布、操作系统分布、机型分布、地理位置分布等特征,逐个与先验数据所构建的行为分布模型进行模式校验比对;

1.3终滤识别层

• 对上两层还不能确定的疑似情况作最后的审查,一方面综合评定所有的指标,另一方面与异常行为特征库所有的特征进行一一Match,并计算其匹配度。从而对这些疑难案例给出最终的结论。

(二)模式识别——异常行为特征库技术

再说模式识别。原理介绍每一种作假手段制造出来的,实际上是用户行为,通过机器学习对海量用户行为的洞察,抽象出这些异常用户或者异常来源的行为特征,这种行为特征称之为异常行为特征。这些各种各样的异常行为特征就构成了量江湖反作弊异常行为特征库,类似于杀毒软件中的“病毒库”。

• 量江湖目前已经收集、识别和记录存储了当前所有流量作弊方式的行为特征。

• 实时更新:量江湖密切关注任何一种新的作弊手段,发现,收集,学习,并输出更新异常行为特征库。确保客户在第一时间发现作假行为。

(三)锚定原点——数字DNA指纹技术

• 量江湖采用独特的数字DNA指纹技术,而不是使用IMEI、MAC、设备SN、蓝牙地址、ICCID等设备标识,以防止篡改。对于通过动态修改设备参数如MAC、IMEI、IMSI、ICCID、蓝牙地址等核心硬件的作弊行为,量江湖通过以数字DNA指纹技术为中心,参考硬件多维度参数检测,综合网络侧技术的风险评估以及异常行为特征库的匹配度评估,给出最终的判定。

(四)底层技术——机器学习及大数据技术

4.1机器学习技术

• 机器学习的优势就是能从海量数据中抽象出更加系统、更加深刻、更加完整的智慧、模式、特征;

• 机器学习不仅学习的更加深入透彻,还学习的非常快,在数据充分的情况下,对一种新作弊方法的学习可以在1小时内完成;

• 机器学习可以在人类的监督下自动学习,也就是说他不仅24小时在干活,而且还24小时在学习和进步,换句话说,其学习的速度不仅远超人类,而其学习的加速度更加令人生畏,实在是防作弊制胜之法宝。

4.2大数据

• 大数据:5亿以上的用户数据是量江湖做用户识别准确率的基础:

• 基本参考:5亿以上的用户量已经涵盖了半数以上的移动互联网用户,活生生的数据就是硬邦邦的证据;

• 机器学习的基础,机器学习的一个关键是有多少数据和多少种数据可以给机器喂,这个量级的数据,已经基本上涵盖了所有的用户行为类型;

量江湖的其他成本优势

量江湖的综合成本优势还体现在:1)数据积累;2)以机器学习为主的算法积累;3)行业经验积累;比邻弘科量江湖将这三大领域的积累创造性的融合在一起打造出自己的核心竞争力,具体如下:

1) 大数据积累:比邻弘科一直致力于大数据的积累和算法研究,积累了超过5亿有效用户的用户数据,数据覆盖用户的行为图谱,兴趣图谱、社交图谱、商品图谱以及媒体图谱。这些海量丰富的一手数据是我们对用户价值进行辨别与深度预测的基础。

2) 机器学习:比邻弘科是业界第一家将机器学习进入到用户商业价值预测和用户质量甄别领域的商业公司,这一创造性的技术应用将极大的提高用户质量预测的准确率,大幅度缩短用户识别周期,这将改变移动广告的交易方式。过去由于用户质量的甄别时间周期很长,需要1月以上的时间来判断,造成了流量的供应者与需求者之间的关系,只能停留在展示次数(CPM)、点击次数(CPC)、激活次数(CPA)作为结算方式,而这一技术的突破将改变行业的结算方式,以UQ进行结算,接近于CPS,但优于CPS。通过机器学习,习得了各种各样用户的信息特征与质量的关系,积累了各种各样渠道引导、激励、制造出来的用户的行为特征,包括个体行为特征,也包括群体行为特征。这些习得的模型已经被业界客户无数次业务实践所证明;

3) 行业经验:量江湖的整体团队致力于移动广告5年之久,宏观上,我们深知行业的切肤之痛、行业积弊之深,行业的格局与未来的发展有着深刻的理解;微观上,我们的业务专家对移动应用推广过程中的规律和数据,有着细致入微的观察和洞察;对任何一种渠道的用户行为模型都了如指掌,对各种应用的生命周期、推广周期、用户特点都如数家珍;

大数据积累、机器学习、行业经验,三位一体的组合在一起,不是简单的累加关系,而是乘法关系,形成我们独特的成本优势:1)全网的用户画像,是识别用户价值的数据前提;2)机器学习可以将全局数据的经验提取成智慧,并将这种识别智慧快速应用到对每个用户的判断,这种识别速度为商业化奠定了基础;3)而行业经验的注入则是把人类通过社会习得的对文明成果与机器智慧结合起来,建立起最强的人工智能。这也是目前最主流人工智能公司palantir的方案。特别是在流量安全这个洪荒领域,仅仅依靠机器学习是不够的,因为流量乱象后背的那个复杂程度,远非机器暴力计算所能企及,只有把行业专家(行业模式识别能力)的智慧与机器计算能力与稳定性,结合起来才是最好的。


本文来源于知乎,作者以史为贱。
30
创业者们,如果你或你的朋友想被优派网报道,请狠戳这里    寻求报道
小湿妹驻站作者
作者简介
0
文章总数
0万
总阅读量
ASO114市场数据分析平台
>