各广告平台对视频素材的判定机制解析

以巨量为例

以巨量为例,素材的判定分为两个阶段,首先是机器审核,然后是人工审核,其它投放平台大多也是如此。

 

为了节省成本,加快审核速度,投放平台在将素材审核后就会记住这个素材信息,当下次用户再上传这个素材时,平台就会在机器审核时匹配到对应的素材信息,跳过人工审核阶段。

那么是平台靠什么来匹配到对应素材的呢?肯定不是文件名。其实,不只是广告平台,几乎所有网站和应用对相同文件的匹配方法几乎都是——文件指纹

文件指纹是一种独特的数字标识,用于识别和区分不同的文件。它是通过特殊的算法对文件内容进行哈希(Hash)运算得到的。这个过程不依赖于文件的名称或者其它表面属性,而是深入到文件的内容中,确保即使文件的名称或格式发生变化,也能准确识别出它是同一个素材。

当用户首次上传素材时,平台会通过哈希算法生成该素材的文件指纹。常用的哈希算法如MD5、SHA-1或SHA-256等,能够将任意大小的文件转换为固定长度的字符串,这个字符串就是文件的“指纹”。由于哈希函数的特性,相同的输入总会产生相同的输出,而不同的输入极大概率会产生不同的输出,因此,每个文件的指纹都是独一无二的。

在机器审核阶段,平台会计算新上传素材的文件指纹,并将其与存储在数据库中的已有素材指纹进行比对。如果新上传的素材指纹与数据库中的任何一个指纹匹配,那么平台就可以确定这个素材已经被审核过,从而跳过人工审核阶段,直接使用匹配到的素材信息(至少对于违规素材和低效素材是这样做的)。

 

低效素材

低效素材:在一定历史投放周期内,系统评估视频素材已充分探索但跑量效果极低,则该素材即定义为低效素材。

从上文中我们可以明确,当新上传的素材指纹与数据库中已存储的任何一个指纹匹配时,平台会立即关联到原有的素材信息。这意味着,如果某个素材在初次审核后被标记为不符合平台规定或是在投放后被打上低效,那么这一标签将会与该素材的指纹一同存储在数据库中。

在这种情况下,即使用户尝试重新上传相同的素材,无论其文件名称、格式或者其它表面属性如何变化,只要其内容实质上没有改变,生成的文件指纹就会与先前的低效素材指纹匹配。因此,即便以不同的形式再次出现,该素材仍会被平台识别并判定为低效素材。

那么有什么高效的办法来解决这个问题呢?一种可能的解决办法是在文件中添加随机字符或者进行细微的内容改动,以修改文件的指纹。这种方法被称为指纹混淆或者指纹篡改。对于视频和图片这种大型文件来说,少量的字符篡改并不会影响最终的呈现效果,但却能够使文件指纹出现极大的改变。使用这种方法就可以规避素材一上传就被打上低效标签的问题,平台将会将其视为全新的素材进行审核。

 

同质化素材

同质化素材问题通常出现在视频广告上,其中的判定有些复杂,各平台的审核机制也有所不同,这里以巨量为例。当素材进入机器审核时,机器会将素材切割为n个分镜,当这条素材与在投的其他素材的相似分镜在其视频中占比较高时,素材就会被判定为同质化素材。

对于这一问题,通常有以下解决方法:

  • 画面翻转
  • 镜头变化
  • 视频变速

因为同质化素材的判定与素材的最终呈现有关,所以并不能直接通过修改文件指纹来避免。而且随着算法的完善,上文提到的画面翻转、镜头变化、视频变速等简单的视频修改已经没有办法有效地解决同质化素材问题,想要彻底的解决这一问题只能重新剪辑。

THE END