| Criteri | 正常情况(Regular) | Cloaked 页面示例 |
|---|---|---|
| User-Agent 判断响应内容 | 相同内容展示 | 只返回预定义搜索引擎友好的HTML文档 |
| 页面源代码 | H1、图像alt标签自然分布 | Cloaked页可能会存在大量关键词堆砌且无合理语义关联结构 |
| Crawlability | Bots 可完整抓取整个DOM结构 | BOTS 被限制性引导进入定制页面, 其它链接403封锁 |
| Meta 标签一致性检查 | Description与页面匹配 | Description 包含关键词但页面内容为空 |
- Different content when accessed via crawling tools compared with normal visitors;
- Rare or non-visible content such as
position absolute off-screen elements;appearing only in rendered versions; - Increase in keyword-heavy but meaningless visible output (example: 5 paragraphs of lorem ipsum text)
- A sudden redirect to another unrelated site under certain request parameters such as specific headers or device agents。
- 确保所有 .htaccess 和服务器重写规则都由可信人员修改,而非通过第三方模板插入;
- CSP 设置强控制指令:阻止未授权外部资源引用,尤其是来自不明 js 服务的 script 调用文件加载过程;
- 启用网站监控功能,每当 HTML 内容发生变化超过指定阈值( 如超过20%以上)立即提醒团队;
- 定期运行 Nmap, OWASP ZAP, 和GSA Search Engine Ranker, 检查网站是否暴露给非公开API;
- 设置 sitespeed.io 监控任务 来捕获访问速度异常波动,并据此推导内容是否正在被中间层注入或篡改。


