2025年02月易盾产品月报
2025.03.07 10:30:23
内容安全
文本检测
1、新增文本相似检索服务:以NLP和大模型能力为核心技术实现不同文本的相似度匹配检测,支持文本入库、文本相似度检索等核心能力,助力解决内容社区/电商评论区的刷评刷帖、重复评论、相似内容等内容生态治理难点。示例如下:
2、涉政能力提升:
- 新增布控关联两会维稳升级,访民大量被截访相关话题;
- 新增布控两会安检升级,窗户贴封条等,扰民言论等;
- 新增布控两会其它负面政治话题。
3、色情能力提升:
- 更新
AIGC文生图色情
识别能力,主要提升裸体、性行为指令识别精度; - 更新
色情传播
识别能力,主要优化售卖色情资源、色情女优以及招嫖识别精度; - 更新
性器官
识别能力,主要优化隐晦性器官表述识别精度; - 更新
交友低俗
识别能力,主要提升隐晦性器官代指、低俗打招呼召回能力; - 更新
低俗昵称
识别能力,主要提升性行为、性器官同音字召回能力;
4、出海能力提升:
- 新增捷克语色情、谩骂相关识别能力;
- 更新菲律宾语不友善言论识别能力;
- 更新英语色情隐晦、涉政识别能力;
- 更新西班牙语、葡萄牙语、德语、法语、日语、意大利语、俄语、越南语色情识别能力;
5、涉价值观能力提升:
- 新增借封建迷信类向老人兜售假冒商品等识别能力;
- 提升青少年涉及耽美、腐文化、涉自杀自残等相关内容的精准召回。
6、广告及广告法能力提升:
- 优化了投资贷款、股票投资、金融广告引流话术、涉兼职招聘广告、游戏帮会拉人、引流下载话术等识别能力;
- 针对广告素材新增微信红包封面类、虚构营销故事、男科广告、两会同款等识别能力。
图片检测
1、人脸检测模型更新:针对aigc场景及变种对抗场景增加人脸召回率。
2、抽烟模型更新:解决小目标形似香烟类的误伤问题。
3、货币模型更新:解决肉类、包装类、花束类误命中为人民币的问题。
音频检测
1、音频声纹识别能力新增覆盖赖清德、李克强,精细化声纹检测能力进一步提升。目前,易盾已覆盖20余个涉政相关声纹检测能力,并支持快速上线新声纹检测模型,能够迅速满足新增声纹检测需求。
审核系统
1、自定义名单:
- 支持3种聊天房间的名单,适用于语音房、直播房、群聊房等社区产品。从用户+场景维度进行名单处置,实现精细化运营,在保障某业务场景的内容安全的同时,不影响用户在其他模块的产品体验;
- 自定义名单支持批量录入,提升运营效率。
2、海外版上线用户风险统计能力,助力海外客户从用户角度精准识别内容风险,拓展运营布控的维度。该功能涵盖【性别风险统计】【垃圾发布量排行】【发帖总量排行】【垃圾发布率排行】四大类型,全方位帮助海外客户从用户维度监控并发现违规用户。
业务安全
智能风控
1、「自定义规则模块」开放易盾沉淀的全局黑名单,包括部分手机号、设备、IP黑产名单,用于业务风险识别。
2、「名单管理模块」支持批量操作名单项生效/失效,提升操作效率。
3、新增HID硬件挂检测能力:智能风控系统可精准识别AI驱动的自动化聊天机器人,适用于娱乐社交行业的自动化引流作弊场景检测。
人脸核验
1、身份证OCR:新增伪造/复印/翻牌等不合规照片检测,能够通过证件完整度、清晰度以及防伪标识,多维度判断证件是否有效。
应用安全
应用加固
1、Android加固:
- 兼容最新Android 16 beta2版本;
- 新增三方so加固关联壳启动功能,增加与业务侧耦合;
- 优化防截屏策略,规避与安全厂商SDK的冲突问题。
2、iOS加固:
- 支持最新Cocos Creator引擎(>= 3.5.0)的游戏资源加密。
3、鸿蒙加固:
- 鸿蒙混淆工具链适配兼容DevEco Studio 5.0.2 Release SDK。