微博检测任务创建接口

2024.03.26 10:06:06

    接口说明

    该接口支持创建微博检测任务,并支持数据回调

    鉴权说明

    易盾内容安全服务使用签名方法对接口进行鉴权,所有接口每一次请求都需要包含签名信息(signature 参数),以验证用户身份,防止信息被恶意篡改。目前支持MD5,SHA1,SHA256,SM3几种加密算法,详细信息,请参见接口鉴权

    请求

    名称
    HTTP URL http://as.dun.163.com/v1/crawler/weibo-job/submit
    HTTP Method POST

    请求头

    名称 类型 必填 描述
    Content-Type String Y 固定值:"application/x-www-form-urlencoded"

    请求参数

    请求参数由公共参数和业务参数两部分组成,公共参数见请求公共参数

    业务参数

    名称 类型 必填 最大长度 描述
    version String Y 4 接口版本v1.0
    blogger String N 64 微博名
    url String Y 1024 微博主页链接,请到m.weibo.com站点,找到主页链接,示例:https://weibo.com/u/5788944942
    strategy Number N 4 微博爬取策略,默认为3, 1-单次检测-全量主贴,2-单次检测-全量主贴及评论,3-单次检测-指定主贴范围,4-单次检测-指定主贴范围及评论,5-循环检测-首次全量主贴及后续更新主贴,6-循环检测-首次全量主贴与评论,后续更新主贴与评论,7-循环检测-更新主贴,8-循环检测-更新主贴与评论。注意,此字段与公众号任务类型关联
    maxCheckCount Number N 2000 最大检测主贴数量, 不传默认值10条,当爬虫策略strategy为3、4时必填。当strategy为1,2时,默认最大主贴范围在2000条以内
    maxComment Number N 2000 最大检测评论数量, 默认为0,当爬虫策略strategy为2、4、6、8时必填
    type Number N 4 任务类型,默认为6,6-微博单次检测任务,7-微博循环检测任务
    frequency Number N 13 检测频率/多久爬取一次,单位毫秒,检测频率大于等于1天(86400000), 当爬虫任务类型type=7时必填
    startTime Number N 11 循环爬虫时间区间--开始时间, 当爬虫任务类型type=7时必填
    endTime Number N 11 循环爬虫时间区间--结束时间, 当爬虫任务类型type=7时必填
    callbackUrl String N 1024 回调地址
    checkFlags Array N 检测内容,默认为1、2、6,1-检测文本,2-检测图片, 6-点播音视频

    请求体示例

    productId=产品id
    &url=xxx
    &checkFlags=1,2,3
    &strategy=3
    &maxCheckCount=10
    &type=6
    &signature=xxx
    &secretId=xxx
    

    响应

    响应结果

    名称 类型 必须返回 描述
    result Object Y 融媒体提交结果
     ∟jobId Number Y 本次创建的任务id,根据任务id可以查看任务信息
     ∟taskId String Y 创建任务唯一的taskid
    响应体示例
    {
        "code": 200,
        "msg": "ok",
        "result": {
            "jobId": 123456789,
            "taskId": "xae23xdakieooxide23x9xoq"
        }
    }
    

    响应返回码

    响应返回码见:响应返回码

    在线咨询 电话咨询:95163223 免费试用