微博检测任务创建接口
2024.09.02 17:59:14
接口说明
该接口支持创建微博检测任务,并支持数据回调
鉴权说明
易盾内容安全服务使用签名方法对接口进行鉴权,所有接口每一次请求都需要包含签名信息(signature 参数),以验证用户身份,防止信息被恶意篡改。目前支持MD5,SHA1,SHA256,SM3几种加密算法,详细信息,请参见接口鉴权
请求
名称 | 值 |
---|---|
HTTP URL | http://as.dun.163.com/v1/crawler/weibo-job/submit |
HTTP Method | POST |
请求头
名称 | 类型 | 必填 | 描述 |
---|---|---|---|
Content-Type | String | Y | 固定值:"application/x-www-form-urlencoded" |
请求参数
请求参数由公共参数和业务参数两部分组成,公共参数见请求公共参数
业务参数
名称 | 类型 | 必填 | 最大长度 | 描述 |
---|---|---|---|---|
version | String | Y | 4 | 接口版本v1.0 |
blogger | String | N | 64 | 微博名 |
url | String | Y | 1024 | 微博主页链接,请到m.weibo.com站点,找到主页链接,示例:https://weibo.com/u/5788944942 |
strategy | Number | N | 4 | 微博爬取策略,默认为3, 1-单次检测-全量主贴,2-单次检测-全量主贴及评论,3-单次检测-指定主贴范围,4-单次检测-指定主贴范围及评论,5-循环检测-首次全量主贴及后续更新主贴,6-循环检测-首次全量主贴与评论,后续更新主贴与评论,7-循环检测-更新主贴,8-循环检测-更新主贴与评论。注意,此字段与公众号任务类型关联 |
maxCheckCount | Number | N | 2000 | 最大检测主贴数量, 不传默认值10条,当爬虫策略strategy为3、4时必填。当strategy为1,2时,默认最大主贴范围在2000条以内 |
maxComment | Number | N | 2000 | 最大检测评论数量, 默认为0,当爬虫策略strategy为2、4、6、8时必填 |
type | Number | N | 4 | 任务类型,默认为6,6-微博单次检测任务,7-微博循环检测任务 |
frequency | Number | N | 13 | 检测频率/多久爬取一次,单位毫秒,检测频率大于等于1天(86400000), 当爬虫任务类型type=7时必填 |
startTime | Number | N | 11 | 循环爬虫时间区间--开始时间, 当爬虫任务类型type=7时必填 |
endTime | Number | N | 11 | 循环爬虫时间区间--结束时间, 当爬虫任务类型type=7时必填 |
callbackUrl | String | N | 1024 | 回调地址 |
checkFlags | Array | N | 检测内容,默认为1、2、6,1-检测文本,2-检测图片, 6-点播音视频 |
请求体示例
&url=xxx
&checkFlags=1,2,3
&strategy=3
&maxCheckCount=10
&type=6
&signature=xxx
&secretId=xxx
响应
响应结果
名称 | 类型 | 必须返回 | 描述 |
---|---|---|---|
result | Object | Y | 融媒体提交结果 |
∟jobId | Number | Y | 本次创建的任务id,根据任务id可以查看任务信息 |
∟taskId | String | Y | 创建任务唯一的taskid |
响应体示例
{
"code": 200,
"msg": "ok",
"result": {
"jobId": 123456789,
"taskId": "xae23xdakieooxide23x9xoq"
}
}
响应返回码
响应返回码见:响应返回码