分享
Doc2x API v2 PDF 接口文档
输入“/”快速插入内容
Doc2x API
v2
PDF
接口
文档
2025年8月27日修改
2024年9月12日创建
修改记录
•
2024-11-11 新增 preupload接口
•
2025-03-05 新增图片输入接口
图片接口文档:
•
Doc2X API v2 图片接口文档
其他参考
•
使用 LLM 进行多级标题层级增强的例子参考
常见问题:
Doc2X 常见问题 - FAQ
Base URL:
https://v2.doc2x.noedgeai.com
1.
请
直连
访问 API 接口,中国内地以外地区可能有较大网络波动,导致上传文件断流严重
2.
不建议接入大规模线上服务,由于算力有限,可能会出现排队情况(表现为轮询时进度为 0),更适合批量处理数据
3.
通过 status 得到结果之后,如果有保存图片的需求,请尽快手动下载或通过导出接口获取图片到本地,服务器上只临时保留 24h 的结果
Authorizaton 鉴权
首先需要获取到API Key(类似于
sk-xxx
)
获取API网址:
open.noedgeai.com
在HTTP请求头加入:
代码块
HTTP
Authorization: Bearer sk-xxx
画板
画板
POST /api/v2/parse/pdf PDF识别(直接上传)不推荐
此接口为异步调用接口,注意仅支持文件大小<=300MB,更大的文件使用
/api/v2/parse/preupload
请求参数
名称
位置
类型
必选
说明
body
body
binary
是
请求体为 pdf 的二进制,最大不超过300M
请求示例
代码块
Bash
curl -X POST 'https://v2.doc2x.noedgeai.com/api/v2/parse/pdf' \
--header 'Authorization: Bearer sk-xxx' \
--data-binary '@test2.pdf'
注意,
--data-binary
并不是formdata,而是
以二进制形式写入body中
,python代码如下:
代码块
Python
import requests
url = 'https://v2.doc2x.noedgeai.com/api/v2/parse/pdf'
headers = {'Authorization': 'Bearer sk-xxx'}
with open('test2.pdf', 'rb') as file:
response = requests.post(url, headers=headers, data=file) # 使用data
print(response.text)
返回示例
代码块
JSON
{
"code": "success",
"data": {
"uid": "01920000-0000-0000-0000-000000000000"
}
}