分享
Doc2x-v1 竞品分析(mathpix,庖丁PDFlux,pix2text, 合合信息TextIn, 腾讯云大模型知识引擎文档解析)
输入“/”快速插入内容
Doc2x-v1 竞品分析(mathpix,庖丁PDFlux,pix2text, 合合信息TextIn, 腾讯云大模型知识引擎文档解析)
2024年8月24日修改
2024年5月31日创建
评测时间
2024年5月30日
2024年5月31日 新增
paddlepaddle
表格效果对比
2024年6月17日 新增
pix2text
,TextIn 文档效果对比
(
marker
等开源方案效果和pix2text接近, 就不多测试了)
2024年6月21日 新增
腾讯云大模型知识引擎文档解析对比
评测平台
•
doc2x网页版
•
mathpix snip 网页版
•
pdflux网页版导出html
•
paddlepaddle表格
(只测试表格)
•
pix2text page
◦
MFD: yolov7 paid MFR: mfr-pro paid File Type: page
•
TextIn
◦
TextIn 实测支持$$公式语法, 但
语法错误
•
腾讯云文档识别
评测范围
语言: 中英
对象: 文档图片
范围: 教育,金融,论文,国标
对于paddle, 我们只选取图像中的表格部分, 忽略其他部分
复杂合并单元格
mathpix合并单元格错误
doc2x正确