本人研究Agent,关注LLM的各种应用。
今天测试了下通义千问网页版PDF文档问答功能,感觉还不错,贴几个例子:
辅助论文理解:
看起来理解基本内容没问题
细节理解也不错,惊喜的是还能提取或转latex公式!感觉这个对科研狗还是比较实用的
尝试了两个中文pdf:
看了下年报的细节提取,貌似也还不错
这表格提取的也可以,时间和城市貌似错位了一栏,不过整体可以,掩盖具体地址也成功了
(上周刚上线时体验过一次千问的PDF问答功能,似乎没现在好使,应该是更新过模型了?国内Agent发展得也太快了......