2025-10-17 19:15:48 来源:百度 作者: 摘要:10月17日消息,HuggingFace官网显示,百度昨晚发布的自研多模态文档解析模型PaddleOCR-VL,发布20小时内即登顶HuggingFaceTrending全球第一。
10月17日消息,HuggingFace官网显示,百度昨晚发布的自研多模态文档解析模型PaddleOCR-VL,发布20小时内即登顶HuggingFace Trending全球第一。
据了解,该模型核心参数仅0.9B,轻量高效,能以极低计算开销精准识别文本、手写汉字、表格、公式、图表等复杂元素,支持109种语言。在权威榜单OmniBenchDoc V1.5中,它以92.6分获综合性能全球第一,四大核心能力全线SOTA,超越GPT-4o等模型,刷新OCR VL模型性能纪录。
作为文心4.5衍生模型,PaddleOCR-VL融合了NaViT动态分辨率视觉编码器与ERNIE-4.5-0.3B语言模型,实现精度与效率双突破。

TCL科技(000100.SZ)今日公告,拟以现金60.45亿元收购控股子公司深圳市华星光电半导体显...
4小时前近日,在2025 Morketing Awards灵眸奖颁奖典礼上,欢聚集团(JOYY Inc.)旗...
4小时前12月15日,商汤科技基于在生成式AI与多模态交互领域的技术积累,正式发布Seko2.0——行业首个...
10小时前7月29日,2025世界人工智能大会(WAIC)期间,由是石科技主办的“算力为基——并行优化与行业模...
2025-07-30此次战略合作,双方将充分利用健安适科研优势与美团的渠道资源,深度协同、有机融合健康科技与生活场景,定...
2025-07-30投资家网(www.investorscn.com)是国内领先的资本与产业创新综合服务平台。为活跃于中国市场的VC/PE、上市公司、创业企业、地方政府等提供专业的第三方信息服务,包括行业媒体、智库服务、会议服务及生态服务。长按右侧二维码添加"投资哥"可与小编深入交流,并可加入微信群参与官方活动,赶快行动吧。

中东已成为中国一些知名公司的投资热土。