当前位置: 首页 - 学院 - 资讯 - 其他资讯 - 正文

DeepSeek上线识图功能,轻松识别看懂各类图片

2026-05-18 18:05:38 来源:互联网 作者:down

DeepSeek电脑版

DeepSeek电脑版

软件类型:实用工具 软件大小:40.10MB 软件平台:  WinALL  软件语言:简体

标签: DeepSeek

查看详情

      4月29日,DeepSeek多模态技术负责人陈小康在社交平台发文示意,搭配品牌鲸鱼形象配图,正式宣告品牌摆脱纯文本发展模式,凭借强劲实力顺利迈入视觉智能发展新阶段。

DeepSeek上线识图功能,轻松识别看懂各类图片

      这一重大突破,距离V4旗舰模型上线才短短五日。

      长文本体验全面革新,算力成本大减负

      4月24日,DeepSeek正式发布V4系列预览版并开源。该模型历时15个月精心打磨,经过多次迭代优化,分为旗舰版V4-Pro与轻量版V4-Flash,二者均采用混合专家架构,全系支持百万级超长文本读取,可一次性处理海量长篇内容。

      V4-Pro硬件配置强劲,训练数据充足,是国产开源模型里的顶尖水准,擅长文案创作、深度分析等复杂工作;V4-Flash主打实用高性价比,运行开销极低,日常使用体验贴近旗舰版本。

      以往长文本处理运算量大、成本高昂,V4可智能甄别文本信息轻重,精简无效运算,大幅减少算力与内存占用,有效降低使用成本。 同时它内置三档推理模式,兼顾极速应答、常规思考与深度推演,用户可根据使用场景自由切换。在专业代码测评中,V4得分表现出色,实力超越多款主流大模型,代码实操能力跻身行业顶尖水平。

      告别纯文本,DeepSeek开启视觉识别

      DeepSeek V4凭借出色架构与高性价比广受认可,但仅支持纯文本交互,让不少用户期待视觉功能。如今识图模式开启灰度测试,圆满补足这一空缺。

      该功能依托V4强劲推理能力打造,不再局限于简单提取图片文字,可完成视觉识别、语义解读与逻辑思考,真正深度理解图片内容。

      软件界面新增独立识图入口,和原有使用模式并列,用户上传照片、截图、纸质文档等图片就能快速解析,和文字对话操作无缝衔接。

      日常使用场景十分丰富,可整理合同报表、转化表格数据,快速提取各类图片里的关键信息;还能识别各类实物、解答作业难题,同时支持分析代码截图,满足不同人群使用需求。

      目前国内多款主流国产大模型都已搭载识图功能,DeepSeek完成布局后,也让视觉识别正式成为大模型主流标配功能。

      现阶段识图功能分批开放测试,免费用户每日有使用次数限制,次数用完次日重置,暂时无法制作图片和解析视频。

      此次功能更新,让DeepSeek摆脱纯文本局限,也为后续更多多模态功能研发筑牢根基。