人工智能加速开启“智慧之门”

  • 2025-07-28 19:04:13
  • 536

7月27日,一个具备文字识别自主分拣随机物品功能的双臂机器人在向参观者做演示。

7月27日,参观者在体验一种具备支付功能的智能眼镜。新华社发

本报特派记者孙奇茹

戴上智能眼镜,一句“支付10元”就能轻松完成购物;对手机说出健康疑惑,AI健康管家即刻给出诊断建议;在“眼脑手”配合下,能干活的机器人花式秀技……7月26日至29日,2025世界人工智能大会(WAIC)在上海举办,3000余项前沿成果集中亮相,人工智能正加速打开“智慧之门”。

AI打开智慧生活新想象

刚到大会现场,不知道场馆怎么走?搞不清哪里取票、哪里存包?想找到卫生间在哪儿?这些都不用犯愁,大会现场设置了多个“支付宝碰一下”打卡点,观众只需要解锁手机“碰一下”小蓝环,就可以获取地图导览、打卡等观展服务。

在蚂蚁集团展区,AI健康管家“AQ”吸引众多参观者驻足。观众只需说一句“最近为什么提不起精神”,或上传体检报告,AQ就能即刻给出诊断建议,并支持一键接入AI诊室深度问询,同时对接线上挂号或线下医院资源。“有了AQ,家里老人能自己问药查报告,就好像家里有个医生亲戚一样,真方便。”一位观众感叹。

据了解,AQ基于蚂蚁医疗大模型开发,包含问健康、读报告、测疾病、管慢病等超100项AI功能,并适配多款主流可穿戴和慢病管理设备,刚刚入选了WAIC2025大会最高奖项“SAIL奖”TOP30和“镇馆之宝”两项大奖。

在合合信息展台现场,南京博物院的“镇院之宝”之一——一幅长度近4米的画作《坤舆万国全图》吸引了众多人的目光。在AI扫描技术的支持下,这张巨幅地图被一键“装进”手机。借助“无限扫描”科技,观众通过上下、左右滑动手机拍摄视频,AI便可规避大尺寸文档图像拼接中常见的错位、细节模糊、色彩失真等问题,对局部视频进行“智能拼图”。基于AI对图像的理解,系统还能识别出《坤舆万国全图》中的山河疆域、神奇动物等元素。当观众点击指定区域时,就能了解数百年前人们对世界的认知,实现“让文物说话,让历史发声”。

能干活的机器人花式秀技

“请把偶数数字挑出来放到碗里。”梅卡曼德展台,工作人员口头给机器人下达了指令。“好的,我将把4取出来放在碗里。”机器人语音回复后,通过装在顶部的3D高精度相机,精准识别出桌面上堆放的几个数字积木,并灵巧地挥动臂膀,从中挑出了偶数4,放进碗里。

梅卡曼德创始人兼CEO邵天兰介绍,基于由团队自主研发的Mech-GPT多模态大模型,机器人能听懂人类的自然语言,操作人员无需复杂专业的编程知识就能向机器人下达操作指令,操作门槛大大降低。双臂机器人自助叠衣、单臂机器人克服自身对透明物品的识别障碍并快速分拣、人形机器人从琳琅满目的货架上取货递给参观者、工业机器人以0.5毫米视觉精度从深筐里随意堆叠的复杂钣金件中抓取目标并完成精准上料……在梅卡曼德展区现场,机器人花式秀起了本领。

“机器人如今不再是花拳绣腿,除了运动、跳舞、表演,机器人也非常‘能干活’。”邵天兰透露,公司半数收入来自海外,除中国本土市场外,其产品已经远销德国、日本、美国、韩国等数十个国家和地区。

在机器人技能大舞台手持彩绸舞龙或挥毫书写的智元机器人,以微米级精度剥下蛋壳而蛋膜毫发无损的云百生手术机器人,现场进行格斗赛的宇树人形机器人……更“能干”、更“聪明”的机器人各展神通,上演了一场“机器人总动员”。

京企秀出科创硬实力

AI大模型正给各行各业带来一场效率革命。然而,在交通、医疗等领域,大模型因其难以解决的“幻觉”等问题,一直面临规模化落地难题。在世界人工智能大会上,总部位于北京的蘑菇车联带来了他们的解答——物理世界AI大模型。

“相比数字世界中的大模型,MogoMind可以视为物理世界的实时搜索引擎。”蘑菇车联副总裁王凯说。这个名叫MogoMind的物理世界AI大模型整合了道路传感器、车载终端等多种设备,形成立体化的物理世界感知网络,实现对道路状况、车辆行驶状态、行人轨迹、气象条件等物理信息的毫秒级感知。

如今,在金融、教育、电力、能源、交通等领域,国产GPU的身影正越来越密集地出现。在展区现场,来自北京的摩尔线程集中展示了国产GPU在专业图形渲染、大模型训练与推理、具身智能、物理仿真等领域的技术突破。

工作人员介绍,全功能GPU兼具图形渲染、视频编解码、AI计算加速、物理仿真、科学计算等多种能力。依托这一优势,摩尔线程与合作方推想医疗已完成冠脉CT造影图像血管狭窄辅助评估软件的国产化适配及迁移,助力AI医疗领域实现从芯片到软件全面国产化的跨越。