秒答逻辑推理题、创作一幅描绘申城未来的图画……大模型能有多聪明?一眼看穿一家陌生公司的门道、成为房产经纪的贴心小助手……大模型能有多实用?
(资料图)
今年世界人工智能大会的“顶流”非大模型莫属。国内外科技企业集中了30余款大模型,展现大模型赋能各行各业的多元生态。无论是通用大模型,还是大模型应用产品,科技巨头、科研机构、初创企业在人工智能大会的舞台各领风骚。
与“星火”PK逻辑推理能力
“农夫需要带着狼、羊、菜一起过河,只有农夫能够划船,而且船比较小,农夫每次只能带一样东西过河。如果农夫不在,羊会偷吃菜,狼会吃羊。请设计一种方法,让农夫能够安全地将所有东西带过河。”
“1个鱼缸里有很多条鱼,共有5个品种,至少要捞出多少条鱼,才能保证其中有4条相同品种的鱼?”
在科大讯飞的展台,参观者无不为星火认知大模型的聪慧所折服。别说开放式知识问答了,就连逻辑推理题抑或是数学问题,星火都“智商”在线,可以应用各种方法,在严谨的推理下给出答案。
展台工作人员介绍,今年5月6日,科大讯飞发布星火认知大模型,并展示了文本生成、语言理解、知识问答、逻辑推理、数学知识等七大核心能力。发布以来,核心能力持续迭代,一个月前又发布星火认知大模型V1.5,不仅各项能力持续提升,且突破开放式知识问答,多轮对话、逻辑和数学能力再升级。
“欢迎市民来体验星火大模型在教育、医疗、办公、数字员工、汽车、金融、工业等多场景的应用成果。”展台工作人员发出邀请,在星火大模型加持下,讯飞AI学习机可以让人工智能像老师一样批改作文,像口语老师一样实景对话。观众还可以体验最新发布的星火语伴App,它可以进行开放式对话、情景交流,像口语老师一样陪练,并实时纠错。
在上海世博中心和世博展览馆服务台,科大讯飞也为本届大会打造了数字人新闻官,在星火大模型的加持下,它可以与观众更自然地实时交互,介绍大会相关信息。
向“商量”提问 与“秒画”创作
在商汤科技的展台,与“士别三日”后的“商量”来“商量商量”吧。记者了解到,“商量”是商汤科技“日日新”大模型体系下的千亿级参数语言大模型,拥有领先的语义理解、多轮对话、知识掌握、逻辑推理的综合能力。最新升级的“商量2.0”在知识信息准确性、逻辑判断能力、上下文理解能力、创造性等方面均有了大幅提升。
“当有大量文档需要处理,如各类文章、报告、信函、产品信息等,‘商量’可以帮助进行编辑、重写、总结、分类、提取结构化信息、基于这些文档作问答等。”展台工作人员介绍。
在商汤“秒画”画廊,观众将体验到人工智能艺术之旅。“秒画”可以结合输入的图片或文本智能创作出与输入相关的图像内容,具有更强大的中文理解能力和更多样化的风格选择。2023世界人工智能大会举办期间,新民晚报联合商汤科技,邀请市民朋友在掌握大模型世界的“魔咒”——提示词后,利用“秒画”创作一幅主题为“生成未来·申城未来”的图画,其中最搞笑的、最写实的、最科幻的作品将于大会闭幕当天在新民晚报全媒体上呈现。
“‘秒画3.0’的自研生成大模型参数提升至70亿量级,带来更强图片生成效果,实现专业摄影级细节刻画,使所生成图片具备超强质感和精细度。”工作人员称,“秒画3.0”平台还能更智慧地理解用户需求,只需输入少量简单提示词,就可自动延展生成内容丰富的图像结果。
产业全景图谱更准更细致
基于新的技术底座,在国际人工智能竞争愈发激烈的当下,大模型浪潮带动产品、服务、行业等多方位变革,千行百业也正迎来巨大的想象空间。如何加速落地“最后一公里”成为新课题。
上海本土创新企业数库科技在此次大会上首发融合统一产品图谱体系与大模型的概念型产品“istari”,它是一个能呈现对话式交互的新一代产业全景图谱平台。立足于这个小小的对话窗口,所有产业和产品以及相关公司的数据维度都唾手可得。在对用户输入的问题用大语言模型解析后,即可转化成产品知识图谱的相关查询,呈现出相关的产业知识以及各个知识点之间的关系。
展台工作人介绍,“istari”底层是数库科技借助大模型“沙里淘金”,对所有公司的公开信息如经营活动、经营范围、研报、公告等专业财经信息的高效提取和解读,构建了精准、全面、维度丰富的统一产品图谱(UPG)体系,让大众和数据需求方快速洞悉产业之间的关系,将产业间的各类关系与链路在这个体系中完整呈现。
在这个图谱体系中,除了工商、投融资、舆情、专利、科技认定、供应链、招投标、财税、社保、司法等公开的产融大数据,还有工艺、生产环节、材质、品牌等全新数据,将产业数据网络上的每一个节点信息刻画得更深入、更全面、更精准。比如,某家企业的产品工艺数据能体现技术的先进性,这对于银行、政府对企业的筛选有很强的指引性;在金融领域,银行客户经理能通过这一图谱产品进一步提升对整体产业的理解能力,并通过更细分化的数据图谱实现对潜在客户的深入挖掘。
生成式AI重构企业软件
初创企业第四范式展示了“式说”大模型在多个产业领域的落地。与生成图片、生成海报、生成文案等大家所认知的AIGC领域不同,第四范式则将大模型技术聚焦在企业软件领域。经过“式说”改造的企业软件以“万能对话框”的界面呈现,用户使用人类自然语言即可直接调用软件功能,无须再层层点击;此外,软件的功能升级也仅需新增或改写数据/接口规则,开发效率从“月”提速到“天”。
在展会现场,第四范式“大模型之城”展示了这些应用场景。例如:一个门店店长肩负包括员工管理、货品采购、库存控制、销售增长、处理客诉等门店管理多个环节,原本需要在不同系统上完成管理工作。有了“店长大模型”小助手,只要通过对话框提问的方式,小助手就能调度后端应用接口,从各个系统中直接获取如商品销量、值班人员状态、违规操作等企业后台软件多模态的数据及信息。
此外,还有“工业软件设计”小助手,可以助力工程师轻松快速从海量信息中找到合理的零件组装方案;“房产经纪大模型”小助手具备了掌握房产专业知识及复合型知识的合格经纪人基本能力,能够掌握并活用专业知识、理解与沟通能力、基于生态规则的协作能力等;“工业运营软件”小助手不仅能制定和执行生产计划、排程、调度等工作,还能对生产现场的各项数据进行分析和评估,通过联网外部终端设备(监控、摄像、门禁等)兼职“工厂管理员”,真正成为数字化工厂的智慧“大脑”。
“全程AI舱”改写驾驶体验
前不久网络上一条热门视频引发关注,一辆SUV车身周围居然藏下了75个孩子。盲区,可能是城市出行中驾驶者和交通参与者的最大隐患。
在本届大会上,智己汽车带来了解决方案:将“A柱补盲/侧视补盲/后视补盲”等驾舱融合影像,直观呈现在主驾驶屏幕上,驾驶员只需轻轻一瞥,即可获得被重点标注的所有驾驶敏感信息,在多种转弯场景,更有效更从容地躲避外卖小哥、玩耍儿童、过路行人等突发状况,让驾驶既安全又轻松。
这是智己汽车推出的整车智能化软件产品“全程AI舱”的核心体验,它融合了软硬全域融合的独创驾驶布局、智能驾驶技术和大模型算法。它还能通过智驾算法推出“一键场景代驾”功能,例如,实现“一键窄路循迹原路返回”“一键精准贴边停车”“一键脱困”等老司机都难以做到的精准行为,大大缓解用户的紧张感。未来,还有更多的一键模式,让都市用车困扰最大的最后一分钟,轻松交付AI代劳。
据悉,智己汽车正在和AI行业头部的大模型算法进行不同程度的定制预研,结合智能驾驶系统,基于算法融合GPT大模型的功能将于第四季度上线,增强用户对智能化感知的体验,创造虚实融合的多维场景。
新民晚报记者 叶薇 郜阳 易蓉
【更多阅读】机器人酷炫“走秀”:多轮对话没问题 送餐下棋更精准