讯飞星火V2.0突破代码能力,一个指令生成贪吃蛇游戏,10分钟开发“凌空手写”
时间:2023-08-16 11:39:02来源:凤凰网

作者 | 程茜

编辑 | 漠影


【资料图】

讯飞星火大模型又双叒更新了!

智东西8月15日报道,讯飞星火大模型迎来年内第二次重磅升级,V2.0来了!

星火大模型V2.0主要升级点体现在代码能力多模态交互上,科大讯飞董事长刘庆峰谈道,大模型的代码能力是连接数字世界的关键支撑,多模态是让通用人工智能赋能工业的各种具体场景,未来进入家庭的最重要核心能力。

同时,今天正值七部委联合发布的《生成式人工智能服务管理暂行办法》正式实行。刘庆峰认为,通用人工智能在深度赋能千行百业的过程中,已经迈上了新的台阶。

星火大模型的应用落地也正在稳步向前,5月6日星火大模型发布以来,科大讯飞人工智能开放平台新增了70万个开发者团队;讯飞星火小助手6月9日发布至今,已经新增了7800多个用户自己创建的小助手;讯飞学习机5月销量同比上涨了超100%,6月上涨超200%……

这一过程中,用户体验又再反向提升大模型的能力,使得星火大模型的语言理解、逻辑推理的测试得分不断提高。

可以看出,通用人工智能时代的发展,正在让各行各业的人都能释放自己的想象力,并通过大模型的能力将其快速实现,每个人都拥有个人AI助手的愿景正越来越近。

一、代码、多模态交互两大能力重磅升级,文本生成、理解能力持续提升

一如既往,开场星火就写了份欢迎词。星火首先回顾了星火大模型前两次升级的内容,不同于之前的泛泛通用型介绍,而是有理有据的个人知识的学习。

在解决数学能力上也大幅升级,星火能综合运用三角函数、方程、等差数列方面的知识来解决数学问题。

诗句理解上,星火可以给出“与尔同消万古愁”的出处,并写出全诗。同时还能赏析《将进酒》中的诗句,并运用这两句诗写出一篇范例作文。

星火还能“立人设”,将它设定为“虚拟陪伴伙伴”,它就可以为用户的party(聚会)提出制作哪些美食、举办哪些活动的建议。

用户日常体验中,还可以通过语音直接对话,模拟真人“面对面”交流。

1、五大代码能力升级,几分钟生成“贪吃蛇”小游戏

到了最重磅的代码能力展示环节,刘庆峰谈道,代码能力是认知智能大模型智慧提升的关键维度,在提升这一能力时可以同步提升长文本理解、逻辑推理、任务规划能力,以及帮助用户执行复杂任务、连接数字世界,还能降低数字经济的创业门槛。

星火大模型包含代码生成、代码补齐、代码纠错、代码解释、单元测试生成五大代码能力。

在代码能力展示环节,星火都是现场写代码、现场运行。

刚开始,星火就快速展示了其使用python生成了“判断输入字符串是否符合密码规则”、画出“红色的心形线”等功能。

随后,演示人员还增加了指令,如果输入密码不符合规则时给出理由,生成的代码就会相应给出“不少于8位”等原因方便用户调整。

同时,星火还能快速将视频片段转化成GIF动图,并且动图也会相应的缩小文件大小,方便用户发送分享。星火生成经典的贪吃蛇小游戏,包含72行代码,并且每一段都给出了相关的注释。

这一代码能力也已经集成到讯飞星火的小助手中,例如助手中心中的“python大脑”小助手,这一小助手被设定为先说明、再举例、最后列出注意事项的三段论,星火就可以根据用户的提问给出答案。

基于OpenAI构建的代码能力公开测试集HumanEval和认知智能全国重点实验室构建的代码实用场景测试集iflyCT-py,星火在python语言下,代码生成和代码补齐能力超过ChatGPT,其它能力正在快速赶超ChatGPT。

2、图像理解能力明显领先,数字人形象、音视频轨道一气呵成

多模态能力是赋能千行百业的刚需,也是实现通用人工智能的必经之路。

去年1月,科大讯飞提出了未来10年的登月计划,就是懂知识、善学习、能进化,让机器人走进每个家庭,这中间最重要的技术就是多模态的感知、多维表达、深度理解。

大模型的多模态能力包含图像描述、图像理解、图像推理、识图创作、文图生成、虚拟人合成。当演示人员输入风景图、萌宠图、家庭场景图片时,星火都能对图片中的主要物体、人物进行描述,还辅以环境氛围的表述。如果用户想要配合图片发朋友圈,星火还能给出朋友圈文案。

此外,星火还支持用户现场拍照,将图片上传进行描述。

刘庆峰谈道,在国内业界公开可测的大模型中,星火对图像的理解能力明显领先

在文图生成能力方面,不管是“阳光下的小女孩开心的笑着”的人物图片,还是“雪山壮丽景色”的风景图,星火都能胜任,用户还可以追加在雪山图片中加入“一个小女孩在登山”的元素。

多模态合成能力中,星火一举撑起了文案、后期、剪辑、配音……的工作,当让它“创作一篇立秋抒情散文,并用一个短发民国风的女生形象生成视频”,讯飞小助手就可以快速生成视频,用户还能变更数字人的形象、声音、视频的背景。

整体来看,讯飞星火大模型各项能力表现优异,在国内主流大模型测评榜上,其“智商”排名也名列前茅。8月12日,8月12日,新华社研究院中国企业发展研究中心发布的《人工智能大模型体验报告2.0》中,讯飞星火以1013分位列本次国产主流大模型测评榜榜首,在“智商指数”和“工具提效指数”两个维度获得第一。

二、星火化身资深代码工程师、剪辑师、口语老师、助教……

与此同时,科大讯飞正在将大模型的强大能力打造成用户快速可用的产品。

1、iFlyCode:零代码基础也能编程?10分钟开发“凌空手写”应用

基于星火大模型的强大代码能力,讯飞推出智能编程助手iFlyCode,五项代码能力也已经无缝集成到用户的开发环境中。

演示现场,iFlyCode接到的第一项任务就是“开发凌空手写的应用”。

首先,iFlyCode给出了一些实现的思路,开发者需要采集视频流、手部主要点位检测、侦测捏动手势、生成轨迹点。随后,它给出了具体的实现步骤,用户可以直接点击步骤,调用相关的代码、函数来辅助完成应用开发。

一开始,iFlyCode辅助生成的应用中,用户手部的关键帧时独立的点。基于星火的修改代码能力,用户可以选中整个代码,输入“将轨迹点颜色改为黄色,用线条连接”的修改代码命令。改完后,用户还可以快速比较修改前后的代码然后进行快速替换。

刘庆峰感慨道,结合星火大模型的能力,用python代码完全实现凌空手写的应用开发只需要10分钟内,之前有经验的代码工程师可能需要半天才能完成。他补充说,讯飞内部已经有2000多个员工开始使用这一代码工具,工程师的采用率提升了30%以上。

2、讯飞智作2.0:后期剪辑、配音演员、文案编辑,一个工具统统解决

基于星火大模型的多模态能力,讯飞升级了讯飞智作。

讯飞智作是讯飞2017年推出的虚拟形象配音产品,刘庆峰谈道,冬奥会、大运会、世界田径运动会吉祥物的语音都是讯飞创建的,现在讯飞将虚拟形象配音的能力开放出来。讯飞智作2.0升级了AI后期和创意视频两个功能。

AI后期功能中,讯飞智作可以为视频生成文案、配音。例如“用散文风格描写泾县桃花潭夏末秋初晨雾弥漫的美景”,用户可以输入视频配文的主题、选择配音主播形象、声音。然后讯飞智作就可以将文字和画面对齐生成视频。

创意视频中,用户可以直接输入视频要求、上传相关的图片。当企业想要生成黄山毛峰的宣传视频时,可以先让讯飞智作生成一段“包含茶叶的产地、包装、色泽等特点”的宣传文案,然后基于用户上传的配图和讯飞智作使用AI生成的相关图片来生成视频。

这样一来,企业不需要花很大代价去拍摄相关的视频和图片,就能快速生成宣传视频。

3、星火语伴2.0:随手拍就能口语对话,模拟真人雅思考官

星火语伴2.0全新升级,能让用户练习口语时实现更深入的交流,用户可以选择感兴趣的场景进行交流,对话结束后,星火语伴还会生成一个对话小结。

为了让对话交流和日常生活的关联度更密切,用户还可以拍摄自己手边书上的内容来进行交流,这也能让星火语伴有更丰富的口语对话来源。

此外,还有大学生普遍需要的四六级、雅思、托福等,星火语伴可以模拟更加真实的人机互测,让用户与雅思考官模拟面对面对话。测试结束后,该应用还会给出用户准确度的得分,并给出相应的推荐课程。

场景理解的大模型对话能力加持下,众多领域的工作人员都可以通过大模型的能力来提升工作效率。

4、星火教师助手:帮老师做课件、布置作业,还能一键生成课堂思维导图

讯飞畅言智慧课堂已经落地到全国1200多万师生中,基于人工智能可以分析学生的情况,实现因材施教。目前,全国教育开始实现以素养培养为核心的教育“三新”改革,这一过程中,教师会面临单元教育规划下创新难、教学活动设计资源少、课件制作负担重的难题。

因此,针对上述三大难题,星火教师助手可以帮助教师完成整个备课环节。

星火教师助手能快速生成相应主题的课堂设计文档,同时,教师还可以在已生成的环节中添加活动。一般而言,教师想要达到理想的教堂授课效果,还需要大量精力去融合其它素材。现在,这一助手能基于教学设计、大模型的理解能力,帮助老师一键生成课件,并根据教学内容自动填充相关多媒体内容,还会加入对应的图片、视频、表格。

活动小结中,星火教师助手还能生成思维导图,帮助学生提升结构化思维能力。

三、大模型深入行业应用,联合华为发布星火一体机

今天,国家首次针对生成式人工智能产业发布的规范性政策《生成式人工智能服务管理暂行办法》正式实行,这一《办法》对提供和使用生成式人工智能服务的总体要求进行了明确。与此同时,这也标志着国内已发布的上百个大模型已开启应用落地PK战。

科大讯飞的大模型应用落地已经走在前列。早在2022年底,科大讯飞就正式启动了“1+N”认知大模型专项攻关,“1”是通用认知智能大模型,“N”是大模型在教育、办公、汽车、人机交互等领域的落地,以行业应用为导向的布局也与产业变化相契合。

当下,讯飞已经和汽车、金融等行业达成合作,汽车厂商奇瑞搭载星火大模型的产品即将发布。在教育领域,讯飞学习机的销量大幅上涨,今年5月至今同比增长了180%。刘庆峰谈道,讯飞要做的就是将大模型赋能到类似行业中的相应场景。

除此以外,认知大模型的深度赋能时代已经到来,现在的大模型参与者不仅要看到技术能做什么,还要构建一个健康安全的产业推广环节和能力保障,刘庆峰认为,这聚焦于三大关键要素,分别是安全可控场景驱动专属模型

其中安全可控主要包含内容和算力的安全。内容安全指的是生成内容的价值观、准确度都要安全,内容不安全会导致污语料、“幻觉”出现,如果大模型学习的是不干净、错误的数据,就会导致生成结果是有问题的。

科大讯飞承建了语音及语言国家工程技术中心,可以面向全世界收集信息,然后通过语种、质量、隐私、安全等判别器来清洗得到高质量语料。

在算力安全方面,科大讯飞和华为联合,将高算力、高性能的算子库、多卡高速互联和分布式存储相结合,在此基础上打造训推一体设计的自研大模型训练平台。刘庆峰透露,该平台单卡算力已经开始对标英伟达A100芯片

场景驱动方面,就是要让大模型在看得见摸得着的场景上产生实实在在的应用价值。

专属模型,讯飞和华为正在联合打造大模型训练国产算力集群,包含5种定制优化工具,企业可以直接打包开发,有了这些能力,企业就可以打造自己的专属大模型。

今天,科大讯飞联合华为发布了帮助企业快速部署的星火一体机。这一设备既允许企业从头到尾训练大模型,也能基于讯飞星火大模型针对场景快速优化。

刘庆峰认为,通用人工智能时代的发展正在彻底改变当今社会的生产和生活方式,谁能率先推出拥有持续算力和最好的算法,就可以源源不断的汇聚数据,形成全球的“最强大脑”。

结语:大模型的新战场,应用落地正加速

站在今天的新节点上,国内大模型间的应用落地之战已经揭开帷幕,科大讯飞成为率先出手的厂家之一。这已经是讯飞星火大模型年内第三次升级,不论从大模型能力,还是星火的行业应用进展来看,星火大模型的影响正在辐射至各行各业,教育、金融、汽车行业的联合应用落地已经初见成效。

下一步,今年10月24日,讯飞星火大模型的能力将对标ChatGPT,明年将对标GPT-4,随着大模型能力的不断提升,其对于不同行业的实质影响也会愈发凸显出来。

未来,大模型与各行各业的结合必将更加紧密,不同行业的“进化”浪潮将势不可挡,为每个人打造AI助手的愿景或许很快就可以实现。

标签:

生活指南
  • 虚报收入!伦敦一审计公司及高管遭SEC指控

    每经AI快讯,美国证券交易委员会(SEC)当地时间8月14日公告,其对伦敦

  • 新华社研究院发布国产大模型体验报告 讯飞星火智商指数和工具提效指数居首

    上证报中国证券网讯8月12日,新华社研究院中国企业发展研究中心发布《

  • 乘网约车遇交通事故后自行翻越护栏摔伤,八旬老人起诉司机被驳回

    8月3日,新京报记者从北京市海淀区人民法院(以下简称“海淀法院”)获

  • 上半年兵团经济运行回升向好 实现生产总值1223.02亿元

    记者8月2日从新疆生产建设兵团统计局获悉:今年上半年,新疆生产建设兵

  • “大家放心!已经到北京了!”

    原标题:“大家放心!已经到北京了!”(主题)——K396次、Z180次、K1

  • 金阳新能源(01121)附属拟向徐州金昇租赁徐州大黄山街道的一处土地上的建筑及配套设施

    智通财经APP讯,金阳新能源(01121)发布公告,于2023年8月1日(交易时段

  • 什么贷款可以分期10年 有这几种选择

    为了减轻还贷压力,很多人都希望贷款年限越长越好的,但市面的借款期限

  • 2023年常州第七届太湖湾音乐节门票价格表

    一、2023年常州第七届太湖湾音乐节门票多少钱?门票类型价格详情早鸟票

  • 世界微速讯:去香港迪士尼要多少钱?香港迪士尼乐园城堡可以进去吗?

    去香港迪士尼要多少钱?香港迪士尼乐园比较大,去香港旅游的朋友可以

  • 当前快播:电子支付系统有哪些功能?电子支付安全方面的案例有哪些?

    电子支付系统有哪些功能?1业务信息的保密和完整性。2交易双方身份的

  • 怎么下载网页上的视频?如何下载手机网页视频到本地?-环球时快讯

    怎么下载网页上的视频?1、打开360浏览器,然后点击右上角的管理小图

  • 兰州黄河岸边的夏日经济 环球速读

    新华社兰州7月3日电。

  • 全球热头条丨外资企业资本金账户如何开户(外资企业资本金账户变更的操作流程)

    外资企业资本金账户如何开户1、客户持有关资料到外汇局资本项目科办

  • 西安买共有产权房还要缴纳契税吗?

    需要的,西安共有产权房也属于可买的房子,需要缴纳契税!西安目前的契

  • 徐霞客是哪个朝代的?徐霞客游记主要写了什么?

    徐霞客是明代的。徐霞客名宏祖,字振之,号霞客,江阴马镇乡南肠歧

  • 公益性岗位指的是什么?公益性岗位的补贴标准是什么?

    公益性岗位指的是什么?公益性岗位是指各类用人单位开发并经人力社保

  • 民生
    • 上下到厅隆胸手术价格新鲜出炉 术后让你美美哒

    • 独立女性解说小楼微博打拳!称男生觉得彩礼高房价贵可不结婚

    • 寒亭经济开发区_关于寒亭经济开发区介绍

    • 上市公司“离婚式”减持将迎强监管