从今年的各大科技展会观察,大模型的“卷”已经从炫技走向服务。除了追求更高的智能化水平、更强的算力支持,更多的是热潮下的冷思考:如何突围大模型应用难题。
2024云栖大会,多家企业展示了代码大模型在企业实际应用中的价值,其中浩鲸科技在“垂直大模型,全面释放数字生产力”鲸智大模型发布会上重磅推出鲸智代码大模型,其大模型创新中心首席专家张林表示,该产品专注细分领域软件开发全场景、端到端提质增效,帮助企业研发范式升级。
鲸智代码大模型的诞生
浩鲸科技是全球领先的数字化技术和服务的提供商,致力于帮助全球客户实现向数字经济的跨越。公司成立于2003年,迄今已为全球80多个国家和地区的电信运营商、公共服务部门及其他行业客户提供优质的数字化转型解决方案和全栈产品技术服务。
据张林介绍,在公司成立至今的20余年间,累积了大量行业知识文档和代码,这是鲸智代码大模型诞生的一个背景。“鲸智代码大模型是基于基础模型,通过我们私域数据二次训练而来的一组大模型,目标就是专注提升细分领域的软件开发效率和质量,为我们的客户提供更加高效、高质量的软件交付能力。”
张林表示,软件自动化工程Automatic Software Engineering (ASE)这个研究方向也有较长时间,最近大模型的能力快速发展,也让ASE领域重新火热起来,总的来说距离软件开发平权还有相当的一段距离,这个过程也会非常依赖AI技术的发展。按照对ASE和AI技术的发展情况,可将这个过程分为3个阶段:
(1)人类为主,AI为辅。
这个阶段主要是以开发助手的产品形态提供给开发人员,包括通义灵码,GitHub Copilot等,浩鲸科技提供的CodingPlus也是这种形态的产品,集成在IDE工具中,提供代码补全,方法级的代码生成,写注释,写单元测试等功能,主要辅助开发人员进行代码开发。
(2)人类和AI相互协作。
这个阶段主要是以AI软件工程师的产品形态提供给开发人员,包括前段时间比较火热的Devin,各高校和论文一起发布的SWE-Agent和AutoCodeRover,阿里巴巴发布的Lingma Agent,以及这次浩鲸科技在云栖大会发布的研发智能体Dever。
(3)AI为主,人类为辅。
这个阶段主要是以AI软件工程师,甚至AI软件公司的产品形态提供给业务人员,这个阶段基本已做到了软件开发的平权,软件的开发很大程度变成了黑盒或者灰盒,大部时间将放在需求的输入以及输出效果的检查确认。
鲸智代码大模型重点针对前两个阶段,目前已经在浩鲸科技内部应用取得不错的效果。至于第三个阶段,重点取决于基础大模型的能力,后续发布的大模型能否很好解决目前推理多步规划,上下文长度限制,长上下文导致的推理精度下降等问题,目前还没明确答案。
图1 鲸智代码大模型目标
鲸智代码大模型“全家桶”
鲸智代码大模型是基于基础模型,通过浩鲸科技私域数据二次训练而来的一组领域代码大模型,包含了细分领域的产品业务知识和代码知识,除此以外,还包含了跟鲸智代码大模型配套的知识图谱相关的内容。在鲸智大模型之上,全家桶还包含CodingPlus代码助手,Dever研发智能体,灵犀代码平台三款产品,支持我们业务开发的提质增效。
图2 鲸智代码大模型整体
1、代码助手CodingPlus
CodingPlus是浩鲸科技自研的代码助手类产品,从功能角度来看,跟大家接触到的Github Copilot,通义灵码等产品并没有太大区别,深入使用后,将会发现里面的内容很不一样。这主要因为CodingPlus产品是通过公司累积的领域知识,产品文档以及产品代码的二次训练,相较基模而言,更像是我们这个领域的业务专家和代码高手。此外,该产品将产品文档知识进行工程化的抽取,对代码结构进行工程化解构,以达到让代码助手能够对公司内部产品代码具备更准确的补全能力,提高代码的采纳率。
图3 代码助手CodingPlus架构图
用Java语言测试用例集对鲸智代码大模型WhaleGPT-Coder和CodeQwen1.5-7B从三个维度进行了评估,包括业务代码补全,通用代码补全,以及浩鲸科技内部core框架使用的补全,其结果参见图4,可以发现各维度都有较大幅度提升。
图4 鲸智代码大模型测试对比
2、研发智能体Dever
过去大家接触到的研发智能体包括SWE-Agent和AutoCodeRover,阿里巴巴发布的Lingma Agent,主要还是针对代码故障修复的SWE-bench用例集,对新需求的开发并未涉及。浩鲸科技针对自己的行业特点,发布了AI研发智能体产品:Dever,该产品跟之前各厂商发布的研发智能体产品有很大不同,其特点总结如下:
(1)具备新需求的开发能力,这个是目前已知很多研发智能体所不具备的,Dever覆盖了软件开发流程中架构师,前端开发,后端开发的多个角色,具备端到端的需求开发能力。
(2)人和AI软件工程师一起结对开发模式,跟MetaGPT,AutoGen全自动相比,Dever采用了半自动的结对开发方式,人和AI软件工程师具备双向交流的能力。
(3)定义基于AI智能体的软件开发SOP(Standard Operating Procedure)中,每一个环节仍然由每个环节的人来对结果输出负责,AI软件工程师只是辅助的助手,这样确保下一个环节输入的准确性,让该环节AI工程师的输出更加准确。
图5 研发智能体Dever
研发智能体Dever的相关功能参见图4,主体功能还是以长流程端到端研发;除此以外,也针对前端开发提供了界面代码的快速生成能力。目前已经在新产品和新项目中推广使用,相比较传统手工开发方式,在AI软件工程师的助力下,架构师、前端开发、后端开发都有20%-30%的效率提升,此外在代码标准化,代码可读性等方面都有较大提升。
图6 Dever功能说明
3、灵犀低代码平台
除了手工编码的效率提升,浩鲸灵犀开发平台也通过鲸智大模型进行了升级。在低代码可视化拖拽开发的基础上,增加了新的开发模式:自然语言描述式开发,对话框输入用户需求,低代码会自动生成可视化的界面,拖拽操作都可以省掉,进一步降低门槛,提升操作效率。
图7 灵犀低代码平台
大模型加持下规划构想
图8 鲸智代码大模型的后续演进路线
随着基础大模型的能力升级,代码大模型也在持续演进,不断提升代码生成与理解能力,支持多语言与复杂任务处理,强化自动化测试及优化功能,同时注重安全性和责任性,以更好地辅助软件开发全流程,提高开发效率与质量。
据张林介绍,后续鲸智大模型还将继续专注在细分领域的软件开发提质增效,尤其是研发中的V4.0版本,将更多的注意力放到增量需求和故障定位这两个大场景。随着基模能力增强,再加上鲸智代码大模型对细分领域数据的不断积累,以及相关工具和产品能力的提升,未来在客户需求的交付质量和速度方面将会有更大进步,以满足我们不同行业客户的数字化和智能化转型需求。
1、本站所有资源均从互联网上收集整理而来,仅供学习交流之用,因此不包含技术服务请大家谅解!
2、本站不提供任何实质性的付费和支付资源,所有需要积分下载的资源均为网站运营赞助费用或者线下劳务费用!
3、本站所有资源仅用于学习及研究使用,您必须在下载后的24小时内删除所下载资源,切勿用于商业用途,否则由此引发的法律纠纷及连带责任本站和发布者概不承担!
4、本站站内提供的所有可下载资源,本站保证未做任何负面改动(不包含修复bug和完善功能等正面优化或二次开发),但本站不保证资源的准确性、安全性和完整性,用户下载后自行斟酌,我们以交流学习为目的,并不是所有的源码都100%无错或无bug!如有链接无法下载、失效或广告,请联系客服处理!
5、本站资源除标明原创外均来自网络整理,版权归原作者或本站特约原创作者所有,如侵犯到您的合法权益,请立即告知本站,本站将及时予与删除并致以最深的歉意!
6、如果您也有好的资源或教程,您可以投稿发布,成功分享后有站币奖励和额外收入!
7、如果您喜欢该资源,请支持官方正版资源,以得到更好的正版服务!
8、请您认真阅读上述内容,注册本站用户或下载本站资源即您同意上述内容!
原文链接:https://www.shuli.cc/?p=21260,转载请注明出处。
评论0