凝聚406万开发者,百度飞桨开源框架再升级!全景图新增文心大模型

凝聚406万开发者,百度飞桨开源框架再升级!全景图新增文心大模型

原标题:凝聚406万开发者,百度飞桨开源框架再次升级!全景图中添加了新的文心模型。

智能物联(微信官方账号:zhidxcom)

作者|杨昌

编辑|心脏边缘

知止12月12日报道,在百度WAVE SUMMIT+2021深度学习开发者峰会上,百度给开发者们带来了沉重的“双12”礼包。

在本次峰会上,百度发布了其深度学习框架平台PaddlePaddle的最新全景图,并推出了PaddlePaddle行业实践范例库和大导航计划2.0。

飞行行业级深度学习开源开发平台迎来最新发布,升级了开源框架和工业模型库,发布了三个统一的硬件适配方案;飞桨企业版的机型部署能力也迎来了升级,新增了三大功能。Feipaddle还在峰会上推出了EasyDL桌面版。

此外,国家电网上海电力公司调度中心副主任肖飞、中国科学院计算机网络信息中心人工智能技术与应用开发部主任王彦舟、网易云音乐机器学习平台及框架负责人段诗诗等分享了飞桨在产业生态、人才培养、开源共建等方面的最新进展。

1。最新的螺旋桨全景图发布,展示了螺旋桨的开源框架v 2.2

基于技术的发展和飞桨的实践,百度首席技术官王海峰认为,目前人工智能的特点是集成创新、降低门槛。

在融合创新方面,一是知识与深度学习的融合,二是跨模态多技术融合,三是软硬件融合,四是技术与场景的融合,都在不断优化。

在降低门槛方面,首先从技术角度来说,飞桨可以满足不同开发者的需求;其次,从工具平台来看,飞桨搭建了推理部署工具链,使得部署更加便捷;再次,从生态角度,飞桨为开发者准备了产业案例库,加速企业智能化升级。

那么,飞桨在过去半年具体有哪些升级?

1。发布螺旋桨行业实践范例库,将大航海计划升级到2.0

在峰会上,百度集团副总裁吴添表示,飞桨已经聚集了406万开发者,打造了47.6万个模型,服务了15.7万家企事业单位。

吴添宣布,朱非发布朱非最新全景图,朱非工业模型库新增文新车型系列车型。

飞桨最新发布的飞桨行业实践案例库,全部是从真实场景中提取的。通过完整的代码实现,为用户提供了详细的流程分析,最终帮助开发人员直接进行项目落地。

吴添以火灾/烟雾探测场景为例,将飞桨行业实践范例基地的内容概述分为五个步骤。第一步是场景分析,通过对场景中问题的定义,对难点和重点的分析,将问题锁定;第二步是算法选择;第三是模型训练和调优;第四步是推理部署;第五步是整合和上线。

目前,螺旋桨行业实践范例库覆盖10大行业、22个工业高频场景。

百度还带来了飞桨大航海计划2.0的发布,并加入了共创计划,分为三个方面。

首先是由社区开发者基于飞桨平台创建工具、模型、工业案例和实践经验。

二是形成产业创新需求对接平台,打造产学研正循环。

三是与更多合作伙伴共建AI产业赋能中心,打造区域创新生态。

2。发布螺旋桨的开源框架V2.2,包括四个特性

百度深度学习技术平台部高级总监马分享了最新发布的产业级深度学习开源开发平台。

马表示,今年上半年以来,飞桨的开源框架已经进入2.0时代,今天发布的是2.2版本,涉及开发、培训、文字的全过程,以及多层次、低成本的硬件适配方案等四个方面的最新特性,为硬件生态系统赋能。

推进器增加了100多个API,覆盖了更多的计算场景,所有的API都实现了高性能,推进器也保证了前向兼容性。

在训练方面,新飞桨是端到端的自适应大规模分布式训练,动态感知硬件资源的变化。

升级后的飞桨开源框架以端到端文本处理、预训练任务加速、生成任务解码加速和训练推送一体化部署体验四大特点,加速了文本任务的全流程。例如,在工业部署中,代码可以减少94%,代码文本的数量可以减少。

马还介绍了新的统一硬件适配方案。三种技术方案分为三类。第一类是运算符的开发和映射,第二类是Graph的访问,第三类是编译器后端的访问,具体包括Kernel Primitive API、NNAdapter和神经网络编译器CINN。

内核原始性应用编程接口方案封装并抽象了底层内核的开发工作。开发人员在编写更复杂的kernel时,可以利用底层封装的Kernel,使得计算更加简单,加快了内核的开发速度,降低了操作符适配的成本。代码被高度简化,一次优化可以让很多地方受益。

底层封装了NAdapter统计适配层方案这种减少操作符定义和框架调度的程序,硬件不需要知道框架背后传递的一系列逻辑,也不需要进行侵入式修改,代码更容易维护。

蒋菲还预发布了硬件适配的第三个统一方案:神经网络编译器CINN。

神经网络编译器CINN方案旨在深度优化飞行螺旋桨的框架,支持训练和推理。在基本算子的基础上,通过组合实现更复杂的算子,减少算子自适应次数,降低硬件自适应成本,保持训练性能与人工极值优化相当。

螺旋桨工业模型库也进行了升级,既注重精度又注重速度,正式推出工业PP模型,发布13个PP系列特色模型。

3。EasyDL推出桌面版,只需点击即可快速安装

AI产品研发部主任忻州表示,随着模型参数的增加、芯片的多样化以及应用场景的多样化,模型部署的复杂度也在增加。

他介绍了FLOAR企业模式的部署和升级。基于FLOAR模型框架下推理部署的工具链,结合平台优势,FLOAR为企业打造了自动化高效的企业级部署功能,具有显著提升推理性能、广泛适配推理芯片、大幅提升部署效率三大特点。

基于PaddleSlim和预设的多种前沿压缩算法,Feioar提出根据模型框架、硬件和压缩级别自动选择最优压缩路径。对于常见的模型和硬件,如果平均精度损失控制在1%以内,推理性能可以提高3-5倍。

推进器基于自身的推理引擎,采用组匹配的方式对9345种模型芯片组合进行测试验证,覆盖了95%的适配需求,平均节省了97%的模型匹配开发时间。

飞桨企业版还提供了智能边缘控制台的功能,帮助开发者可视化管理硬件、时间、监控和运维。

忻州还新发布了EasyDL桌面版飞桨,可实现一键快速安装,广泛兼容多种操作系统,可本地高效建模,为有数据保密要求的开发者提供帮助。

其次,AI助力千行百业,飞桨加速AI落地

飞桨已服务15.7万家企事业单位。在各行各业落地时,结合实际场景进行了多种融合创新。无论是电力行业、科学领域还是互联网领域等传统行业,飞桨都帮助更多的开发者使用AI,加速了这些开发者行业的发展。

1。国家电网肖飞:新电力系统建设迫在眉睫,AI助力多场景任务优化

国网上海电力公司调度中心副主任肖飞以“ai助力新电力体系建设,服务“双碳”战略目标”为题,分享了一些关于国网和AI的故事。

随着二氧化碳排放峰值和碳中和的提出,以及各种主客观因素的影响,国家电网作为能源消费大国,需要建设新的电力系统。

新电力系统建成的标志是新能源发电占主导地位,新能源机组承担主体责任地位。然而,风能、太阳能等可再生能源存在不确定性。对于国家电网来说,这代表了相当多的挑战,比如电力调度领域,需要数字化、智能化升级。

肖飞列举了国家电网在清洁能源高效消耗、源网储充友好互动、系统安全稳定运行、电力市场低碳经济、新一代调度支撑体系建设等场景下的AI需求和AI时间。

他表示,飞桨助力国家电网举办全国人工智能创新大赛,规划了四条主题赛道,助力国家电网实现更多AI应用开发落地。

2。中科院王彦昌:传统科研领域应该成为AI的主战场

中国科学院计算机网络信息中心人工智能技术与应用发展部主任王彦舟作了题为《面向科学发展的智能计算环境》的演讲。

他提到,传统的科研领域应该成为AI的主战场。早在2016年,美国的一些科学家就已经在一些废弃的实验数据中发现了一些新的材料,以至于最近很多科学家都尝试用人工智能的方法来代替一些材料的计算过程,希望通过人工智能更快更准确地得到一些结果。

王萌说,他们把人工智能的应用更多地看作是高性能计算的问题,通过虚拟化、容器、高性能计算和任务调度,实现了整个底层资源的调度。在飞桨的支持下,他们完成了图像处理和自然语言处理等一些任务。

3。网易云音乐板块的石头:三个阶段,完善推荐系统

网易云音乐机器学习平台及框架负责人段诗诗以“飞桨图计算助力超大规模推荐系统创新迭代”为主题,详细讲述了网易云推荐系统的升级体验。

面对超大规模数据、多领域数据和动态数据标签的情况,如何理解用户的意图,如何有效地表示这些信息,成为亟待解决的难题。传统的机器学习在这方面存在瓶颈。

费的支持超大规模数据的全图存储、子图检索和高效的图计算,具有存储成本极低、子图检索方式灵活、分布式训练高效等特点。网易云音乐选择用PGL升级。

通过三个阶段的改进,网易云音乐将PGL接入其现有的机器学习平台,进而成为网易云音乐机器学习平台的基础能力。

第一阶段使用EasyGraph组件,第二阶段抽象PGL算子支持PGL在机器学习平台Kubernetes环境下快速稳定运行,第三阶段根据图神经网络在线和离线使用方式的不同,抽象两个逻辑满足应用需求。

关于未来规划,段诗诗谈到了打造音乐社区用户和内容理解中心,应用基于知识图谱的图神经网络,最后与飞桨合作,推动图神经网络在行业落地。

三。AI人才培养存在挑战,开源和共建可以助力飞桨的生态成长

它是人工智能产业发展的要素之一。如何培养人才是关键。除了依靠学校和企业的共同努力,兴趣可能是更好的老师,飞桨的生态和开源,让对AI感兴趣的人更容易接触到AI并进行相关实践。

1。AI人才培养与产业需求存在三大脱节,其核心是校企协同教育

AI的发展归根到底要靠人才。在“产业发展新阶段AI人才培养的机遇与挑战”圆桌论坛上,当谈到企业应该如何从高校角度充分发挥技术和产业优势,助力高校人才培养时,复旦大学教授王小洋表示,教育和产业两种不同的节奏在运行,企业要有耐心。另一方面,企业可以在通用技术方面做出更多努力。

上海大学计算机工程与科学学院院长谢少荣在讨论是否会根据AI技术的发展现状制定教学大纲时表示,首先要打好基础,其次要培养复合型人才。华东师范大学计算机科学与技术学院副院长周爱民表示,要充分发挥各自学校的优势,探索重叠形式。

峰会上,交通大学电信系副主任周新民还以“校企合作,协同育人,探索“精英班”创新人才培养新模式”为主题,介绍了交通大学电信系AI人才培养经验。

“精英班”模式主要解决高校专业设置与社会发展需求、教师工程实践能力与实践教学改革创新需求、创新实验平台与人才创新能力培养需求三个方面的脱节问题。

这种模式的核心是校企合作、协同育人,企业导师参与学校理论课程的教学,指导学生规划项目设计的课程。

2。Feipaddle和开发人员共同构建共生关系,有超过40个全球开源项目和社区组织作为合作伙伴

峰会上,来自开源社区ONNX的盛扎和来自开源社区Kubeflow的唐远分别分享了他们关于开源平台社区和飞桨平台社区的故事。

ONNX最初由脸书(现在称为Meta)和微软发起,目的是促进深度学习的交流,并通过定义内置操作符和标准数据类型来帮助模型在不同的系统框架之间进行交互。

盛扎表示,飞桨社区投资成立了飞桨和ONNX两个相互转化的项目,帮助开发者更高效地实现模型开发。

唐远说,库贝弗洛是一个基于Kubernetes开发的机器学习工具库,库贝弗洛在飞行桨方面发挥了更大的作用。

桨开发者(PPDE)技术专家曹志浩、高宏志也分别分享了他们使用桨的心路历程和项目情况。

高宏志介绍了两个项目,他和他的合作伙伴已经完成了飞行桨。第一个项目是通过将飞桨与沙漠控制机器人相结合来帮助沙漠绿化。第二个项目是配合飞桨AI开发套件,把机器狗变成导盲犬。现有导盲犬做不到的,机器狗可以做得更多。

【/s2/】结论:飞桨生态日益壮大,AI落地千行百业【/s2/】

从2016年宣布开源到今年,百度飞桨与众多开发者走过了五年,飞桨的生态也从0增长到406万开发者。基于百度飞桨的AI应用正在更多行业落地。

从飞桨很多开发者所做的工作来看,我们可以看到各行各业都在使用AI智能升级,加速发展,AI可能无处不在。回搜狐多看看。

负责编辑:

  • 姓名:
  • 专业:
  • 层次:
  • 电话:
  • 微信:
  • 备注:
文章标题:凝聚406万开发者,百度飞桨开源框架再升级!全景图新增文心大模型
本文地址:http://www.55jiaoyu.com/show-254473.html
本文由合作方发布,不代表展全思梦立场,转载联系作者并注明出处:展全思梦

热门文档

推荐文档