多知4月16日消息,百度创始人、董事长兼首席执行官李彦宏在Create 2024百度AI开发者大会上发表“人人都是开发者”的主题演讲,他指出,“AI正在掀起一场创造力革命,未来开发应用就像拍个短视频一样简单,人人都是开发者,人人都是创造者。”
大家好,欢迎参加Create 2024百度AI开发者大会,这是Create大会首次在粤港澳大湾区举办。今天现场来了5000多位开发者和科技爱好者。过去这一年,我跟很多创业者、开发者交流,感觉大家都处在一种“FOMO”状态,也就是Fear of Missing Out,既兴奋、又害怕错过。确实,大模型和生成式AI,将彻底改变开发者这个群体。
过去,开发者用代码改变世界;未来,自然语言将成为新的通用编程语言,你只要会说话,就可以成为一名开发者,用自己的创造力改变世界。
这一天并不遥远,我们看到,因为有了强大的基础大模型,有了很多低门槛,甚至零门槛的开发工具,开发者的生产力大大提高了。
比如,基于文心大模型的智能代码助手Comate,不仅支持100多种语言和所有主流IDE平台,可以推荐代码、生成代码注释、查找代码缺陷、给出优化方案,还可以深度解读代码库、关联私域知识生成新的代码。上岗一年多,Comate已经走入了喜马拉雅、三菱电梯、软通动力等上万家企业,生成的代码采纳率达到了46%,百度每天新增的代码中,已经有27%是由Comate生成的。
今天,你不会写代码,也可以做出一个AI应用;不用编程,也可以做出一个智能体。AI正在掀起一场创造力革命,未来开发应用就像拍个短视频一样简单,人人都是开发者,人人都是创造者。
作为一家技术公司,百度的角色定位,就是尽可能地为大家提供所需的开发工具,不断提升整个社会的创造力。具体来说,我们提供1个强大的基础模型系列,就是文心大模型系列,这包括旗舰版的ERNIE3.5, ERNIE4.0, 也包括轻量版的ERNIE Speed、Lite、Tiny等等。
我们还提供基于大模型来开发各种应用的工具,包括智能体开发工具AgentBuilder,AI原生应用开发工具AppBuilder,以及各种尺寸的模型定制工具ModelBuilder。这三个工具,都代表了先进生产力。下面,我会给大家一一展示。
文心一言从去年3月16日发布,到今天是一年零一个月的时间。我们的用户数突破了2亿,API日均调用量也突破了2亿,服务的客户数达到了8.5万,利用千帆平台开发的AI原生应用数超过了19万。
视频中的真人真事只是冰山一角。我们可以看到,文心一言正在改变更多人的工作和生活。
支撑文心一言的基座模型,就是文心大模型。过去一年,它经历了从3.0版本到3.5,再到4.0版本的进化。文心4.0在理解、生成、逻辑、记忆四大能力方面,均达到了业界领军水平。
近几个月来,文心大模型在代码生成、代码解释、代码优化等通用能力方面实现了进一步的显著提升,达到国际领先水平。
今天,我们正式发布文心大模型4.0的工具版,现在,大家可以在工具版上,体验代码解释器功能,通过自然语言交互,就能实现对复杂数据和文件的处理与分析,还可以生成图表或文件,能够快速洞察数据中的特点、分析变化趋势、为后续的决策提供高效精准的支撑。
不仅如此,相比一年前,文心大模型的算法训练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理的成本降到了原来的1%。
也就是说,客户原来一天调用1万次,同样成本现在可以调用100万次。媒体可能不会因为成本下降99%而兴奋。但是企业也好,开发者也好,一旦用起来,最关注的就是效果和成本。
我们能在提升性能的同时,把推理成本降到1%,正是因为百度在芯片、框架、模型、应用这四层架构上有着全栈的布局,通过端到端优化,不断地把成本打下来,让更多人都可以高效、低价地用大模型来做AI应用。
毫无疑问,大模型相关的线年依然会很热,各类技术突破还会不断涌现。媒体也会继续热衷于用“震撼发布”“史诗级更新”这样的标题进行渲染。但我想强调的是,大模型本身并不直接创造价值,基于大模型开发出来的AI应用才能满足线
今天我想跟大家分享的是一些基于大模型开发AI原生应用的具体思路和工具。这是我们百度根据过去一年的实践,踩了无数的坑,交了高昂的学费换来的。
第一是MoE。未来大型的AI原生应用基本都是MoE架构,这里所说的MoE不是一般的学术概念,而是大小模型的混用,不依赖一个模型来解决所有问题。但什么时候调用小模型、什么时候调用大模型、什么时候不调用模型,这都是有技术含量的,要针对应用的不同场景做匹配。
第二是小模型。小模型推理成本低,响应速度快,在一些特定场景中,经过SFT精调后的小模型,它的使用效果可以媲美大模型。这就是我们发布Speed,Lite、Tiny三个轻量模型的原因。我们通过大模型,压缩蒸馏出来一个基础模型,然后再用数据去训练,这比从头开始训小模型,效果要好很多,比基于开源模型训出来的模型效果更好,速度更快196体育app官网,成本更低。
第三是智能体。智能体是当下很热的一个话题,随着智能体能力的提升,会不断催生出大量新的应用。智能体机制,包括理解、规划、反思和进化,它让机器像人一样思考和行动,可以自主完成复杂任务,在环境中持续学习、实现自我迭代和进化。在一些复杂系统中,我们还可以让不同的智能体互动,相互协作,更高质量地完成任务。这些智能体能力,反思、规划、自我进化的能力,我们已经开发出来了,并且向开发者全面开放。
在MoE、小模型、智能体这三个方向上,百度都已经给大家做好了“开箱即用”的工具。下面,我就给大家介绍三种不同的工具,分别是:智能体开发工具AgentBuilder、AI原生应用开发工具AppBuilder、各种尺寸的模型定制工具ModelBuilder。
智能体开发工具AgentBuilder:智能体是里每个人最近最主流的大模型使用方式
百度刚刚升级了文心智能体平台。截至目前,已经有3万多个智能体被创建、5万多名开发者和上万家企业入驻。我们的目标是,让每个人、每个组织都成为智能体的开发者,打造国内最完整的智能体生态。
如果只需要基础智能体,平台会自动完成填写。但我们希望“新加坡旅游局”是一个专业的智能体,所以要进行高级配置。我可以把新加坡百科词条和官网链接都添加到知识库里196体育app官网,让它每天更新。然后添加一些工具,如酒店查询、景点门票购买等,增强它的服务能力。目前我们已经跟携程合作,提供了酒店、景点、票务等旅游服务工具。这样,一个新加坡旅游局的智能体就做好了,可以进一步预览、调优。
现在打开百度APP,搜索“什么时候去新加坡人最少”,因为大家出去旅游都想避开人潮。智能体会综合多个来源的信息,生成一个答案,“1-3月人最少”。我们还可以点击智能体,和它进一步互动,比如去新加坡旅游的注意事项,推荐新加坡排名前三的酒店,还能让它直接预订新加坡环球影城的门票,一站式解决需求,大大节省了用户时间。
今天,每一个商家、每一个客户,都能在百度拥有专属的智能体。整个过程完全不需要编程,通过类似提示词的信息输入,和简单的几步操作调优,就能迅速生成一个智能体,成为7X24小时在线的金牌业务员。
索菲亚是专注全屋定制的家居品牌。就像刚刚展示的,它也可以通过填写极其简单的信息,创建出一个基础的商家智能体。但对于家居行业,消费者的线验更重要,所以索菲亚希望能在线上打造出一个金牌销售,还原线下的接待体验。
目前,已有超过1万个百度的客户拥有了商家智能体,涵盖了教育培训、房产家居、机械设备、商务服务等超过30个行业。
下面,我给大家介绍第二个开发工具,AppBuilder。它是目前最好用的AI原生应用开发工具。在AppBuilder上面,我们提前封装和预置了开发AI原生应用所需的各种组件和框架,大幅降低开发门槛。
最快只需三步,开发者就可以用自然语言开发出一个AI原生应用,并且能够便捷地发布、集成到各种各样的业务环境中。我们来看几个案例:
今年年初,我们搞过一期AI原生应用开发挑战赛,赛题是利用AppBuilder打造一款“游乐场排队规划助手”,帮助游客更好地了解游乐场排队情况,设计个性化的游玩路线,在有限时间内获得最好的游玩体验。
现在,我们来测下效果,在右侧输入问题“我有3个半小时时间,怎么玩最刺激?”,可以看到,代码解释器将这个问题翻译成了代码,再调用数据理解工具,对已知条件进行分析。经过一系列计算,得出将《哈利波特禁忌之旅》、《侏罗纪大冒险》、《霸天虎过山车》、196体育平台首页《大黄蜂回旋机》,这四个项目组合游玩,效果最佳。测试没问题,点击发布,在零代码的情况下,一个应用就生成了。
今年年初,华北电力大学提出,希望为全校师生提供智能化的专属服务。基于百度的AppBuilder,我们共同打造了一个华电AI助理,下面,我来给大家展示一下,华电AI助理是怎么做出来的:
最新推出的智能漫画和画本生成功能,就利用了AppBuilder上提供的这类组件。我们来看看,的漫画生成功能,是如何让每一个有创想的人,都能做出好作品的。
漫画生成后,我们可以在的智能漫画编辑器里,浏览完整的漫画。同时,文库支持对每一个画面进行编辑、修改和精调,比如,在左侧选中画面“周处与白额虎”,点击编辑,增加画面描述“人物面容清晰,画面明亮”,就能精调出更符合需求的漫画。大家看到,的漫画功能在角色和场景的风格一致性方面,都做得非常出色。
不止生成漫画,现在还可以帮助用户零门槛的创作画本。大家可能不知道,中国小孩一年的人均绘本阅读量只有10本,而欧美国家是50本左右。现在,AI能够让完全没有绘画能力的父母,也可以为自己的孩子创作一个专属的儿童画本了。下面我们就来看一下这个图文并茂的有声画本吧!
刚才我用三个案例,展示了如何用百度的AppBuilder,做出AI原生应用。大家应该能够感受到AppBuilder的两个明显优势:
一是功能强大。依托文心4.0对指令的理解和遵循能力,我们的AppBuilder,能保证冷启动就能达到一个不错的水平,不会因为效果差,再花很长时间去调优,大大降低了开发门槛。依托检索增强技术RAG,在知识问答等典型场景,我们的问答准确率和友好回复程度都达到了95%以上,大幅超越其他同类产品。AppBuilder还提供丰富完整的组件工具,包括百度搜索等基于百度多年技术积累的AI能力组件、大模型能力组件,还有百度独家开放的业务组件等55个组件。以及一些主流场景的第三方API,比如航班查询、论文查询等。我们还刚刚支持了自定义组件,客户可以直接对接自己专有的任何工具和数据。这些丰富的组件,共同支撑起了AI原生应用的高效开发。
下面我再介绍一下更适合专业开发者使用的工具,那就是ModelBuilder,它可以根据开发者的需求定制任意尺寸的模型,并根据细分场景对模型进一步精调SFT,这样就能达到更好的效果。对开发者来说,用好大模型很重要的一件事儿,就是掌握模型精调的方法。
我们以教育行业的作文批改场景来举例。因为作文批改有明确的评分标准,并且不同年级对作文的要求和打分标准,也是不同的。这就需要模型精调,让大模型输出的结果,更符合特定的要求。
第一步:创建数据集。模型精调的效果很大程度依赖我们的数据质量。在这个案例中196体育app官网,原始数据只有180条,质量也不够高。我们就需要用到三个功能:数据清洗、数据标注和数据增强。数据清洗,可以快速去除数据的空缺、乱码等问题。数据标注方面,我们对作文增加了更多维度,比如内容深度、写作手法等评价。数据增强功能,可以生成同类但不重复的数据,进行数据扩充。扩充后,ModelBuilder给我们生成了920条高质量数据。
我们将一篇学生的作文及批改格式要求,输入到精调前后的两个模型里。来看下,两个模型及老师点评三者的对比。可以看到,精调后的大模型拥有了更加专业的老师点评思维、更好地做了格式遵循。原本老师需要较长时间才能完成的作文批改任务,现在借助大模型,几秒钟就可以快速完成,大大地提升了给学生反馈的速度和效率。目前,这一类精调后的模型,已经在多个教育行业的头部企业中应用起来了。
我前面谈到大型AI原生应用一般都是MoE。那么,该如何组合使用这些模型,获得最好的性价比呢?下面,我就用小度来展示一个MoE模型路由的案例。我们首先来看看,有了大模型的加持,小度是不是变得更聪明了:
2.IDC公布数据显示,2024年第一季度,全球智能手机市场苹果下滑近10%,三星重回榜首。
3.近日, 微软公司宣布将在日本投资29亿美元,用以扩充其在当地的数据中心……
您与张总晚餐安排在18:00-19:30,结束后,您将在20:00参加管理层会议,21:30左右结束
刚刚,我向小度提出了好几个问题,其中既有简单的新闻问询,也有复杂的日程安排需求。看起来是跟同一个小度在交流,其实背后调用了不同的模型。当它接受到我的问题后,先是由小模型ERNIE Tiny执行了“模型路由”的工作;对于天气问题,它根据天气查询的结果,调用基于ERNIE Lite打造的精调模型,也是经过SFT的ERNIE Lite,给出了穿衣建议;对于更复杂的日程安排,则调用了性能最好的大模型——文心4.0,来计算出从今晚到明早的各项事项安排。
通过这种大小模型的组合调度方式,小度不仅顺利完成了“换脑行动”,装上了全新的AI原生操作系统DuerOS X,而且形成了效果、速度和成本的最优组合,相比全部使用文心大模型的旗舰版,让响应速度提升2倍,成本下降了99%。刚才和我对话的这个小度添添AI平板机器人,昨天已经在各大平台全面开售,有兴趣的朋友们可以即刻下单体验了。
这几个关于ModelBuilder的例子,展示的是百度高效低价生产模型的能力。因为有了最强大的基础模型文心4.0,我们可以根据需要,兼顾效果、响应速度、推理成本等各种考虑,裁剪出适合各种场景的更小尺寸模型,并且支持精调和post pretrain。这样通过降维裁剪出来的模型,比直接拿开源调出来的模型,同等尺寸下,效果明显更好,同等效果下,成本明显更低。大家以前用开源觉得开源便宜,其实在大模型场景下,开源是最贵的。所以开源模型会越来越落后。
为了方便大家快速上手,ModelBuilder预置了最全面最丰富的大模型。包括了ERNIE3.5和ERNIE4.0,这是旗舰版的大模型,它适合通用的复杂场景,能力强大;还有三个轻量级的大模型, ERNIE Speed、Lite、Tiny;另外还有两个垂直场景的模型,ERNIE Character适合角色扮演;ERNIE Functions适合对话或问答场景中的外部工具使用和业务函数调用。当然ModelBuilder也支持国内外第三方主流模型,总数量达到77个,是国内拥有大模型数量最多的开发平台。
去年5月份,百度启动了“文心杯”创业大赛,希望推动大模型生态繁荣,打造更有活力的生态系统,帮助创业者、开发者开发各种AI原生应用。第一届“文心杯”创业大赛,我们收到了近1000支创业团队报名,百度为其中的15支优胜团队,提供了近亿元的投资支持,并且在技术、团队和资源上持续提供全方位扶持。
今天我宣布,第二届“文心杯”创业大赛正式启动。这次我们将扩大项目筛选范围、设置分赛场,面向全球市场及高校学子,招募创业创新团队,只要你的创业方向是AI原生应用,都可以在大赛官网报名参赛。同时,我们也加大了对创业者的支持力度,提供更充足的投资资金、更丰富的业务资源,还首次设立了“特别大奖”,特别优秀的项目将有机会获得最高5000万人民币的现金和资源支持。
中国的创业者和开发者,196体育平台首页非常善于利用新技术来开发应用。我相信,文心大模型将成为中国AI创业者和开发者的首选,越来越多的应用会建立在文心大模型之上。我也期待,更多创业者和开发者加入我们,一起构建繁荣的AI生态。
我有一个非常不一样的判断:视觉大模型最大的应用场景是自动驾驶。百度在这个方向上是最好的,是自动驾驶的全球领导者,我们不只训练AI如何生成视频,更训练AI理解真实世界发生的事情并预测未来。
基于超过1亿公里的、中国复杂城市道路测试里程数据,百度训练出来了Apollo视觉感知大模型。它具备检测、跟踪、理解、建图四大基础能力。这让百度拥有了更智能、适应性更强、更安全的自动驾驶方案。
今年春节后,百度的萝卜快跑实现了万里长江“第一跨”, 我们把服务从长江的北岸延伸到了南岸,在武汉的部分区域,我们已经实现了7X24小时的全天候运营,还计划年内在武汉部署1000台无人驾驶车辆。
这是自动驾驶走向真正商业化的一个标志性事件,它不再仅仅是区域性的示范,而是进入到了城市级应用示范的新阶段。萝卜快跑在武汉覆盖了3000多平方公里、770万人口,是全球范围内最大规模的自动驾驶运营区域。
此时此刻,我站在这里,其实也是一个开发者、一个创业者,跟大家一样兴奋。今天的中国,有10亿互联网用户,有强大的基础大模型,有足够多的AI应用场景,有全球最完备的产业体系,国家也在大力鼓励和支持“人工智能+”行动,每一个人,每一家企业,只需要充分利用这些工具,就可以释放无限的创造力和生产力。
今天,人人都可以成为开发者。而未来,也必将是一个由开发者一起创造出来的未来!
《教育科技这一年·2022》+《培训行业这一年·2021》+《教育科技行业图谱2022-2023》,重磅发售!套装优惠价169元,闭眼入!迅速点击文末“阅读原文”购买,手慢无!