2024 11月全球机器学习大会-北京站
课时介绍
王炳宁
百川智能预训练负责人
演讲主题
Transformer效率优化
最近两年,由ChatGPT引领的大语言模型技术取得了非常大的进展,仅仅依靠下一个单词的预测这种简单的无监督训练方法,在很多任务上大语言模型都达到甚至超过了人类的水平。当前大语言模型效果提升的最重要的原理是Scaling law,即不断扩展模型参数量,不断扩大训练数据量。然而,我们依然能够通过引入一些优化的技术和手段在相同模型尺寸、相同数据量的情况下不断提升模型的效果。现在最新很多小尺寸比如2B 3B的模型已经能超过之前很多百亿甚至几百亿参数的模型效果了。
课程介绍
自1936年阿兰· 图灵提出「图灵机」以及机器具备「思维」的可能性以来,以机器学习为代表的人工智能经过飞速发展,深刻地改变着我们的世界。Boolan 秉承“全球专家,卓越智慧”的宗旨,特邀近50位技术领袖和行业应用专家,与1000+来自电商、金融、汽车、智能制造、通信、工业互联网、医疗、教育等众多行业的精英参会听众,共同探讨人工智能领域的前沿发展和行业最佳实践。
推荐课程
信息系统项目管理师自考笔记
李明 · 513人在学
python从0到1:期货量化交易系统(CTP实战,高频及合成K线数据
王先生 · 20608人在学
手把手搭建Java超市管理系统【附源码】(毕设)
汤小洋 · 4050人在学
Java毕设springboot外卖点餐系统 毕业设计毕设源码 使用教
黄菊华 · 732人在学
基于SSM酒店管理系统(毕设)
小尼老师 · 786人在学
java项目实战之购物商城(java毕业设计)
Long · 5073人在学
手把手搭建Java求职招聘系统【附源码】(毕设)
汤小洋 · 1459人在学
Python Django 深度学习 小程序
钟翔 · 2235人在学
城管局门前三包管理系统+微信小程序(vue+springboot)
赖国荣 · 497人在学
Vue+Uni-app(uniapp)入门与实战+赠送仿美团点餐小程序
李杰 · 3843人在学