经典大模型公开课第二季
- 【01】绪论|大模型技术与交叉应用
- 【02】神经网络与大模型基础(上)
- 【03】神经网络与大模型基础(下)
- 【04】大模型学习方法
- 【05】大模型前沿架构(上)
- 【06】大模型前沿架构(下)
- 【07】Hugging Face 生态
- 【08】大模型实战指导
- 【09】人类反馈强化学习
- 【10】多模态智能
- 【11】自主智能体(上)
- 【12】自主智能体(下)
- 【13】人工智能与安全伦理对齐
- 【14】人工智能与交叉学科(上)
- 【15】人工智能与交叉学科(下)
- 【16】大模型企业家访谈
时间 | 议程 | 回放链接 |
---|---|---|
2024.10.06 | - SGLang Q4 planning - Deepseek MLA - 关于批处理和专家并行性的讨论 |
https://hcqnc.xetlk.com/s/3oOTt |
2024.09.22 | - SGLang Q4 planning - Double Sparsity for Fast Attention |
https://hcqnc.xetlk.com/s/xkK7Z |
2024.10.22 | - CPU Overhead Hiding - Cache-aware DP routing (design review + quick demo) - Brief updates on double sparsity |
https://hcqnc.xetlk.com/s/43yW0Q |
2024.11.03 | - Reward Model Integration and External Collaboration - FP8 scaling and path to MXFP: Kv-cache-type fp8 and beyond |
https://hcqnc.xetlk.com/s/1sZAJQ |
2024.11.17 | - Rust-based Cache-Aware Data Parallelism Router - Speculative Decoding + X-Grammar - Timing side channels of KV Cache |
https://hcqnc.xetlk.com/s/22zjjx |
2024.11.31 | - SGLang v0.4 release:Data Parallelism Router/Data parallelism attention/Online weight update API for RLHF - Speculative decoding support - Plans: Multi-layer cache/CacheBlend/Next Step For OpenRLHF/P-D disaggregate/code-walk-through |
https://hcqnc.xetlk.com/s/Kq7vX |
直播时间 | 主讲人 | 主题 | 直播/回放观看链接 |
---|---|---|---|
2025.01.14 | 香港科技大学(广州)博士生许添硕 | Motion Dreamer:面向自动驾驶与物理世界对齐的视频生成模型 | https://hcqnc.xetlk.com/sl/4y3EE0 |
2025.01.04 | 香港科技大学计算机博士生马跃 | Follow Family:可控视频生成方法探索与应用 | https://hcqnc.xetlk.com/sl/3rBIPz |
2024.12.28 | 香港科技大学广州博士生周子凯 | Tuning-Free Enhence:通过噪声初始化和采样轨迹优化增强预训练扩散模型 | https://hcqnc.xetlk.com/sl/IWRoq |
2024.12.24 | 中国科学院自动化研究所博士生、新加坡国立大学访问博士生李志凯 | K-Sort Arena:视觉生成模型的高效人类偏好竞技场 | https://hcqnc.xetlk.com/sl/3XRo1Q |
2024.12.21 | CMU 博士生董易昕 | XGrammar:高效实现 LLM灵活且可移植的结构化生成 | https://hcqnc.xetlk.com/sl/2lfUzu |
2024.12.16 | 商汤科技研究院模型压缩研究员谷石桥、雍洋 | LLMC:大语言模型压缩工具的开发实践 | https://hcqnc.xetlk.com/sl/4n2ZdO |
2024.12.14 | 深度求索(DeepSeek)研究员、UT Austin博士刘星超 | Rectified Flow:矫正流生成式模型的概念及应用实践 | https://hcqnc.xetlk.com/sl/1iuade |
2024.11.30 | 微软研究院 AI Frontiers 实验室高级研究员鲁亚东 | OminiParser:基于纯视觉的 GUI Agent | https://hcqnc.xetlk.com/sl/2FcEML |
2024.11.23 | NVIDIA VILA 团队实习生方云浩 | VILA^2 : 视觉语言模型能力的自我提升 | https://hcqnc.xetlk.com/sl/3WqBpe |
2024.11.05 | 中科院自动化所和香港城市大学联合培养博士生林浩坤 | DuQuant: 基于正交变换实现大型语言模型的 SOTA级 4 bit 量化 | https://hcqnc.xetlk.com/sl/2pnEgg |
2024.10.17 | 香港科技大学在读博士高深远 | GenAD & Vista:构建通用可泛化的自动驾驶世界模型 | https://hcqnc.xetlk.com/sl/1Cb2XV |
2024.10.14 | 南京大学智能科学与技术学院研究员、助理教授傅朝友 | VITA:开源交互式多模态基础大模型 | https://hcqnc.xetlk.com/sl/MRlyd |
2024.10.11 | 商汤科技算法实习生、香港科技大学准博士生黄雨石 | LLMC:大语言模型的量化基准 | https://hcqnc.xetlk.com/sl/4xORVG |
2024.09.26 | Eigent AI Founding Engineer、CAMEL AI开源多智能体框架核心贡献者范文栋 | 使用 CAMEL Agents 构建 GraphRAG 及应用实践 | https://hcqnc.xetlk.com/sl/2LsSi2 |
2024.09.23 | 智谱AI算法工程师,CogVideoX作者之一 张昱轩 | CogVideoX 视频生成开源模型上手实践 | https://hcqnc.xetlk.com/sl/1dh7nj |
2024.09.10 | 阿里巴巴通义实验室高级算法工程师、华东师范大学博士叶加博 | mPLUG-Owl3:探索长序列模型架构的通用多模态大模型 | https://hcqnc.xetlk.com/sl/1Rzc3o |
2024.09.03 | Databricks Mosaic Research研究科学家,斯坦福大学博士盛颖 | SGLang v0.2:面向 LLM 和 VLM 的快速、高效通用服务引擎 | https://hcqnc.xetlk.com/sl/3cwRoQ |
2024.08.26 | UC Berkeley 博士生曹诗怡 | S-LoRA:实现多 LoRA 大模型的高效并行化推理 | https://hcqnc.xetlk.com/sl/3QsnQA |
2024.08.14 | 麻省理工学院准博士生唐嘉铭 | AWQ:激活值感知的LLM低位权重量化 | https://hcqnc.xetlk.com/sl/ivCj5 |
2024.08.06 | 香港中文大学博士后王文海 | InternVL 2.0:通过渐进式策略扩展开源多模态大模型的性能边界 | https://hcqnc.xetlk.com/sl/221tNT |
2024.07.30 | 香港科技大学(广州)人工智能方向博士研究生杨帅 | SEED-Story:生成长篇图文故事的多模态大型语言模型 | https://hcqnc.xetlk.com/sl/3xzywr |
2024.07.23 | 华中科技大学博士生程天恒 | YOLO-World:基于视觉语言模型的实时开放词汇物体检测 | https://hcqnc.xetlk.com/sl/12dD2S |
2024.07.15 | 清华大学自然语言处理实验室博士生余天予 | MiniCPM-V:端侧可用的 GPT-4V 级多模态大模型 | https://hcqnc.xetlk.com/sl/30sK4y |
2024.07.11 | 阿里通义实验室高级算法专家徐海洋 | Mobile-Agent:基于多模态Agent架构的手机智能体 | https://hcqnc.xetlk.com/sl/34N5vR |
2024.07.08 | 北京航空航天大学博士生郑耀威 | LLaMA Factory:从预训练到RLHF,大模型高效训练框架 | https://hcqnc.xetlk.com/sl/4xFmvV |
2024.06.27 | 浙江大学硕士研究生董玉博 | VillagerAgent:减少幻觉、提高任务分解效率的多智能协作体框架 | https://hcqnc.xetlk.com/sl/4z6PWd |
2024.06.17 | 香港大学MMLAB在读博士吴成岳 | LLaMA Pro:扩展Transformer块优化的大型语言模型继续预训练 | https://hcqnc.xetlk.com/sl/XKqHx |
2024.06.13 | 北京大学在读博士孟繁续 | PiSSA:收敛快、误差小的大模型参数高效微调方法 | https://hcqnc.xetlk.com/sl/1HYPXz |
2024.06.06 | 上海人工智能实验室青年研究员、OpenDriveLab具身智能方向负责人曾嘉博士 | 具身多模态大模型的视觉表征预训练研究 | https://hcqnc.xetlk.com/sl/2k4HMq |
2024.05.29 | 南洋理工大学 MMLab 实验室在读博士姜瑜铭 | VideoBooth:文本和图像提示共同驱动的视频生成 | https://hcqnc.xetlk.com/sl/1ogzQ4 |
2024.05.24 | 新加坡国立大学Research Fellow倪瑾杰 | Alchemy:混合评测数据集来拟合大语言模型的人类评估 | https://hcqnc.xetlk.com/sl/gFc4 |
2024.05.21 | 华南理工大学集合感知与智能实验室博士梁智灏 | 实时渲染 3DGS 中的反走样及逆渲染应用 | https://hcqnc.xetlk.com/sl/3qpJ8a |
2024.05.10 | 3D-VLA第一作者甄昊宇 | 3D-VLA:构建生成式三维具身世界模型 | https://hcqnc.xetlk.com/sl/3axJCI |
2024.04.24 | 香港中文大学在读博士李彦玮 | Mini-Gemini:挖掘多模态视觉语言大模型的潜力 | https://hcqnc.xetlk.com/sl/4aYFHd |
2024.04.19 | 加州大学洛杉矶分校在读博士洪逸宁 | 从 3D LLM 到 MultiPLY ,3D 具身基础模型的构建 | https://hcqnc.xetlk.com/sl/28OAx8 |
2024.04.15 | 清华大学自然语言处理实验室(THUNLP)博士后钱忱 | ChatDev——大语言模型驱动的多智能体协作与演化 | https://hcqnc.xetlk.com/sl/dsPB6 |
2024.04.10 | 慕尼黑工业大学视觉计算实验室博士陈振宇 | SceneTex:高质量三维室内场景纹理图生成 | https://hcqnc.xetlk.com/sl/FD3Yf |
2024.03.02 | DeepFaceLab(累计60,000 +⭐️)作者小黑兔 InstantID(huggingface space周榜第一)作者王浩帆 剑桥大学计算机系在读博士Andi Zhang VBench 第一作者、南洋理工大学MMLab在读博士黄子琪 |
Sora迷思,AIGC的微积分时刻? | https://hcqnc.xetlk.com/sl/3aRykI |