引言
01
刘松剖析生成式AI应用趋势,
锚定To B落地关键技术与挑战
刘松在演讲中以生成式AI的技术演变为切入点,简要回顾了从神经网络、AlphaGo、谷歌Transformer到GPT系列大语言模型的发展历程。他表示,当前的生成式AI技术发展正集中于交互和内容自动化生成领域,例如语言、视频和图片生成,特别是AI编程,具备改变软件行业的潜力。然而,他也指出了生成式AI的局限性:难以完全避免幻觉和推理能力不足的问题,同时在可解释性、能耗以及伦理和安全方面仍面临很大挑战。这些问题在医疗诊断和金融服务等容错率低的应用场景中显得尤为突出。
刘松指出,业界对生成式AI未来的发展普遍聚焦于“Agent”的理念。他表示,这种智能代理被期待成为用户的“代理人”,也就是充当“大脑”的作用,使其能够在复杂任务规划和推理中发挥作用。而未来想要AI技术在To B领域得到更加深度应用是离不开数据的,数据的质量、素养、治理将成为决定AI深度应用的关键因素。
他特别提到,生成式AI将变革云计算市场的形态。他指出,生成式AI的进化需要海量算力,同时它的应用又是推动云消耗和增长的关键驱动力,因此生成式AI对云厂商来说可以称得上是“Game Changer”。
在技术栈层面,刘松引用了a16z的一份报告,指出生成式AI在云计算传统三层架构(IaaS、PaaS、SaaS)中增加了“MaaS”(模型即服务)这一层。他强调,这种架构转变凸显了数据层的重要性。GPU的主导地位以及RAG(检索增强生成)技术的应用,使得垂直行业AI可以更高效地处理复杂问题。
刘松以TiDB.AI的具体例子,诠释了在垂直行业应用中RAG正成为提升AI能力的重要方式。由于大模型训练和微调成本高,RAG通过结合检索、知识图谱等手段,为模型提供更准确的专业回答,尤其在金融、医疗、制造等领域有重大潜力。RAG以检索、搜索和知识整合为核心,将结构化与非结构化数据结合,支持复杂推理任务,提升生成内容的准确性和信服度。
刘松特别提到,生成式AI推动数据库向新方向发展,尤其是在在线处理能力、向量化与多模态检索以及实时问答方面的优化,而其本身的发展也正在从关注模型本身转向数据驱动的应用创新。谈及未来,他认为随着大模型推理能力和RAG技术的双向提升,AI将在推理准确性、知识广度和问题解决能力上实现更大突破,为垂直行业创造更多价值。
02
易岚拆解o1/o3技术原理,
诠释生成式AI推理进阶的奥秘
易岚在分享中介绍了生成式AI的技术原理。他首先谈到了OpenAI刚发布不久的o3模型对比o1在推理能力上的提升。o1在数学竞赛、编程竞赛等高难度任务中取得了显著进步,例如在数学高考试卷测试中可达到141分的高分。o3则在更复杂的问题上实现了大幅跳跃,能够在物理、生物和化学问题的基准(GPQA)上达到甚至超过人类博士级别的认知和推理水平,给出准确性极高的结果。
易岚表示,这种强大的推理能力所依托的底层技术之一便是“思维链”(Chain of Thought, CoT),即通过显式的思维过程引导模型逐步推理,从而提高准确性。例如,将一个复杂数学问题分解为多个简单步骤,有助于模型逐步推理并得出正确答案。
当前的挑战在于如何将思维链内化到模型中,使其不需要复杂的提示工程就能自主进行推理。这涉及到对模型进行深度优化,例如将AlphaGo的强化学习(RL)方法引入生成式AI领域。易岚提到,AlphaGo通过自博弈(Self-Play)、强化学习和蒙特卡洛树搜索(MCTS)实现了卓越的决策能力,这些技术可以为大语言模型的推理能力增强提供参考。
易岚还提到,传统Scaling Law依赖于计算能力和数据的增长,但随着数据和硬件性能的限制,推理能力(reasoning)的引入成为突破瓶颈的关键。核心技术包括强化学习和奖励模型(Reward Model)。传统方法注重最终结果,而新的奖励模型关注推理的每一步,以分步评分的方式优化推理过程,从而提高模型的学习效率。同时,自博弈技术借鉴了AlphaGo的训练方法,模型通过与自身的不断对弈生成高质量的数据,克服了数据稀缺的问题。这种方法支持模型在大规模推理空间中找到最优解,提升决策能力。
除此之外,技术优化还包括策略初始化(Policy Initialization),即让大模型具备通过持续微调而学习到复杂推理能力(reasoning)的基础推理行为,以及搜索算法(Search),用于在多维推理空间中选择最优路径。此外,新一代强化学习方法如GRPO的提出,可以相对于传统PPO方法减少硬件消耗并加速模型收敛。易岚总结道,这些技术的结合,推动了AI模型在推理复杂性、数据利用效率和能源节约上的全面提升,为生成式AI迈向更高阶的智能奠定了坚实基础。
03
从技术驱动到未来展望,
嘉宾畅谈生成式AI的社会影响
在交流讨论环节中,三位嘉宾对近几年AI技术热潮的成因、应用现状和发展趋势进行了探讨。张乐奕提到,尽管人工智能(AI)技术早在上世纪50年代就已出现,但真正引发广泛热潮的是近两年随着OpenAI推出了ChatGPT而迅速崛起的生成式AI(Gen AI)。那么为什么这一技术的爆发性增长是在2022年之后才显现出来,究竟是硬件算力的提升,还是AI知识体系的突破?
刘松首先回应,认为AI的发展经历了几个阶段,从最初的图灵测试到神经网络逐渐被认可,再到2013年ImageNet的突破性成果,深度学习得以快速发展。他强调,生成式AI的成功,特别是大语言模型(如ChatGPT),得益于互联网及移动互联网的数据积累和算力沉淀,尤其是新一代硬件的支持。刘松认为,如今生成式AI的发展形成了现象级的热潮,主要是因为其在大语言模型方面取得了进展,使得它的交互形态与人类更接近。从哲学角度来看,维特根斯坦认为语言的边界就是思维的边界。因此,能够用自然语言交互以及具备通用知识体系是生成式AI广受欢迎的很大一个原因。
对此,张乐奕深感认同,语言是人类智慧的承载工具,生成式AI之所以被认为是“看上去特别像回事”的AI,正因为它在语言层面的出色表现。张乐奕总结道:“从文字的出现到知识的传承,语言是人类智慧的核心。而生成式AI正是通过语言,让人觉得它与人类越来越接近。”易岚补充道,生成式AI的革命性在于它通过语言这一媒介,实现了智能的涌现。语言不仅是沟通的工具,更是承载思想和推理的载体。生成式AI的革新标志着AI不仅仅停留在图像识别或数据处理的层面,而是进入了更复杂的认知和交流领域。
在谈到生成式AI的广泛应用时,刘松提到,其背后的技术突破不仅仅来自理论的进展,硬件算力的提升也扮演了至关重要的角色。生成式AI的快速发展便得益于GPU的强大算力,刘松还开玩笑地说GPU计算能力的提升得益于游戏玩家对显卡需求的推动。正是这些玩家为显卡技术的进步提供了巨大推动力,间接为AI技术的爆发提供了算力支持。易岚补充道,GPU计算能力的提升使得本来复杂的计算任务变得可行,尤其是像GPT模型这样的巨型神经网络。算力的提升使得AI在训练过程中能够处理更大规模的数据集,并产生更复杂的智能表现。
随着生成式AI技术的成熟,张乐奕与刘松还讨论了它与数据库技术的结合。刘松指出,虽然数据库圈早已开始讨论AI4DB和DB4AI等话题,但生成式AI的出现使得这一讨论进入了新的阶段。他认为,未来AI将不仅仅局限于数据库本身的自动化操作,更多的机会是生成式AI与新一代数据库技术(AI+Data)的结合,将为各种智能应用提供支持。
在随后的对话中,刘松提出了一个引人深思的观点,即随着AI技术的不断发展,AI不再仅仅是一个工具,而是逐渐向“智能主体”的方向迈进。他以“智能助手”为例,表示未来的AI可能不仅仅是回答问题、提供信息,而是能够进行自主决策、推理并完成任务的智能体。他认为,随着AI推理能力的提升,它将能够承担更多复杂的任务,甚至替代一些助理职位,如总经理助理等。张乐奕对此深有感触,他表示,人类的需求是无止境的。随着生成式AI的进步,人们不仅希望AI能提供解答,更希望它能够主动去完成任务。“从工具到主体的转变,是AI发展中的一个关键进步。”
生成式AI在带来巨大机遇的同时,也引发了关于技术垄断和社会影响的讨论。张乐奕提出,是否只有拥有巨大算力的科技巨头才能主导AI的未来?易岚认为,虽然目前大公司占据了主导地位,但中国市场正在探索更加独立且可持续的AI发展路径,包括优化资源配置和降低硬件成本的策略,这为更多企业提供了参与的机会。
刘松则指出,尽管生成式AI目前更多集中在娱乐和“好玩”的应用领域,但未来其在解决实际问题中的潜力将是巨大的。他提醒,生成式AI的广泛应用可能会给社会带来深远的变化,尤其是在劳动力市场和职业阶层的结构方面。生成式AI的迅速发展正在深刻影响年轻人择业与学习路径。随着AI技术在编程、创作等领域的广泛应用,许多传统工作岗位正在被自动化,迫使年轻人重新审视职业规划。未来,除了具备专业技能,跨学科的能力和创新思维将成为职场竞争的关键。
04
结语
本次直播三位嘉宾为观众们呈现了关于生成式AI的技术背景、发展趋势以及社会影响的精彩洞见。无论是硬件支持下的算力提升,还是AI与数据技术的深度融合,生成式AI无疑为各行各业带来了前所未有的机遇与挑战。随着技术的不断进步,AI正逐渐成为人类智慧的延伸,与人类的关系将更加紧密,必将深刻革新我们的生产生活和社会发展。


数据驱动,成就未来,云和恩墨,不负所托!
云和恩墨创立于2011年,是业界领先的“智能的数据技术提供商”。公司以“数据驱动,成就未来”为使命,致力于将创新的数据技术产品和解决方案带给全球的企业和组织,帮助客户构建安全、高效、敏捷且经济的数据环境,持续增强客户在数据洞察和决策上的竞争优势,实现数据驱动的业务创新和升级发展。
自成立以来,云和恩墨专注于数据技术领域,根据不断变化的市场需求,创新研发了系列软件产品,涵盖数据库、数据库存储、数据库管理和数据智能等领域。这些产品已经在集团型、大中型、高成长型客户以及行业云场景中得到广泛应用,证明了我们的技术和商业竞争力,展现了公司在数据技术端到端解决方案方面的优势。