开栏语:《AIGC行业周报》梳理AIGC行业一周内发生的重要动态,产品发布和业内大咖的最新观点。
近期,OpenAI内部因对AI安全治理的重视程度不足以及资源分配问题出现严重分歧,导致超级对齐团队负责人Jan Leike和前首席科学家Ilya Sutskever等关键成员相继离职。Leike公开表示,团队在算力支持和AI安全问题上遭遇挫折,而离职成员还面临签署禁止负面评论OpenAI的协议,否则将失去公司股份。奥特曼(Sam Altman)作为OpenAI的领导者,其言行不一以及对商业化的追求被认为与公司使命背道而驰,引发了一系列的离职潮和外界对OpenAI未来方向的关注。
5月22日,在全球范围内对(AI)安全问题日益关注的背景下,包括OpenAI、谷歌、微软和智谱AI在内的16家公司联合签署了前沿人工智能安全承诺,旨在确保AI的负责任治理、透明度以及风险评估和缓解机制的建立。与此同时,欧盟理事会正式批准了《人工智能法案》,标志着全球首部AI全面监管法规即将生效,采用基于风险的方法对AI模型进行监管,并为违反规定的公司设立了严格的罚款制度。这些举措体现了国际社会在AI安全领域采取具体行动的决心和进展。
近期,中国AI大模型市场出现了激烈的价格战,腾讯美高梅官网正网、阿里、百度、科大讯飞等国内大模型厂商纷纷宣布降价,以响应市场和吸引开发者。这场价格战始于幻方量化的DeepSeek V2大幅降价,随后其他厂商如智谱、字节跳动的豆包、阿里云、、和腾讯云也相继加入,推出了各自的降价策略。降价行为可能会吸引开发者试用AI应用,对市场有积极影响,但同时也给行业创业公司带来压力,预示着行业洗牌的加速。降价背后的根本原因在于推理成本的快速降低,而随着技术的进步,这一趋势预计将持续。行业专家如李开复认为,尽管降价是大势所趋,但当前的价格战可能是一种不可持续的策略。随着大模型价格的下降,AI技术的应用成本降低,有助于推动AI应用的广泛发展,但整个行业的商业化和生态构建仍然有很长的路要走。
2024年5月22日,在Build全球开发者大会上,大模型和生成式AI成为焦点。微软推出了Azure AI Studio,一个旨在简化开发流程并支持1600多种大模型的全新平台。此外,微软还发布了Phi-3系列模型,包括具有视觉识别功能的Phi-3-vision和低功耗的Phi Silica模型。Copilot Studio使开发者能够轻松创建AI Agent应用,而Windows Copilot Runtime提供了丰富的AI框架和API以促进AI应用开发。微软还发布了新的Azure虚拟机和Team Copilot,旨在提升工作效率并简化企业运营。最后,微软在Startups Founders Hub中推出了Build with AI工具,为用户提供AI应用开发模板,进一步推动AI技术的普及和应用。
5月22日,百川智能推出了最新一代基座大模型Baichuan 4,并同时发布了首款AI助手「百小应」。Baichuan 4在多项能力上相比前代有显著提升,包括通用能力、数学和代码能力,并且在SuperCLUE评测中排名国内第一。新模型还引入了多模态能力,在多模态评测基准上表现优异。百小应结合了Baichuan 4的通用能力和搜索技术,具备多轮搜索和定向搜索功能,能够提供精准的问答服务,目前已在Web端及iOS和安卓应用商店上线。百川智能还宣布开放包括Baichuan 4在内的四款API,供开发者和企业用户接入体验。
最新研究指出,多模态模型如CLIP和Stable Diffusion在zero-shot学习(无需见过样本即可识别新类别)方面的表现并非真正的泛化能力,而是依赖于其庞大的预训练数据集。实验数据显示,模型性能的提升与训练数据量呈对数关系,意味着未来性能提升将越来越缓慢,最终可能因缺乏指数级增长的数据而遇到瓶颈。这项研究挑战了人们对大模型泛化能力的乐观预期,并引发了对未来AI发展路径的讨论。
近日,图灵奖得主Geoffrey Hinton在一次深入访谈中分享了他对当前大模型技术路线的看法,强调了多模态学习的重要性,并探讨了数字计算与共享知识、智能系统的意识与情感等话题。Hinton认为大型语言模型通过寻找不同领域的共同结构进行编码行业动态,形成深层次的理解,是创造力的源泉。他提到,通过预测下一个符号,模型实际上执行了一定程度的推理,并非不具备推理能力。Hinton还回顾了自己的职业生涯,从生理学到哲学再到人工智能的转变,并分享了他与Ilya Sutskever等合作者的工作历程。他强调了规模的重要性,认为增大模型规模和数据量是解决问题的关键。此外,Hinton对大脑如何获取梯度、是否使用类似反向传播的机制等问题表示了浓厚的兴趣,并认为这是未来研究的重要方向。
5月15日,火山引擎一口气发布9款大模型,以超低定价成为关注焦点。近日,火山引擎总裁谭待在接受「甲子光年」采访时,阐述了字节跳动在大模型时代的战略主张——追求最强模型、最低成本和最易落地,以客户为中心。他认为B端市场不同于C端,需要理性决策和真正可用的产品,而非仅追求先发优势。谭待强调,大模型应用的落地需要模型能力、应用丰富度和成本优化,火山引擎的技术进步和成本控制能力是其竞争优势。他还提到,大模型时代将由大公司主导,但创业公司也有打磨优秀模型的机会。火山引擎的目标是通过AI技术帮助企业降本增效、加速创新,并在未来几年内成为全球领先的云和智能服务商。
4、李飞飞与John Etchemendy联合撰文驳斥AI具有感觉能力的观点
近日,知名AI学者李飞飞和斯坦福大学HAI联合主任John Etchemendy教授联合撰写文章,深入探讨并反驳了当前大型语言模型(LLM)具有感觉能力(sentient)的观点。文章中,李飞飞通过多个例子说明,尽管LLM在某些任务上表现出超人类智能,但它们并不具备主观经验或感觉能力,如饥饿或疼痛等生理状态。她强调,LLM只是基于概率性完成任务的数学模型,缺乏人类所具有的物理身体和生理反应,因此无法拥有真正的感觉能力。两位作者认为,要实现具有感觉能力的人工智能,研究者需要更深入地理解生物系统中感觉是如何产生的,而不是简单地增加模型的规模。