AI早报：谷歌发布AI视频生成模型Lumiere；Pika联手北大斯坦福开源文生图框架

谷歌发布AI视频生成模型Lumiere

谷歌1月23日在预印本平台arXiv发布文本到视频扩散模型Lumiere。Lumiere可以基于用户的自然语言提示、图像+提示生成长达5秒的视频，或者根据用户上传的单个参考图像，生成基于提示词的同风格视频，还允许用户通过自然语言指令生成一致的视频风格。用户可以指定特定区域使Lumiere对图像内容进行动画处理。

论文地址：https://arxiv.org/abs/2401.12945

Pika联手北大斯坦福开源文生图框架

Pika在社交平台X上宣布，Pika实验室与北京大学和斯坦福大学推出开源最新文本到图像生成、编辑框架RPG-DiffusionMaster，RPG在上下文理解、组合语义对齐、多轮对话理解等方面有显著改进。

地址：https://github.com/YangLing0818/RPG-DiffusionMaster

谷歌浏览器新增3项生成式AI功能

谷歌1月24日宣布为谷歌浏览器新增3项生成式AI功能，包括自动建议用户打开的选项卡并创建选项卡组、使用AI创建个性化浏览器主题、帮助用户起草餐厅评论等内容。

OpenAI 19人出走创业，融资总额近80亿美元

据Business Inside 1月22日报道，从OpenAI出走的19位科学家，已经纷纷创办初创公司，融资总金额高达80亿美元。包括OpenAI创始人之一马特·克里西洛G（Matt KrisiloG）、前运营主管杰夫·阿诺德（Jeff Arnold）等。Andreessen Horowitz、红杉资本、Index Ventures、Khosla Ventures和Y Combinator等顶级风险投资公司，OpenAI CEO萨姆·阿尔特曼（Sam Altman）、格雷格·布罗克曼（Greg Brockman）本人都支持了“十九子”的初创公司。

Meta纽约大学联手发布机器人框架OK-Robot

Meta和纽约大学联合发布新型开放知识型机器人框架OK-Robot，该框架不需要预训练，就可以在真实家庭环境中运行。经过测试，在10个真实的家庭环境中运行，OK-Robot拾取和放置任务的成功率达到58.5%，如果是干净整洁的环境成功率可以提升到82%。项目地址：https://ok-robot.github.io

论文：https://arxiv.org/abs/2401.12202

Artisse AI融资670万美元

AI摄影应用Artisse宣布成功融资670万美元，该公司专注于提升其AI生成照片的逼真度。与其他市场上的竞争对手一样，用户通过上传自己的照片，训练Artisse的AI模型，然后使用文本或图像提示生成各种不同场景、姿势和风格的新照片。

蚂蚁集团成立 AI 创新研发与应用部门 NextEvo

据 36 氪今日报道，蚂蚁集团已在内部成立了 AI 创新研发与应用部门，名为“NextEvo”，由蚂蚁集团副总裁徐鹏担任负责人。报道称，徐鹏曾在谷歌工作 11 年，负责和领导了谷歌翻译的核心技术研发，并参与了谷歌显示广告系统的算法研发。NextEvo 是蚂蚁内部的 AI“精锐部门”，据称其承担了蚂蚁 AI 的所有核心技术研发，包括蚂蚁百灵大模型的所有研发工作。

AIBetas整理的AI排行榜第一版已经正式上线，了解最新的AI产品及排行榜！

排行榜：ai.aibetas.com.cn

文章版权归作者所有，未经允许请勿转载。

THE END